Публикации по теме 'data-science'
Я построил модель машинного обучения, которая прогнозирует результаты лечения психиатрическими препаратами.
Пару недель назад я окончил интенсивную дипломную программу по Data Science. По окончании программы каждый студент должен был завершить проект Capstone, чтобы объединить наши недавно приобретенные навыки и методы в области науки о данных. Вот мой:
Прогноз и анализ эффективности психиатрических препаратов
Что я сделал:
Собирал, очищал и анализировал данные психиатрических обследований. Установленные прогностические факторы безуспешности психиатрических препаратов Создал модель..
Работа с моделью Segment Anything, часть 1
Альтернатива WSSS? Эмпирическое исследование модели Segment Anything Model (SAM) в задачах семантической сегментации со слабым наблюдением (arXiv)
Автор: Вэйсюань Сунь , Чжэюань Лю , Яньхао Чжан , Иран Чжун , Ник Барнс .
Аннотация: Модель Segment Anything Model (SAM) продемонстрировала исключительную производительность и универсальность, что делает ее многообещающим инструментом для различных связанных задач. В этом отчете мы исследуем применение SAM в семантической сегментации..
Доступность данных и синтетические данные
Данные; базовая потребность в обучении моделям машинного обучения и глубокого обучения.
Здесь мы обсудим главную проблему науки о данных, связанную с данными, и способы ее решения:
Сколько данных требуется для обучения? Согласованы ли доступные данные?
Потребность в данных зависит от проблемы, тогда как требование к размеру данных зависит от типа алгоритма (машинное обучение или алгоритм глубокого обучения). Обычно методы машинного обучения требуют меньше данных по сравнению с..
Вопросы для пробного интервью по науке о данных-2
Каковы условия использования наивного байесовского алгоритма? Каковы основные предположения для линейной регрессии? Как линейная регрессия справляется с переоснащением? Как уменьшить переобучение в ваших моделях машинного обучения? Что такое масштабирование признаков. Каковы его виды? В каких алгоритмах машинного обучения мы используем масштабирование признаков Чувствительна ли линейная регрессия к выбросам? Почему мы используем скорректированный R2 для измерения точности модели..
Понимание парсинга данных с использованием исследовательских работ
Анализ данных научной публикации факультета Булаканского государственного университета на основе Google Scholar с использованием метода парсинга веб-данных ( arXiv )
Автор: Джейсон М. Викториано , Хайме П. Пулумбарит , Луисито Лолонг Лакатан , Ричард Альберт С. Саливио , Рика Луиза А. Баравид
Аннотация: Целью статьи является анализ и мониторинг продуктивности научных публикаций преподавателей Булаканского государственного университета. В этом документе собраны все..
Прогноз цен на дом в Макассаре (часть 1)
Согласно отчету speedtest.net за третий квартал 2021 года, Макассар был назван городом с самой высокой скоростью интернета в Индонезии. Эта информация, безусловно, очень интересна, особенно когда в 2020 году произошла пандемия Covid 19 (это происходит и сегодня), наша потребность в Интернете стала намного выше. После пандемии многие мероприятия проводятся в Интернете, например, для учебы, работы, вебинаров и многих других мероприятий. Это делает скорость интернета решающим фактором для..
ТРЮК Python: суммируйте список словарей, используя только одну строку кода
Простой, красивый и понятный фрагмент кода для объединения нескольких словарей Python с одинаковыми ключами.
Ситуации возникают на рабочем месте, например, при обобщении нескольких словарей. Например, предположим, что мы передаем результаты выборов в виде файла JSON.
{
"city1":{
"candidate1": 5,
"candidate2": 7,
}
.
.
.
.
}
задача состояла в том, чтобы подсчитать общее количество голосов, отданных за каждого..