Публикации по тематике data-science

Публикации по теме 'data-science'

Я построил модель машинного обучения, которая прогнозирует результаты лечения психиатрическими препаратами.

Пару недель назад я окончил интенсивную дипломную программу по Data Science. По окончании программы каждый студент должен был завершить проект Capstone, чтобы объединить наши недавно приобретенные навыки и методы в области науки о данных. Вот мой: Прогноз и анализ эффективности психиатрических препаратов Что я сделал: Собирал, очищал и анализировал данные психиатрических обследований. Установленные прогностические факторы безуспешности психиатрических препаратов Создал модель..

Работа с моделью Segment Anything, часть 1

Альтернатива WSSS? Эмпирическое исследование модели Segment Anything Model (SAM) в задачах семантической сегментации со слабым наблюдением (arXiv) Автор: Вэйсюань Сунь , Чжэюань Лю , Яньхао Чжан , Иран Чжун , Ник Барнс . Аннотация: Модель Segment Anything Model (SAM) продемонстрировала исключительную производительность и универсальность, что делает ее многообещающим инструментом для различных связанных задач. В этом отчете мы исследуем применение SAM в семантической сегментации..

Доступность данных и синтетические данные

Данные; базовая потребность в обучении моделям машинного обучения и глубокого обучения. Здесь мы обсудим главную проблему науки о данных, связанную с данными, и способы ее решения: Сколько данных требуется для обучения? Согласованы ли доступные данные? Потребность в данных зависит от проблемы, тогда как требование к размеру данных зависит от типа алгоритма (машинное обучение или алгоритм глубокого обучения). Обычно методы машинного обучения требуют меньше данных по сравнению с..

Вопросы для пробного интервью по науке о данных-2

Каковы условия использования наивного байесовского алгоритма? Каковы основные предположения для линейной регрессии? Как линейная регрессия справляется с переоснащением? Как уменьшить переобучение в ваших моделях машинного обучения? Что такое масштабирование признаков. Каковы его виды? В каких алгоритмах машинного обучения мы используем масштабирование признаков Чувствительна ли линейная регрессия к выбросам? Почему мы используем скорректированный R2 для измерения точности модели..

Понимание парсинга данных с использованием исследовательских работ

Анализ данных научной публикации факультета Булаканского государственного университета на основе Google Scholar с использованием метода парсинга веб-данных ( arXiv ) Автор: Джейсон М. Викториано , Хайме П. Пулумбарит , Луисито Лолонг Лакатан , Ричард Альберт С. Саливио , Рика Луиза А. Баравид Аннотация: Целью статьи является анализ и мониторинг продуктивности научных публикаций преподавателей Булаканского государственного университета. В этом документе собраны все..

Прогноз цен на дом в Макассаре (часть 1)

Согласно отчету speedtest.net за третий квартал 2021 года, Макассар был назван городом с самой высокой скоростью интернета в Индонезии. Эта информация, безусловно, очень интересна, особенно когда в 2020 году произошла пандемия Covid 19 (это происходит и сегодня), наша потребность в Интернете стала намного выше. После пандемии многие мероприятия проводятся в Интернете, например, для учебы, работы, вебинаров и многих других мероприятий. Это делает скорость интернета решающим фактором для..

ТРЮК Python: суммируйте список словарей, используя только одну строку кода

Простой, красивый и понятный фрагмент кода для объединения нескольких словарей Python с одинаковыми ключами. Ситуации возникают на рабочем месте, например, при обобщении нескольких словарей. Например, предположим, что мы передаем результаты выборов в виде файла JSON. { "city1":{ "candidate1": 5, "candidate2": 7, } . . . . } задача состояла в том, чтобы подсчитать общее количество голосов, отданных за каждого..