Публикации по тематике data-science

Публикации по теме 'data-science'

Последние обновления о моделях гауссовой смеси 2023, часть 4

Изучение моделей гауссовской смеси с полуконтролем для обнаружения обобщенных категорий (arXiv) Автор: Бинчен Чжао , Синь Вэнь , Кай Хань . Аннотация: В этой статье мы решаем проблему обнаружения обобщенных категорий (НОД), т. е. учитывая набор изображений, часть из которых помечена, а остальные нет, задача состоит в том, чтобы автоматически кластеризовать изображения в немаркированных данных. , используя информацию из помеченных данных, в то время как немаркированные данные..

Работа моделей Vision-Language, часть 1

GIVL: Улучшение географической инклюзивности моделей визуального языка с помощью методов предварительного обучения (arXiv) Автор: Да Инь , Фэн Гао , Говинд Таттай , Майкл Джонстон , Кай-Вэй Чанг Аннотация: ключевой целью развития ИИ является разработка технологий, которые удовлетворяют потребности не только одной группы, но и всех сообществ, независимо от их географического региона. На самом деле значительная часть знаний используется на местном уровне людьми из определенных..

Визуализация дерева решений и как это работает?

Использование DTreeViz для создания нескольких визуализаций для понимания дерева решений Дерево решений — это модель машинного обучения, которую можно использовать как для классификации, так и для регрессии. Это древовидная структура, содержащая узел решения и конечный узел. По сути, это графическое представление для анализа всех возможных результатов/решений данной проблемы. Дерево решений работает…

Варианты использования генерации ключевых фраз, часть 1 (машинное обучение)

Неконтролируемая генерация ключевых фраз в открытом домене (arXiv) Автор: Лам Тхань До , Притом Саха Акаш , Кевин Чен-Чуан Чанг . Аннотация: В этой работе мы изучаем проблему неконтролируемой генерации ключевых фраз в открытом домене, целью которой является модель генерации ключевых фраз, которая может быть построена без использования данных, помеченных человеком, и может работать согласованно в разных доменах. Чтобы решить эту проблему, мы предлагаем модель seq2seq, состоящую..

Разгадка линейной регрессии | Склеарн

(Закрытая форма реализации алгоритма наименьших квадратов) Предисловие Вы когда-нибудь интересовались внутренней реализацией алгоритма линейной регрессии в scikit-learn ? ? Если ваш ответ да, то вы находитесь в правильном месте. В этой статье я проведу вас через распаковку линейной регрессии в соответствии с разработкой и реализацией в sklearn. О линейной регрессии Это линейный подход к моделированию взаимосвязи между скалярным откликом и одной или несколькими..

Дорожная карта науки о данных на 2023–2024 годы

Наука о данных включает в себя использование знаний предметной области, навыков программирования, математики и статистики для извлечения осмысленной информации из данных. Он включает в себя применение алгоритмов машинного обучения к различным типам данных, таким как текст, изображения, видео и аудио, что приводит к разработке систем искусственного интеллекта, способных выполнять задачи, подобные человеческим. В результате эти системы генерируют ценную информацию для бизнеса, которую..

Изучение наборов данных обнимающих лиц

Получите доступ к большим готовым наборам данных для вашего следующего проекта НЛП Самая важная часть любого проекта машинного обучения — это данные, с которыми вы работаете. Независимо от того, с каким алгоритмом или моделью вы имеете дело, реальная точность зависит от количества И качества данных. Мне нравится работать с проектами НЛП в свободное время, но иногда бывает сложно получить доступ к большим наборам данных. На сбор, накопление и последующую очистку этих данных может..