Публикации по теме 'scikit-learn'


Рекомендовать меня
Система рекомендаций фильмов — фильтрация на основе контента Блог полностью посвящен системе рекомендаций фильмов на основе контента, которая развернута как веб-сайт на heroku (бесплатно). Обзор реализации Для работы со столбцом «key_words», который содержит все необходимые ключевые слова в .csv, мы использовали специальную библиотеку NLP, известную как RAKE (алгоритм быстрого автоматического извлечения ключевых слов). В основном это извлечение ключевых слов путем определения..

Scikit-Learn: революционный подход к машинному обучению
Введение в scikit-learn Scikit-learn — это библиотека Python с открытым исходным кодом, которая предоставляет простые и эффективные инструменты для машинного обучения и интеллектуального анализа данных. Благодаря удобному API она стала одной из самых популярных библиотек машинного обучения в экосистеме Python. В этой статье мы представим scikit-learn и его различные функции, а также поможем понять, почему он является важным инструментом для специалистов по данным и специалистов по..

Повысьте безопасность своей электронной почты с помощью обнаружения спама с помощью Scikit-Learn
Электронные письма со спамом — это незапрошенные нежелательные сообщения, рассылаемые в большом количестве на большое количество адресов электронной почты. Эти сообщения обычно носят рекламный, мошеннический характер или содержат вредоносное ПО и могут представлять угрозу безопасности устройства и личной информации получателя. В этом руководстве мы узнаем, как создать модель обнаружения спама в электронной почте с помощью Scikit-Learn, популярной библиотеки машинного обучения на..

K-Fold как перекрестная проверка с примером текстовой классификации BERT
Использование перекрестной проверки K-Fold для улучшения проверки вашей модели Transformers на примере текстовой классификации BERT. Первоначально опубликовано на https://www.philschmid.de 7 апреля 2020 г. K-fold - это метод перекрестной проверки, используемый для оценки навыков модели машинного обучения на невидимых данных. Он обычно используется для проверки модели, поскольку его легко понять, реализовать, а результаты имеют более высокую информативную ценность, чем обычные..

Project to Learn ML/DL: vol.4 (DeepLearning)
Введение Эта статья является продолжением этого . Изучив классическое машинное обучение, я изучил глубокое обучение. Помимо машинного обучения, целью было изучение нескольких методов глубокого обучения и понимание того, как найти лучшую модель. В прошлом я читал несколько книг об DL, но на самом деле я никогда не использовал его только по знанию. Как правило, обработка изображений часто используется в исследованиях глубокого обучения, но на этот раз это регрессионная модель,..

Обзор использования scikit-learn  — Часть I
В мире машинного обучения и науки о данных немногие пакеты известны лучше, чем scikit-learn . Его публикацию в JMLR цитируют более 52 000 раз.¹ И если вы занимались машинным обучением до того, как sklearn впервые появился на сцене примерно в 2011 году, вы поймете, почему. Еще в 2000-х большинство из нас, бедолаг, проводили исследования в таких средах, как Matlab, Orange или R. Если вы использовали Matlab, вы, как правило, сталкивались с головной болью с лицензированием набора..

Понимание векторного представления Word в Python: руководство для начинающих
Представление вектора слов, также известное как встраивание слов, представляет собой метод представления слов естественного языка в виде числовых векторов. Эти векторы фиксируют значение и контекст слов, что позволяет использовать их в различных задачах обработки естественного языка, таких как языковой перевод и классификация текста. В этой статье мы рассмотрим основы представления векторов слов в Python, начиная с модели Bag of Words и переходя к более продвинутым методам, таким как..