Публикации по темата scikit-learn

Свързани публикации 'scikit-learn'

Проста линейна регресия с код на Python

Простата линейна регресия е статистическа техника, използвана за установяване на връзката между две променливи, където едната е независимата променлива, а другата е зависимата променлива. Техниката се нарича „линейна“, защото предполага, че връзката между променливите е права линия. В този блог ще обясним как да извършим проста линейна регресия с код на Python. Да кажем, че имаме набор от данни с две променливи: X и Y. Искаме да използваме проста линейна регресия, за да разберем как X..

Разбиране на популярния алгоритъм за машинно обучение: линейна регресия

Въведение Алгоритмите за машинно обучение се превърнаха в жизненоважна част от много индустрии, от здравеопазването до финансите, от маркетинга до развлеченията. В тази статия ще разгледаме популярни алгоритми за машинно обучение, а именно линейна регресия. Ще обясним математическата формула зад алгоритъма и ще предоставим пример, за да илюстрираме как работи всеки алгоритъм. Накрая ще сравним алгоритмите с помощта на матрица на объркване и ще предложим предложения кой алгоритъм може да..

Решение на упражненията [Глава-4: Модели на обучение]…

Глава-4: Модели на обучение 1. Какъв алгоритъм за обучение на линейна регресия можете да използвате, ако имате набор за обучение с милиони функции? Както подходът на нормалното уравнение, така и подходът на декомпозиция на единична стойност (SVD) стават много бавни, когато броят на характеристиките нараства (напр. 100 000). Въпреки това, Gradient Descent се мащабира добре с броя на функциите; обучението на модел на линейна регресия, когато има стотици хиляди характеристики, е..

Класификатор на дървото на решенията

Като маркетинг мениджър вие искате набор от клиенти, които е най-вероятно да закупят вашия продукт. Ето как можете да спестите маркетинговия си бюджет, като намерите своята аудитория. Като кредитен мениджър трябва да идентифицирате рискови заявления за кредит, за да постигнете по-нисък процент на неизпълнение на кредита. Този процес на класифициране на клиенти в група от потенциални и непотенциални клиенти или безопасни или рискови заявления за кредит е известен като проблем с..

Изпълнение на Deep NLP и други ML модели върху туитове (част 2)

Добре дошли в друга публикация, документираща напредъка ми в предизвикателството Kaggle, споменато в Част 1 , където ще се опитвам с различни методи за подобряване на предсказуемостта на моите модели, когато става въпрос за разпознаване дали един туит е за истинска извънредна ситуация/бедствие. Днес ще разгледаме друга колона в данните, за да използваме инженеринг на някои функции и потенциално да намерим нова променлива, която да помогне на нашия модел в неговите прогнози. Последния път..

Разделяне на набор от данни на набори за обучение, валидиране и тестване с помощта на Python

Какво е разделяне на Train-validation-test в ML Разделянето на обучение-тест-валидиране е процесът на разделяне на набор от данни на три отделни подмножества: набор от влак, тестов набор и набор за валидиране. Разделянето на набор от данни на набори за обучение, валидиране и тестване е важна стъпка в процеса на машинно обучение и дълбоко обучение. Като разполагаме с отделни набори за обучение, валидиране и тестване, можем по-добре да оценим ефективността на нашия модел, да предотвратим..

Препоръка за тип хотел на Expedia

Проблем с класификацията на контролирано машинно обучение. Блогът ще бъде актуализиран скоро...