Свързани публикации 'regression'


Представящ текст за регресия — Част I: scikit-learn
Въпреки че навлязохме в ерата на големи езикови модели, които се предполага, че се прилагат към множество различни задачи (вижте напр. моята статия за „прогнозиране на времеви редове с ChatGPT“), все още се нуждаем от класически подходи като регресионни модели с инженеринг на функции за решаване на множество проблеми, с които можем да се сблъскаме. В тази кратка поредица от статии ще анализираме различни методи за представяне на текст , т.е. извличане на функции от текстови променливи,..

Какво е контролирано обучение?
Обучението под наблюдение е като да научите вече познат път и да използвате знанията за нови пътища. Ако имате данни с правилни резултати, те могат да се използват за обучение на модел, а моделът може да се използва за прогнозиране на отговори. Има две основни части от контролираното обучение. Класификация Това е като да поставите плодове от един и същи вид в една и съща опаковка. Разделя данните на части. Броят на частите трябва да бъде ограничен. Броят на частите не трябва..

Какво означава регресия в науката за данните?
Как думата се бърка с типа модел В науката за данни регресионните проблеми са проблеми, при които искаме да обучим модел, използвайки функции, извлечени от данни, които могат да предскажат числова стойност (напр. целта), в рамките на определен диапазон на достоверност (обикновено 95%). Предположението е, че изходът, който искаме да предвидим, е непрекъсната числена стойност. Например, да приемем, че искаме да предскажем приблизителната заплата за работа въз основа на думите,..

Регулиране на ласо и хребет
Разбиране на ласото и регулирането на гребена в машинното обучение Когато използвате алгоритми за контролирано обучение върху набор от данни в машинно обучение, ще има случаи, в които моделът се представя изключително добре на данни от влака, но може да не работи добре и може също да има висок процент грешки, когато се тества върху нови данни. За това са виновни множество фактори, включително колинеарност, разлагане на дисперсии на отклонение и прекомерно моделиране на данни от..

Класификация и регресионни метрики за анализ на прогнозно моделиране
Темите, които предизвикват безпокойство, са анализите на здравеопазването и извличането на данни. Приложенията за здравеопазване и данните за здравеопазването се пресичат с науката за данни и анализа на големи данни. Разбиране на алгоритми за обработка на големи данни. Тази статия е част от поредица от статии по темата Големи данни за курс по здравна информатика Можете да посетите връзката по-горе, за да разберете тази тема в контекста на пълния курс. Тази статия препраща към знания..

Частични най-малки квадрати (PLS): Укротяване на високомерни данни и улавяне на сложни връзки
Частични най-малки квадрати (PLS): Укротяване на високомерни данни и улавяне на сложни връзки Частичната регресия на най-малките квадрати (PLS) е многовариантна статистическа техника, използвана за моделиране на връзките между предикторни променливи (X) и променлива на отговор (Y). Това е особено полезно, когато се работи с набори от данни, които имат висока размерност, мултиколинеарност или шумни променливи. PLS има за цел да намери набор от латентни променливи, наречени компоненти,..

Разбиране на множествената линейна регресия.
Терминът „ множество “ в множествената линейна регресия представлява връзката между две или повече независими входни променливи и променлива на отговор. Множествената линейна регресия е необходима, когато една променлива не е достатъчна, за да се създаде добър модел и да се направят точни прогнози. Нека започнем да го разбираме с набор от данни за жилища…. Постановка на проблема. Помислете за компания за недвижими имоти, която разполага с набор от данни, съдържащ цените на имотите в..