Свързани публикации 'multicollinearity'
Линейна регресия — От EDA до оптимизиране на модел (част 1)
В този блог изграждаме препоръчителен модел от нулата за оценка на размера на екипажа за потенциални купувачи на кораби, като използваме набора от данни cruise_ship_info.csv .
Този блог ще се потопи дълбоко в теоретичните и практически концепции в машинното обучение и науката за данни, за да ви помогне да разберете напълно точките по-долу —
Защо този модел (линеен/нелинеен)?
Как да изберете функции само чрез анализиране на данни и също чрез алгоритми за избор на функции?..
Мултиколинеарността и злото зад нея.
Важност на данните и какво всъщност е мултиколинеарност?
Ако попитате някой специалист по данни за най-важния аспект в машинното обучение, той най-вероятно ще каже, че това са данните за обучение. Е, всички фантастични алгоритми ще работят по правилния начин само ако данните за обучение са добре организирани и имат няма аномалии. Една от аномалиите, които могат да имат данните за обучение, е мултиколинеарността.
Мултиколинеарността може да се дефинира като явление, при което две..