Свързани публикации 'missing-data'


Как да работим с липсващи стойности
Въведение — Почистване на данни Няма нищо общо с методите на машинно обучение, архитектурата на дълбокото обучение или други сложни подходи в областта на науката за данни. Имаме събиране на данни, предварителна обработка на данни, моделиране (машинно обучение, компютърно зрение, дълбоко обучение или друг сложен подход), оценка и накрая внедряване на модела и съм сигурен, че съм забравил нещо. Така че работата с техники за моделиране е гореща тема, но предварителната обработка на данни..

Кой е най-добрият метод за попълване на липсващи данни?
Специалистът по данни се сблъсква с набори от данни, които са непълни или съдържат данни, които не са уместни. От решаващо значение е данните да бъдат подредени за всеки проект за наука за данни, особено ако върху данните се използва алгоритъм за машинно обучение. Специалистът по данни има множество възможности, когато се опитва да попълни празнини в данните, но коя да избере?

Боравене с липсващи данни и отклонения в машинното обучение: Предизвикателства и решения
Машинното обучение е бързо развиваща се област с безкрайни потенциални приложения. Въпреки това, както при всяка област на изследване, има предизвикателства, които трябва да бъдат разгледани, за да се постигнат точни резултати. Два от най-големите проблеми, с които се сблъсква машинното обучение, са липсващите данни и отклоненията. Липсващи данни могат да възникнат по различни причини. Може да се окаже, че данните никога не са били събирани на първо място или че са били събрани, но..

Свързани въпроси 'missing-data'

Statsmodels: изисква масиви без NaN или Infs - но тестът показва, че няма NaN или Infs
Опитвам се да стартирам ADF-тест от модула adfuller на statsmodels. Дава ми грешка: ValueError: array must not contain infs or NaNs Чрез друг въпрос бих могъл да заменя своите NaN ( NaN в кадър с данни: когато първото наблюдение на времеви...
1640 изгледи
schedule 21.09.2022

Как да получа мерки за съответствие на модела (AIC, F-статистика) в zelig за многократно вменени данни?
Продължение на по-ранна публикация , интересувам се да науча как да получа обичайните мерки за относителното качество на статистически модел в zelig за регресия, като използвам множество условни данни (създадени с Amelia). require(Zelig)...
1235 изгледи

Кръстосана заявка: Получаване на нулеви данни за липсващи данни от Access DB
Имам данни в базата данни на Access, която съдържа данни за няколко дни. Но понякога има липсващи данни за някои дати. Например имам данни за myDate Location Price 11/1/2013 South 10 11/1/2013 West 20...
1735 изгледи
schedule 12.12.2022

Елегантен начин за докладване на липсващи стойности в data.frame
Ето малка част от кода, който написах, за да докладвам променливи с липсващи стойности от рамка с данни. Опитвам се да измисля по-елегантен начин да направя това, който може би връща data.frame, но съм заседнал: for (Var in names(airquality)) {...
128707 изгледи
schedule 05.12.2023

Как да създам липсващи стойности в таблица в R?
Имам 40 двойки птици, като всяка мъжка и женска в двойката се оценяват според цвета си. Цветовият резултат е категорична променлива с диапазон на стойност от 1 до 9. Бих искал да създам таблица с номера на всяка комбинация (1/1, 1/2, 1/3, ... 9/7, 9...
1600 изгледи
schedule 29.12.2023

Pandas Dataframe: Замяна на NaN със средна стойност на ред
Опитвам се да науча панди, но бях озадачен от следното, моля. Искам да заменя NaNs е рамка от данни със средната стойност на реда. Следователно нещо като df.fillna(df.mean(axis=1)) трябва да работи, но по някаква причина не успява за мен....
17602 изгледи
schedule 12.04.2024