Свързани публикации 'data-preprocessing'


Първи стъпки с Data Science
В днешния бързо развиващ се свят Data Science се превърна в бъдещето и компаниите правят значителни инвестиции в тази област. Машинното обучение, дълбокото обучение и компютърното зрение са някои от модерните технологии, от които всеки иска да участва. Но как да започнете това безкрайно пътуване? В тази статия ще обясня най-добрите източници и материали, които със сигурност ще ви помогнат да разберете по-дълбоките концепции. Освен това се опитах да включа възможно най-много безплатни..

Качество на данните в машинното обучение: Как да оценим и подобрим?
Тъй като данните са в основата на машинното обучение, е неизбежно работата на всички алгоритми за машинно обучение да бъде пряко повлияна от качеството на входните данни. Поговорката Боклук в боклука навън важи и в случая с машинното обучение: използването на данни с лошо качество може да подведе процеса на обучение и да доведе до неточни модели, по-дълго време за обучение и в крайна сметка лоши резултати. От друга страна, алгоритмите за машинно обучение, обучени върху точни, чисти и..

Шест стъпки за усъвършенстване на вашите данни: Предварителна обработка на данни, част 3
Този урок отговаря на всички следните въпроси: Кои са липсващите стойности? Кога възниква проблемът с липсващите стойности? Защо е важно да се обработват липсващи стойности? Как се обработват липсващите числови стойности? Как се обработват категоричните липсващи стойности? Досега имаме ясна интуиция как да импортираме всички необходими библиотеки и как да импортираме съответния набор от данни и отделни характеристики и целеви променливи. Каква може да е следващата стъпка?..

4 техники за подобряване на вашите проекти за изследване на машинно обучение
В публикацията си „Насоки за изследване на проект за машинно обучение“ обясних как да разделя всеки проект за машинно обучение на два етапа (изследване и развитие) и някои трикове за стимулиране на етапа на изследване. В тази публикация ще разгледам някои техники и инструменти, които ще ви помогнат да овладеете вашето изследване. Докато работите на този етап, трябва да се стремите към простота и фокус. Оформление на проекта Това е оформлението на папката, което обикновено използвам в..

Въведение в избора на екземпляри в извличането на данни
Изборът на екземпляри играе важна роля в предварителната обработка на данни за машинно обучение. Целта е да се намали количеството данни, използвани за откриване на знания. В идеалния случай това ще доведе до модел с (поне) същата производителност като модел, обучен с всички данни. По-голямата част от тази публикация в блога, ако не е отбелязана по друг начин, е извлечена от глава 8 на García et al [1]. Цели на избора на екземпляри Основната цел при избора на екземпляр е да се намери..

Предварителна обработка на данни за анализ на настроението на прегледи на Zomato
Този блог е първият от поредицата за анализ на настроението върху данните от Zomato. Има много популярни модели като SVM, Random Forest и Naive Bayes и т.н., които да се използват в Sentiment Analysis. В тази серия ще използваме модела LSTM заедно с Feedforward, за да предвидим настроението на рецензията. Преди да преминем към архитектурата на модела, трябва да изпълним някои задачи за предварителна обработка на данните, така че да стане приемливо за нашия модел да научи функции и да..

Предварителна обработка на данни: Отприщване на магията на машинното обучение с чисти, трансформирани и организирани...
Предварителната обработка на данни е като магическата пръчка на машинното обучение! Това е решаващата първа стъпка, в която трансформираме сурови, разхвърляни данни от различни източници в чиста, организирана и смислена информация, с която нашите модели за машинно обучение могат да работят. Представете си това като да подредите стаята си, преди да започнете творчески проект - не бихте искали да работите в разхвърляно пространство, нали? По време на предварителната обработка ние се заемаме..