Публикации по темата towards-data-science

Свързани публикации 'towards-data-science'

Днес в тази статия ще проучим задълбочено проблем с регресия, за да разберем колко...

Днес в тази статия ще проучим в дълбочина проблем с регресията, за да знаем колко точен може да бъде регресионният модел въз основа на набора от данни и колко може да варира въз основа на няколко параметъра. Ще говорим за грешките и как да се справим с тях. От основната линейна регресия до случайната гора и добре познатия метод OLS, който е методът на обикновения най-малък квадрат, ще бъдат разгледани стъпка по стъпка. И така, нека започнем едно вълнуващо пътешествие! Първо, нека..

Вашето пълно ръководство за модели на машинно обучение

Кой модел да използвам, кога и защо? Как да настроите своя алгоритъм? Нека се потопим в него заедно! Кратко въведение Обикновено започвате изследванията си за машинно обучение, като търсите да следвате ръководства в интернет, които ще ви помогнат най-накрая да оживите даден проект, нали? С течение на времето започвате да разбирате, че има какво да научите и започвате да мислите дали сте способни да го постигнете. Прекалено трудни уроци, неадекватни обяснения, проблеми; „Може би..

Как да направите зашеметяващи радарни диаграми с Python — Приложено в Matplotlib и Plotly

Лесно визуализирайте данни отвъд второто измерение с радарни диаграми - внедрени както в Matplotlib, така и в Plotly Визуализирането на данни отвъд две измерения не е добра идея – през повечето време. Това е мястото, където идват радарните диаграми, които ви позволяват визуално да представите една или повече групи от стойности върху множество еднакво мащабирани променливи. Днес ще научите как радарните диаграми могат да визуализират данни в множество измерения, както с Matplotlib,..

PMF за препоръчителни системи

Факторизиране на вероятностна матрица и съвместно филтриране Автоматизираните системи за препоръчване обикновено се използват, за да предоставят на потребителите предложения за продукти, които биха представлявали техен интерес въз основа на съществуващи данни за предпочитанията. В литературата са описани различни видове препоръчителни системи. Ние обаче ще подчертаем две основни категории и след това ще разширим допълнително втората: Филтриране въз основа на съдържание: Те използват..

Tweets, Emoji Анализ на настроението с помощта на Q блокове

Обработка на естествен език Tweets, Emoji Анализ на настроението с помощта на Q блокове Първият ми опит да наема GPU за ускоряване на софтуера. „Пълният код е наличен в моето хранилище.“ В следващата статия ще наема графичния процесор Q Blocks , за да управлявам изискващ изчисления AI модел. Ще стартирам модел за задълбочено обучение, наречен DeepMoji , който при дадено изречение ще оцени най-добрите n емоции, които могат да го опишат (кликнете не върху връзката, за да опитате)...

Как да оценим моделите на обучение без надзор

„Музика по номера“ Как да оценим моделите на обучение без надзор Колко различни са K-Pop и Класическата музика? Досега в тази поредица от блогове разгледахме как да създаваме автоматизирани плейлисти с песни чрез групиране на колекция от песни, базирани единствено на техните аудио характеристики . Преди това работихме върху „пример играчка от 32 песни“ и показахме как „Йерархично агломеративно групиране“ (HAC) може автоматично да създава подгрупи от подобни песни. Успяхме да..

Топ 10 на грешките в статистиката, направени от специалистите по данни

Учен по данни е „човек, който е по-добър в статистиката от всеки софтуерен инженер и по-добър в софтуерното инженерство от всеки статистик“. В „10-те най-големи грешки при кодирането, допуснати от специалисти по данни“ обсъдихме как статистиците могат да станат по-добри програмисти. Тук обсъждаме как програмистите могат да станат по-добри статистици. Подробен изход и код за всеки от примерите е достъпен в github и в интерактивен бележник . Кодът използва библиотека за управление на..