Публикации по темата towards-data-science

Свързани публикации 'towards-data-science'

Въведение в E1071: Пакетът за машинно обучение в R

Машинното обучение е мощен инструмент, който ни позволява да анализираме и правим прогнози въз основа на данни. Това е подмножество от изкуствен интелект (AI), който се фокусира върху разработването на алгоритми, които могат да се учат от и да правят прогнози върху данни. Има много различни подходи към машинното обучение и един популярен инструмент за прилагане на техники за машинно обучение в R е пакетът e1071 .

Изследване на света на машинното обучение с mlr3 в R

mlr3 е мощен пакет в R за машинно обучение и прогнозно моделиране. Той е изграден върху пакета mlr и предоставя рационализиран и ефективен начин за обучение и оценка на модели за машинно обучение. Някои от основните характеристики на mlr3 включват: Прост и последователен синтаксис за обучение и оценка на модели за машинно обучение, независимо от...

Ти си уволнен

Как да разработите и управлявате щастлив екип за наука за данни TLDR: Повечето екипи за машинно обучение не обичат да работят с данни и инфраструктура, защото това не е толкова интересно, колкото моделирането. Лошото управление на проблема може да доведе до голямо текучество и токсична атмосфера в екипа. Искам да споделя решение, наречено Insight-Driven Development (IDD), няколко примера за него и пет стъпки за приемането му. IDD има за цел да създаде високоефективни, ангажирани и..

Рап Бог или машина?

Музикалното поколение е в челните редици на машинното обучение. Към 2018 г. The Independent отчита , че рапът е най-популярният музикален жанр в Съединените щати. Поради голямото присъствие на рапа в нашето общество, ние решихме да създадем генератор на рап песни, използвайки машинно обучение. За да се постигне това, има два генератора, които трябва да бъдат създадени: текстове и ритъм. Генерация на текстове Експериментирахме с три различни вида модела за писане на текстове,..

Загуба по отношение на ML

За линейни данни, двуизмерни данни, което означава, че наборът от данни има два обекта, единият е функция, а другият е етикет. Връзката между двете може да се изведе чрез прост линеен (регресионен) модел. Това ще ни спести известно време, за да разгледаме тенденциите наведнъж. Сега ние определяме ефективността на модел въз основа на загубата, която е претърпял за правене на прогнози за данните. Колкото по-малка е загубата, толкова по-добър е моделът. Загубата може да бъде положителна..

Как да си осигурите първия си стаж в науката за данни

#3 Спрете да кандидатствате онлайн Преди 5 години трескаво се стремях към стажове на тъмно, хвърляйки се на всяка възможност, която ми се падне. Не проработи. Разбирам колко трудно може да бъде намирането на стаж, защото съм минал през това. Дори съм плащал за курсове за обучение, които бяха заклеймени като стажове, защото не знаех. Дори вече не ги споменавам в CV-то си. Ако бъдете помолени да платите за стаж, това не е стаж. Сега времената са се променили и светът на Data..

Спрете твърдото кодиране на стойности в приложения на Python — Вместо това използвайте YAML конфигурационни файлове

Твърдо кодираните конфигурации са ужасна идея. Вместо това помислете за тази алтернатива Търсенето и заместването на стойности в стотици файлове на Python е дори по-малко забавно, отколкото си мислите. Наличието на един централен конфигурационен файл прави настройването на URL адреси на API, връзки към бази данни и други много по-лесно. Днес ще научите как да направите вашите приложения на Python много по-стабилни с конфигурационните файлове на YAML. И така, какво е YAML ? YAML..