Свързани публикации 'classification'


Оценяване на производителността на моделите за машинно обучение
Един от най-разпространените и бързи начини за оценка на модел Има множество начини да оцените колко добре се представя моделът на машинно обучение. Тази статия обаче ще разгледа един от най-разпространените и най-бързи методи за оценка на ефективността на модел, известен като Precision and Recall. Класифициране на резултатите от модела Преди да навлезем в прецизността и припомнянето, първо трябва да разберем какво означават класификациите на истински положителен, истински..

Как внедрих моя модел/и за класификация на документи на искра (логистична регресия) като самостоятелно приложение...
TLDR — Използвайте тръбопроводи за запазване на TF-IDF модел, генериран от набора за обучение, и SVM модел за прогнозиране. Така че по същество запазете два модела, единият за извличане на функции и трансформация на входа, а другият за прогнозиране. Едно от големите предизвикателства, когато разработвате модел за класификация на текст, обученият модел, който получавате, не е достатъчен за прогнозиране, ако вашият план е бил да тренирате офлайн и да разгърнете само модела за прогнозиране в..

Вграждане на думи и вектори на документи — Когато се съмнявате, опростете
Измерванията за точност и ефективност за класифициране на някои текстови корпуси показват, че наивният класификатор на Бейс е силен съперник... Това е третата и последна статия от тази поредица за използването на вектори на думи с вектори на документи за NLP задачи. Фокусът тук е класификацията на текста. Ние обобщаваме резултатите и препоръките от тях, когато векторите на думи се комбинират с вектори на документи. Кодът може да бъде изтеглен от github . Нека веднага да започнем с..

Откриването на шум от тълпа Сливане на две CNN
Fusion модел за дълбоко обучение за аудио Нашият основен фокус в тази статия е да сравним представянето на различни аудио функции в управлявана от CNN система за двоична класификация. За този проект шумовете на тълпата бяха избрани като аудио, което ни интересува, и нашата цел беше да обучим модел на невронна мрежа, който може да открие дали дадена аудио проба съдържа или не този звук. Шумът от тълпата е звук, който всеки познава, съставен предимно от хора, които говорят помежду си. Те..

Хам сред спама
С нарастването на рекламите и студените съобщения сега получаваме непрекъснати кохерентни нишки от търговски съобщения и имейли. Потребител, като вас и мен, понякога се затруднява да намери текст/имейл, който наистина е полезен за нас или този, който търсим. Игла в купа сено. Хамовете сред спамовете. Системите за откриване, като например системата за откриване на спам , стават все по-полезни за класифициране важните данни сред пакета необработени и нежелани данни. В тази..

Внедряване на многокласова класификация
Какво е мултикласова класификация? Многокласовата класификация е задача за класификация на машинно обучение, която се състои от повече от два класа или изхода. В тази класификация решихме проблема с множество класове. ние обучаваме класификатор , използвайки нашите данни за обучение. Разделете набора от данни на данни за „обучение“ и „тест“. Набор от данни Наборът от данни, който ще използваме за този пример, е набор от данни „Вина“. Наборът от данни за виното е класифициран..

Трябва ли да гледам на прецизност и запомняне ИЛИ на специфичност и чувствителност?
Разбиране на разликите между прецизност, припомняне и специфичност, чувствителност В общността на науката за данни е обичайно да се гледа на прецизността и припомнянето, за да се оценят моделите, които изграждате. В света на медицината е обичайно да се разглеждат специфичността и чувствителността, за да се оценят медицинските тестове. Тези концепции са много сходни, но все пак различни. Когато тези два свята се срещнат, когато медицинският тест е модел на машинно обучение, тази..