Въведение

В областта на машинното обучение оценката на ефективността на моделите е от съществено значение за разбирането на тяхната ефикасност и вземането на информирани решения. Метриките за оценка предоставят количествени мерки за оценка на това колко добре се представя моделът на машинно обучение при конкретни задачи като класификация, регресия или групиране. В тази статия ще проучим значението на показателите за оценка и ще обсъдим различните типове, които обикновено се използват в задачи за машинно обучение.

Метрики за оценка на класификацията

В задачите за класификация моделите се обучават да предвиждат предварително дефинирани класове или етикети за входни данни. Въпреки че точността е основен показател, който измерва процента на правилно предвидените случаи, той може да не предостави цялостна картина на производителността на модела, особено когато се работи с небалансирани набори от данни. За да се отчетат класовите дисбаланси, широко се използват допълнителни показатели като прецизност, припомняне и F1-резултат.

1. Точноста:

Точността измерва процента на правилно предвидените случаи от общия брой случаи. Формула: Точност = (Брой правилно предвидени случаи) / (Общ брой случаи)

2. Прецизност:

Прецизността представлява процента на правилно прогнозираните положителни случаи от общия брой прогнозирани положителни случаи. Формула: Прецизност = (Брой истински положителни резултати) / (Брой истински положителни резултати + Брой фалшиви положителни резултати)

3. Припомняне (чувствителност или истински положителен процент):

Recall измерва процента на правилно предвидените положителни случаи от общия брой действителни положителни случаи. Формула: Извикване = (Брой истински положителни) / (Брой истински положителни + Брой фалшиви отрицателни)

4. F1-резултат:

F1-резултатът е хармоничната средна стойност на прецизност и припомняне, осигуряваща балансирана мярка за представяне на модела, която отчита както фалшивите положителни, така и фалшивите отрицателни резултати. Формула: F1-резултат = 2 * (прецизност * припомняне) / (прецизност + припомняне)

Кога да изберете кой показател за класификация:

- Точността е подходяща за балансирани набори от данни, където класовете са представени еднакво.

- Прецизността е полезна, когато фокусът е върху минимизиране на фалшивите положителни резултати.

- Припомнянето е полезно, когато акцентът е върху минимизиране на фалшивите отрицания.

- F1-резултатът осигурява балансирана мярка, когато както фалшивите положителни, така и фалшивите отрицателни резултати са важни.

Метрики за регресионна оценка

В задачите за регресия моделите имат за цел да предскажат непрекъснати числени стойности вместо дискретни класове. Най-често използваните показатели за оценка за регресия са средна квадратна грешка (MSE) и средна абсолютна грешка (MAE).

1. Средна квадратна грешка (MSE):

MSE изчислява средната квадратна разлика между действителните и прогнозираните стойности, предоставяйки представа за общата грешка на модела. Формула: MSE = (1/n) * Σ(y — ŷ)², където y е действителната стойност и ŷ е предвидената стойност, а n е общият брой екземпляри.

2. Средна абсолютна грешка (MAE):

MAE изчислява средната абсолютна разлика между действителните и прогнозираните стойности, като дава стабилна мярка за средната разлика. Формула: MAE = (1/n) * Σ|y — ŷ|, където y е действителната стойност и ŷ е предвидената стойност, а n е общият брой случаи.

3. Средноквадратична грешка (RMSE):

RMSE е корен квадратен от средната квадратна грешка, осигуряваща мярка за средната величина на грешките. Формула: RMSE = √(MSE)

4. Корен на квадратна логаритмична грешка (RMSLE):

RMSLE изчислява квадратния корен от средната квадратна логаритмична разлика между прогнозираните и действителните стойности, полезно за задачи, при които целевата променлива има голям диапазон. Формула: RMSLE = √(1/n) * Σ(log(1 + y) — log(1 + ŷ))², където y е действителната стойност, ŷ е предвидената стойност и n е общият брой случаи .

5. Резултат R2 (R на квадрат или коефициент на определяне):

Резултатът R2, известен също като коефициент на определяне, измерва съотношението на дисперсията в зависимата променлива, която е предвидима от независимите променливи. Формула: R2 = 1 — (Сума от остатъците на квадрат / Обща сума от квадрати)

6. Коригирано R на квадрат:

Коригираният R на квадрат е модифицирана версия на R на квадрат, която взема предвид броя на предикторите в модела, осигурявайки мярка за съотношението на дисперсията, обяснена от модела. Формула: Коригиран R на квадрат = 1 — ((1 — R²) * (n — 1)) / (n — p — 1), където R на квадрат е коефициентът на определяне, n е общият брой случаи и p е броя на предикторите. Той винаги е по-малък или равен на R2 Score.

Кога да изберете кой показател за регресия:

MSE се използва често и е подходящ, когато акцентът е върху наказването на по-големи грешки, което го прави по-чувствителен към отклонения.

MAE предоставя по-стабилна мярка, тъй като отчита абсолютната разлика, без да повдига грешките на квадрат, което го прави по-малко чувствителен към отклонения.

RMSE е подобен на MSE, но се изразява в оригиналните единици на целевата променлива, което го прави по-интерпретируем.

RMSLE е полезен, когато целевата променлива има голям диапазон и искате да санкционирате еднакво подценяването и надценяването.

Резултатът R2 е полезен за разбиране на съотношението на дисперсията, обяснена от модела, като по-високите стойности показват по-добро съответствие.

Коригираният R на квадрат е ценен, когато искате да отчетете броя на предикторите и да оцените обяснителната сила на модела.

Метрики за оценка на групиране

Алгоритмите за клъстериране групират подобни точки от данни заедно въз основа на присъщите им характеристики. Оценяването на ефективността на алгоритмите за клъстериране може да бъде предизвикателство, тъй като няма предварително дефинирани етикети, с които да се сравнява. Някои показатели обаче могат да предоставят полезна информация.

1. Коефициент на силует:

Коефициентът на силуета измерва компактността и разделянето на клъстерите. Той присвоява резултат на всяка точка от данни въз основа на нейната близост до точки в собствения си клъстер и други клъстери. Формула: Коефициент на силует = (b — a) / max(a, b), където a е средното разстояние между точка от данни и други точки в същия клъстер, а b е средното разстояние между точката от данни и точките в най-близкия съседен клъстер.

2. Индекс на Дейвис-Болдин:

Индексът на Davies-Bouldin изчислява средното сходство между клъстерите, като взема предвид тяхното разделяне. По-малките стойности показват по-добра производителност на групирането. Формула: Индекс на Davies-Bouldin = (1/n) * Σ(максимално сходство), където n е общият брой клъстери.

Кога да изберете кой показател за клъстериране:

Коефициентът на силуета е полезен при оценка на компактността и разделянето на клъстерите. По-високите стойности (близо до 1) показват добре разделени и компактни клъстери.

Индексът на Davies-Bouldin е полезен за оценка на качеството на клъстерите въз основа на тяхното сходство и разделяне. По-малките стойности показват по-добра производителност на групирането.

Заключение

Метриките за оценка играят жизненоважна роля при оценката на ефективността на моделите за машинно обучение. Те предоставят обективни мерки, които позволяват на изследователите и практиците да сравняват различни алгоритми и да вземат информирани решения. Независимо дали става въпрос за класификация, регресия или групиране, разбирането на различните налични показатели за оценка е незаменимо за осигуряване на точна и ефективна оценка на представянето на модела. Чрез използване на подходящите показатели, практикуващите машинно обучение могат да настроят фино моделите си, да подобрят възможностите си за прогнозиране и да стимулират иновациите в непрекъснато развиващата се област на машинното обучение.

WRITER в MLearning.ai // Интерпретатор на код// Animate Midjourney