Метрики классификации доктора Элвина Анга
https://www.alvinang.sg/s/Classification_Metrics_for_ML_Models_by_Dr_Alvin_Ang.ipynb
Когда использовать Что?
Когда использовать кривую PR?
Как работает кривая PR?
Типичная кривая PR выглядит так.
Это просто противоположность кривой ROC/AUC.
Чем дальше кривая AUC-PR от базового классификатора, тем лучше ваша модель.
Если AUC-PR = 1 → это идеальный классификатор → ОТЛИЧНО.
Если AUC-PR = 0,5 → его базовый классификатор → ПЛОХО!
Кривая PR в Python
import pandas as pd import numpy as np import scikitplot as skplt from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression # Load the CSV file into a DataFrame and extract features (X) and target (y) url = 'https://www.alvinang.sg/s/iris_dataset.csv'; df = pd.read_csv(url) X = df.iloc[:, :4] y = df.iloc[:, -1] # Split the data into training and testing sets X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Fit the logistic regression model model = LogisticRegression() model.fit(X_train, y_train) # Generate predicted probabilities for the test set y_probs = model.predict_proba(X_test) # Plot the Precision-Recall curve skplt.metrics.plot_precision_recall_curve(y_test, y_probs)
О докторе Элвине Анге
Доктор Элвин Анг получил степень доктора философии, магистра и бакалавра в NTU, Сингапур. Ранее он был главным консультантом (наука о данных), а также доцентом. Он также был адъюнкт-лектором SUSS в течение 8 лет. Его внимание и интерес сосредоточены в области науки о данных в реальном мире. Хотя по образованию он операционный исследователь, его страсть к практическим применениям перевешивает его академическое образование. Он ученый, предприниматель, а также личный/деловой консультант.
Подробнее о нем на www.AlvinAng.sg.