Как интерпретировать результаты Google Cloud ML Prediction?

Я проработал пример GC ML Census Wide & Deep Learning https://github.com/GoogleCloudPlatform/cloudml-samples/tree/master/census

Учитывая данные переписи о человеке, такие как возраст, пол, образование и род занятий (характеристики), эта модель DNNLinearCombinedClassifier должна предсказывать, зарабатывает ли человек более 50 000 долларов в год (целевой ярлык).

Я запустил онлайн-прогноз gcloud ml-engine predict --model census --version v1 --json-instances ../test.json

используя данные test.json {"age": 25, "workclass": " Private", "education": " 11th", "education_num": 7, "marital_status": " Never-married", "occupation": " Machine-op-inspct", "relationship": " Own-child", "race": " Black", "gender": " Male", "capital_gain": 0, "capital_loss": 0, "hours_per_week": 40, "native_country": " United-States"}

Я получаю следующий результат: {"probabilities": [0.9962924122810364, 0.003707568161189556], "logits": [-5.593664646148682], "classes": 0, "logistic": [0.003707568161189556]}

Как мне это интерпретировать? мое текущее понимание состоит в том, что логит является обратной функцией активации сигмовидной двоичной классификации в выходном слое (не знаю, что означают выходные числа) и что classes: 0 относится к двоичной классификации ‹ 50 000 долларов США, а не 1 (> = 50 000 долларов США)


person Josh Reuben    schedule 16.03.2017    source источник


Ответы (1)


Верный.

  • вероятности: вероятности ‹ 50 000 долл. США против >= 50 000 долл. США.
  • classes: прогнозируемый класс (0, т. е. ‹ 50 000 долл. США)
  • логики: ln(p/(1-p)) = ln(0,00371/(1-.00371)) = -5,593
  • логистика: 1/(1+exp(-logit)) = 1/(1+exp(5,593)) = 0,0037
person rhaertel80    schedule 16.03.2017
comment
Как выбираются метки классов? Основано ли это на индексах меток классов, определенных в списке LABELS? - person Fayaz Ahmed; 25.05.2017
comment
@FayazAhmed Это правильно. Таким образом, LABELS[classes] дает вам метку строки. - person rhaertel80; 26.05.2017