Обективен

Когато става въпрос за получаване на бизнес прозрения от таблични данни, най-интересните въпроси често не могат да бъдат отговорени само с данни от наблюдения. Тези въпроси могат да бъдат подобни на:

  • „Какво ще стане, ако намаля наполовина цената на моя продукт?“
  • „Кои клиенти ще си платят задълженията само ако им се обадя?“

Джудея Пърл и неговата изследователска група са разработили през последните десетилетия солидна теоретична рамка за справяне с това, но първите стъпки към обединяването й с основното машинно обучение тепърва започват.

Причинно-следствената графика е централен обект в рамката, разработена от Джудея Пърл и неговата изследователска група, но често е неизвестна, подлежи на лични познания и пристрастия или е слабо свързана с наличните данни.

Целта на този проект е да подчертае важността на въпроса по конкретен начин. Опитайте се да изпълните следните задачи:

  1. Изпълнете задача за причинно-следствени изводи, като използвате рамката на Pearl
  2. Изведете причинно-следствената графика от данни от наблюдения и след това валидирайте графиката
  3. Обединете машинното обучение с причинно-следствените изводи

Преглед на данните

Данните, използвани за този проект, са взети от Набор от данни за рака на гърдата в Уисконсин (диагностика) | Kaggle.

Характеристиките в данните са изчислени от дигитализирано изображение на аспирация с тънка игла (FNA) на гръдна маса.

Информация за атрибута:

  1. Идентификационен номер
  2. Диагноза (M = злокачествено, B = доброкачествено)
  3. Останалите (3–32)
  4. Десет характеристики с реална стойност се изчисляват за всяко клетъчно ядро:
  5. радиус (средно на разстоянията от центъра до точките по периметъра)
  6. текстура (стандартно отклонение на стойностите в сивата скала)
  7. Периметър
  8. ■ площ
  9. гладкост (локални вариации в дължините на радиуса)
  10. компактност (периметър² / площ — 1,0)
  11. вдлъбнатина (тежест на вдлъбнати части от контура)
  12. вдлъбнати точки (брой вдлъбнати части от контура)
  13. Симетрия
  14. фрактално измерение („приближение на бреговата линия“ — 1)