Цель

Когда дело доходит до получения информации о бизнесе из табличных данных, на самые интересные вопросы часто нельзя ответить, используя только данные наблюдений. Эти вопросы могут быть похожи на:

  • «Что произойдет, если я уменьшу вдвое цену на свой продукт?»
  • «Какие клиенты оплатят свои долги, только если я им позвоню?»

Джуда Перл и его исследовательская группа за последние десятилетия разработали прочную теоретическую основу для решения этой проблемы, но первые шаги к ее слиянию с основным машинным обучением только начинаются.

Причинный граф является центральным объектом в структуре, разработанной Джуди Перлом и его исследовательской группой, но он часто неизвестен, зависит от личных знаний и предубеждений или слабо связан с доступными данными.

Цель этого проекта – конкретно подчеркнуть важность вопроса. Попробуйте выполнить следующие задачи:

  1. Выполните задачу причинно-следственного вывода, используя платформу Pearl.
  2. Выведите причинно-следственный график из данных наблюдений, а затем подтвердите график.
  3. Объедините машинное обучение с причинно-следственными выводами

Обзор данных

Данные, используемые для этого проекта, взяты из набора данных Рак молочной железы, штат Висконсин (диагностический) | Каггл.

Особенности в данных вычислены из оцифрованного изображения аспирата тонкой иглой (FNA) массы молочной железы.

Информация об атрибутах:

  1. идентификационный номер
  2. Диагноз (M = злокачественный, B = доброкачественный)
  3. Остальные (3–32)
  4. Для каждого клеточного ядра вычисляются десять вещественных признаков:
  5. радиус (среднее расстояние от центра до точек на периметре)
  6. текстура (стандартное отклонение значений шкалы серого)
  7. Периметр
  8. Область
  9. гладкость (локальное изменение длины радиуса)
  10. компактность (периметр²/площадь — 1,0)
  11. вогнутость (выраженность вогнутых участков контура)
  12. вогнутые точки (количество вогнутых частей контура)
  13. Симметрия
  14. фрактальная размерность («приближение береговой линии» — 1)