Цель
Когда дело доходит до получения информации о бизнесе из табличных данных, на самые интересные вопросы часто нельзя ответить, используя только данные наблюдений. Эти вопросы могут быть похожи на:
- «Что произойдет, если я уменьшу вдвое цену на свой продукт?»
- «Какие клиенты оплатят свои долги, только если я им позвоню?»
Джуда Перл и его исследовательская группа за последние десятилетия разработали прочную теоретическую основу для решения этой проблемы, но первые шаги к ее слиянию с основным машинным обучением только начинаются.
Причинный граф является центральным объектом в структуре, разработанной Джуди Перлом и его исследовательской группой, но он часто неизвестен, зависит от личных знаний и предубеждений или слабо связан с доступными данными.
Цель этого проекта – конкретно подчеркнуть важность вопроса. Попробуйте выполнить следующие задачи:
- Выполните задачу причинно-следственного вывода, используя платформу Pearl.
- Выведите причинно-следственный график из данных наблюдений, а затем подтвердите график.
- Объедините машинное обучение с причинно-следственными выводами
Обзор данных
Данные, используемые для этого проекта, взяты из набора данных Рак молочной железы, штат Висконсин (диагностический) | Каггл.
Особенности в данных вычислены из оцифрованного изображения аспирата тонкой иглой (FNA) массы молочной железы.
Информация об атрибутах:
- идентификационный номер
- Диагноз (M = злокачественный, B = доброкачественный)
- Остальные (3–32)
- Для каждого клеточного ядра вычисляются десять вещественных признаков:
- радиус (среднее расстояние от центра до точек на периметре)
- текстура (стандартное отклонение значений шкалы серого)
- Периметр
- Область
- гладкость (локальное изменение длины радиуса)
- компактность (периметр²/площадь — 1,0)
- вогнутость (выраженность вогнутых участков контура)
- вогнутые точки (количество вогнутых частей контура)
- Симметрия
- фрактальная размерность («приближение береговой линии» — 1)