Причинно-следствено срещу статистическо заключение

Защо корелацията не е достатъчна или корелацията е достатъчна? Въпросът, който вълнува научната общност от век. Изглед на машинното обучение по темата.

Причинно-следствените изводи или проблемът за причинно-следствената връзка като цяло получиха много внимание през последните години. Въпросът е прост, корелацията достатъчна ли е за извод? Ще кажа следното, по-информираният неинформиран човек ще изложи определен аргумент, който изглежда така:

Причинно-следствената връзка не е нищо друго освен наистина силна корелация

Мразя да ви споделям, ако това е вашето мнение, но не, не е, със сигурност не е. Виждам, че е сравнително лесно да се убедим, че е така, но щом започнем да мислим малко за това, лесно ще стигнем до осъзнаването, че не е така. Ако все още сте убедени в противното, след като прочетете тази статия, моля, свържете се с мен за по-нататъшно обсъждане, защото ще се интересувам от вашата мисъл.

За да илюстрираме идеята, че корелацията не означава непременно причинно-следствена връзка, нека да разгледаме най-простата формула на корелация или по-скоро известния корелационен коефициент на Пиърсън:

Така че този коефициент на корелация е в диапазона от -1 до 1, което ни казва дали променливите са отрицателно или положително корелирани. С други думи, когато едното е над средната си стойност, а другото е съответно над или под средната си стойност. Този коефициент на корелация е кръстен на известния математик Карл Пиърсън, на когото дължим много. Хората твърдят, че той е основателят на съвременната статистика, той също така въвежда първия университетски статистически отдел в света в University College London. Благодаря ви, професор Пиърсън. Но има едно нещо, от което не беше много запален, и това е аргументът за причинно-следствената връзка.

Забележете, че веднага има проблем с корелационната формула, който е, че няма никакво усещане за посока. Въпреки че две променливи могат да бъдат силно свързани помежду си, ние всъщност не знаем какво е причинило какво. За да ви дам пример, вземете времето. Ако вали, със сигурност имате облаци. Естествено си задавате въпроса какво е причинило дъжда. Вземете корелацията между дъжд и облаци, забелязвате, че има положителна корелация. Хубаво, но какво от това? Можете ли наистина да кажете, че облаците са причинили дъжда, а не дъждът е причинил облаците? Не, не можете, не въз основа на този прост коефициент на корелация. Може би ще забележите едно нещо, очевидно облаците се появяват преди дъжда. Тогава ще разберете, но изчакайте, ако въведа времеви аспект към моите променливи и изчисля нещо като закъсняла корелация, тогава трябва да разбера, че облаците причиняват дъжд, а не обратното. Това е вярно, но това ме води до следващия ми аргумент.

Проблемът с зависимите от шоколад носители на Нобелова награда

Има едно известно проучване, което показва, че има силна връзка между консумацията на шоколад в дадена страна и броя на носителите на Нобелова награда, идващи от тази страна. Така че бихте ли казали, че консумацията на шоколад води до по-голяма вероятност човек да стане носител на Нобелова награда и веднага да започнете да консумирате шоколад като луд? Надявам се, че не, подозирам, че е разумно да се очаква, че шоколадът не е причина човек да бъде носител на Нобелова награда. Нека извлечем две променливи от това твърдение. B— Да бъдеш носител на Нобелова награда, A— да консумираш шоколад. Причинно-следствената диаграма за това твърдение би изглеждала основно така:

Стрелката означава, че А причинява Б. Както можете да видите, това е много примитивна причинно-следствена диаграма. Сега можем да стигнем до въпроса, въпреки че имаме силна връзка между консумацията на шоколад и спечелването на Нобелова награда, можем да се запитаме има ли някаква друга променлива, C, като богатството на страната, която причинява както спечелването на Нобелова награда, така и консумацията на шоколад, или дали образователната система на страната причинява и двете и т.н. Нека си представим, както наистина е случаят, че има обща причина C и за двете. Тогава причинно-следствената диаграма изглежда така:

Сега можем да споменем принципа на общата причина на Райхенбах, който гласи, че ако променливите A и B имат обща причина, C, тогава, когато обуславяме C, корелацията между тези променливи се изтрива, което означава, че условните разпределения на случайните променливи, обуславящи общата кауза става независима. Достатъчно хубаво. Така че всъщност причинно-следствената диаграма, която трябва да разгледаме, е следната:

Ето какво представлява причинно-следствената връзка, установявайки, че няма обща причина, която да кара А и Б да изглеждат така, сякаш А причинява Б. Тази практика е добре установена в медицинската общност под формата на медицински изпитания, много преди хората започна да говори за причинно-следствени изводи. И така, как да установим това? Първо, ще наречем медицински опит с по-общо, полезно име. Ще го наречем контролиран експеримент. Контролираните експерименти са хубави, можем да действаме директно върху променлива и да видим как другите ни променливи се променят в нашата причинно-следствена диаграма. В медицинско изпитване това би било вземане на групи от хора 1 и 2, 1 група 1, приемаща плацебо, а група 2, приемаща действителното лекарство за заболяването и наблюдаване на резултатите. Естествено, в медицинските изпитвания искаме тези хора да идват от едно и също разпределение, т.е. да бъдат подобни. Всъщност, в идеалния случай искаме те да са еднакви, това би било перфектното медицинско изпитание, което би елиминирало всички други потенциални общи причини, но това е нереалистично да се очаква, перфектен контролиран експеримент. Сега наблюдавате резултатите от групите и определяте въз основа на известна увереност дали лекарството е ефикасно при лечението на болестта.

На каузален език това се наричанамеса. Ако можем да вземем променлива и да я зададем ръчно на стойност, без да променяме нищо друго. Това всъщност означава, че приемаме едни и същи хора, преди да приложим плацебото и лекарството, а след това прилагаме и двете, за да видим дали болестта е излекувана от лекарството или нещо друго. Като цяло хората намират за трудно да направят разлика между интервенция и определяне на вероятността за реализация на събитието на 1. Разликата е, че интервенцията води до две различни причинно-следствени диаграми, на които можем да изчислим нашите вероятности и да стигнем до заключение относно действителната причинно-следствена структура на диаграма.

За щастие трябва да благодарим на проф. Джудея Пърл за изобретяването на каузалното смятане, за което той получи престижната награда Тюринг и вероятно ще бъде известен по-нататък като основател на съвременните каузални изводи. Бих предложил да прочетете неговите книги за причинно-следствената връзка, за да се гмурнете по-дълбоко в темата:

1. Книгата защо

2. Причинност: Модели, разсъждения и изводи

3. Причинно-следствени изводи в статистиката: Учебник

Аз лично смятам, че първият е добър за широката публика, тъй като също така дава добър поглед върху историята на статистиката и причинно-следствената връзка и след това навлиза малко повече в теорията зад причинно-следствените изводи.

Досега говорихме за малко статистика, но остава въпросът как това всъщност се отразява на AI алгоритмите, тоест алгоритмите за машинно обучение. Връзката е доста ясна. Настоящите подходи, които използваме, не могат да разграничат причината от следствието чрез учене от данните, тъй като най-вече говорим за вероятностни разпределения в машинно обучение и модели на обучение, които основно виждат, че нещата се случват по едно и също време и автоматично приемат, че едното предсказва другото. Лично аз не мога да си представя, че тези модели могат или ще бъдат внедрени безопасно в реалния свят. Особено в случай, че искаме да развием нещо като изкуствения учен на Schmidhueber, трябва да можем да правим разлика между причина и следствие и причина за тях.

В науката ние постоянно трябва да приемаме или отхвърляме хипотези, за да стигнем до заключения. Ето защо причинно-следственото заключение не е просто добре да имаме, то е необходимост, ако искаме да стигнем до валидни заключения. Има безброй примери, при които са правени проучвания, които са довели до неверни заключения като следствие от невъзможността да се използват правилно статистиките, както е показано в тази статия или това. Убеден съм, че областта ще предизвика научен ренесанс в общността. Като извод от тази статия, запомнете следното, което се надяваме вече знаете:

Корелацията не предполага причинно-следствена връзка

До следващия път!