Въпреки че интересите на носителя на наградата на Тюринг и пионера на обратното разпространение Джефри Хинтън до голяма степен се насочиха към неконтролирано учене, той наскоро беше съавтор на статия, която връща поглед назад към обратното разпространение и изследва неговия потенциал да допринесе за разбирането как човешкият кортекс учи.

Хинтън и екип от изследователи от DeepMind, Университетския колеж в Лондон и Оксфордския университет публикуваха статията миналия петък в Nature Reviews Neuroscience. Тяхната основна идея е, че биологичните мозъци могат да изчислят ефективни синаптични актуализации, като използват връзки за обратна връзка, за да индуцират невронни дейности, чиито локално изчислени разлики кодират сигнали за грешка, подобни на обратното разпространение.

Обратното разпространение на грешки, или backprop, е широко използван алгоритъм в обучението на изкуствени невронни мрежи, използвайки градиентно спускане за контролирано обучение. Основите на непрекъснатото обратно разпространение бяха предложени през 60-те години на миналия век, а през 1986 г. документ Nature, чийто съавтор е Хинтън, показа експериментално, че обратното разпространение може да генерира полезни вътрешни представяния за невронни мрежи.

Въвеждането на обратното разпространение също предизвика вълнение в общността на невронауките, където се разглеждаше като възможен източник на прозрение за разбирането на процеса на обучение в кората. Как кортексът модифицира синапсите, за да подобри работата на многостепенните мрежи, остава една от най-големите мистерии в неврологията.

Въпреки че знаем, че човешкият мозък се учи чрез модифициране на синаптичните връзки между невроните, синапсите в кората са вградени в многопластови мрежи, което затруднява определянето на ефекта от отделна синаптична модификация върху поведението на системата. В изкуствените невронни мрежи backprop се опитва да реши този проблем, като изчислява как леки промени в силата на всеки синапс променят процента на грешка в мрежата, използвайки верижното правило на смятането.

Уместността на обратното разпространение към кората обаче беше под съмнение от известно време. Методът се разглежда като биологично проблематичен, както е класически описан в обстановката за контролирано обучение, докато се смята, че мозъкът учи главно по неконтролиран начин и изглежда използва своите връзки за обратна връзка за различни цели. Освен това, десетилетия след като беше предложено за първи път, обратното разпространение все още не успя да доведе до наистина впечатляваща производителност в изкуствени системи.

Backprop се завърна през 2010 г., като допринесе за бързия напредък при неконтролирани учебни проблеми като генериране на изображения и реч, езиково моделиране и други задачи за прогнозиране. Комбинирането на backprop с подсилващо обучение също даде възможност за значителен напредък в решаването на проблеми с контрола, като овладяване на игри Atari и побеждаване на топ професионалисти в игри като Go и покер.

Успехите на изкуствените невронни мрежи през последното десетилетие, заедно с развитието на невронауките, възродиха интереса към това дали обратното разпространение може да предложи прозрения за разбиране на ученето в кората. Новият документ предполага, че мозъкът има капацитета да прилага основните принципи, лежащи в основата на backprop, въпреки очевидните разлики между мозъците и изкуствените невронни мрежи.

Изследователите въведоха представяне на невронния градиент чрез разлики в активността (NGRAD), които те определят като механизми за обучение, които използват разликите в състоянията на активност, за да стимулират синаптичните промени.

За да функционират в невронни вериги, NGRADs трябва да могат да координират взаимодействията между пътищата за предаване и обратна връзка, да изчисляват разликите между моделите на невронни дейности и да използват тези разлики, за да правят подходящи синаптични актуализации. Въпреки че все още не е ясно как биологичните вериги могат да поддържат тези операции, изследователите казват, че последните емпирични проучвания представят разширяващ се набор от потенциални решения за тези изисквания за внедряване.

Рамката NGRAD демонстрира, че е възможно да се възприемат основните принципи на обратното разпространение, като същевременно се заобиколят много от проблемните изисквания за изпълнение. И въпреки че изследователите се съсредоточиха върху кората, тъй като много от нейните архитектурни характеристики наподобяват тези на дълбоки мрежи, те вярват, че NGRADs могат да бъдат от значение за всяка мозъчна верига, която включва както връзка с предаване, така и връзка с обратна връзка.

Все още липсват много части, които биха свързали здраво опората с обучението в мозъка. Независимо от това, ситуацията сега е много обратна от преди десетилетия, когато се смяташе, че невронауката няма какво да научи от опората. Сега, смятат изследователите, ученето чрез следване на градиента на мярка за ефективност може да работи много добре в дълбоки невронни мрежи: „Следователно изглежда вероятно бавната еволюция на хилядите гени, които контролират мозъка, да благоприятства приближаването възможно най-близо до изчисляване на градиентите, които са необходими за ефективно обучение на трилионите синапси, които съдържа.

Статията Обратното разпространение и мозъкът е достъпна на Nature Reviews Neuroscience. Първият автор е Тимъти П. Лиликрап, а изследователският екип включва още Адам Санторо, Люк Марис и Колин Дж. Акерман.

Журналист: Юан Юан | Редактор: Майкъл Саразен

Мислите да допринесете за Synced Review? Новата колона на SyncedСподелете моите изследванияприветства учените да споделят собствените си научни постижения с глобални ентусиасти на AI.

Знаем, че не искате да пропуснете никоя история.Абонирайте се за нашия популярен Synced Global AI Weekly за да получавате седмични актуализации за AI.

Нуждаете се от изчерпателен преглед на миналото, настоящето и бъдещето на съвременното научноизследователско развитие на ИИ? „Докладът за тенденциите в развитието на технологиите за изкуствен интелект“излезе!

2018 Fortune Global 500 Public Company AI Adaptivity Reportизлезе!
Купете форматиран на Kindle отчет на Amazon.
Кандидатствайте за „Партньорска програма Insight“, за да получите безплатен пълен PDF отчет.