Разбиране на големите езикови модели: Физиката на (чат)GPT и BERT

Прозрения от физик за това как частиците и силите могат да ни помогнат да разберем LLM.

ChatGPT или по-общо казано, Large Language AI Models (LLM) са станали повсеместни в живота ни. И все пак повечето от математиката и вътрешните структури на LLMs са неясни знания за широката публика.

И така, как можем да преминем отвъд възприемането на LLM като ChatGPT като магически черни кутии? Физиката може да даде отговор.

Всеки е донякъде запознат с нашия физически свят. Предмети като автомобили, маси и планети са съставени от трилиони атоми, управлявани от прост набор от физически закони. По подобен начин се появиха сложни организми, като ChatGPT, които са способни да генерират изключително сложни концепции като изкуства и науки.

Оказва се, че уравненията на градивните елементи на LLM са аналогични на нашите физически закони. Така че като разберем как сложността произтича от нашите прости физични закони, може да сме в състояние да хвърлим известна представа за това как и защо LLM работят.

Сложност от простота

Нашият свят по своята същност е сложен, но може да бъде описан чрез забележително малък брой фундаментални взаимодействия. Например сложните снежинки и мехурчетата могат да бъдат свързани с прости сили на привличане между молекулите.

И така, какво е общото в това как възникват сложните структури? Във физиката сложността се генерира, когато намаляваме от най-малкия до най-големия мащаб.

Правейки аналогия с езика, английският започва със скромен брой основни съставни части - 26 азбуки. Тези символи могат да се комбинират, за да образуват около 100 000 използваеми думи, всяка от които носи отличително значение. От тези думи могат да се генерират безброй изречения, пасажи, книги и томове.

Тази лингвистична йерархия е подобна на тази, открита във физиката. Нашият настоящ фундаментален закон („Стандартният модел“) започва с ограничен брой елементарни частици като кварки и електрони, заедно с...

Разбиране на големите езикови модели: Физиката на (чат)GPT и BERT

Прозрения от физик за това как частиците и силите могат да ни помогнат да разберем LLM.

Сложност от простота

Подобни въпроси