Здравейте хора, мина много време откакто писах статия за среда. Но сега ще се опитам да пиша по-често. Ще използвам GLM като кратка ръка за обобщен линеен модел.

Така че фокусът ми тук е да дам основна идея защо генерализираните линейни модели (GLM) станаха основният инструмент на приложните статистици. Сигурен съм, че много от нас са чували за линейна регресия, множествена линейна регресия, логистична регресия, регресия на Поасон, биномна регресия, а също и общи линейни модели. Обърнете внимание, че не е необходимо да включвам линейна регресия, множествена линейна регресия, когато използвах термина общ линеен модел, тъй като линейната регресия и множествената линейна регресия не са нищо друго освен специфичните линейни модели. Но тъй като това са по-познати термини, затова ги използвах. Обърнете внимание, че терминът общ линеен модел обикновено се отнася до конвенционални модели на линейна регресия за променлива на непрекъснат отговор, дадена на непрекъснати и/или категорични предиктори. Включва множествена линейна регресия, както и ANOVA и ANCOVA (само с фиксирани ефекти).

Едно важно нещо, което трябва да знаете, преди да влезете в GLM, е да знаете за типа отговор. И се фокусирайте върху изображението по-долу: -

Затова искам да се съсредоточите върху маркираното поле, което означава, че Yi трябва да следва нормалното разпределение. Така че ние използваме общ линеен модел главно когато: -

  1. Нашата променлива на отговор и термин за грешка следват нормалното разпределение.
  2. Връзката между отговора и обяснителната променлива е линейна.
  3. Грешките са хомоскедастични и некорелирани.
  4. Ако независимите обяснителни променливи не са корелирани.

Но в реалния живот ситуацията не винаги е нормална, нали? След това, ако ситуацията стане ненормална, имам предвид, че ако нашият отговор и грешки не са нормални, тогава какво? Можем да направим подходящи трансформации, но не можем да накараме всички предположения да удовлетворят едновременно. Има няколко други проблема, с които се сблъскваме след трансформирането на данните в Общ линеен модел, но няма да ги обсъждам тук.

Оттук „Обобщеният линеен модел (GLM) е гъвкаво обобщение на общия линеен модел, който позволява променлива на отговор, която също има модели за нормално и ненормално разпределение на грешките. Позволява линейният предиктор (напр. b0+b1*X) да бъде свързан с отговора чрез функция, която се нарича функция за връзка.

Надявам се, че дотук трябва да сте придобили основна представа защо GLM.GLM е по-широк клас от модели, при който позволява да се обработва нормален отговор и ненормални отговори, като категоричен отговор, броен отговор, пропорционален отговор и т.н. Всички тези типове от отговорите се моделират с помощта на някои известни вероятностни разпределения. И всички те споделят някои общи свойства и попадат в експоненциалното семейство. Ето вижте експоненциалното семейство: -

Ако можете да напишете вероятностно разпределение в горната форма f, тогава вашето разпределение ще принадлежи към експоненциално семейство и примерите за разпределения, принадлежащи към експоненциално семейство, са биномно, поасоново, нормално, експоненциално и т.н.

Терминът обобщен линеен модел (GLM) се отнася до по-голям клас модели и е използван от Маккълах и Нелдер. Има три важни концепции за разбиране на GLM рамката.

  1. Случаен компонент: означава вероятностното разпределение на отговора yi.
  2. Систематичен компонент: - линейна комбинация от обяснителни променливи.
  3. Функция за връзка: - определя как очакваната стойност на отговора е свързана с линейния предиктор на обяснителните променливи.

Тези модели следват предположенията по-долу.

Забележете, че Общите линейни модели са специфични GLMS, когато грешките са независими и следват нормалното разпределение. И функцията за връзка е идентичност, защото ние моделираме средното директно в случай на общи линейни модели.

Заключение:-

Моята цел тук беше да направя кратък преглед на това защо имаме нужда от GLM, когато вече има толкова много статистически алгоритми. Така че в тази статия отначало познавахме някои от известните статистически алгоритъм като линейна и множествена линейна регресия, anova, но разбрахме, че това са специфични модели от по-широк клас, наречен общ линеен модел. След това прегледахме допусканията на общите линейни модели и осъзнахме, че в реалния живот удовлетворяването на всички тези допускания едновременно е доста трудно. След това получихме кратко въведение за друг клас, наречен GLM, който може да се справи и с нашите нормални и ненормални притеснения. По-късно видяхме няколко важни концепции за разбиране на рамката на GLM и след това преглед на общите допускания, последвани от този по-голям клас модели. И в крайна сметка разбрахме, че Общите линейни модели са специфичен вид GLM.

Моля, оставете вашите отзиви и ако ви харесват, просто ръкопляскайте и споделете с хората си. Вашата оценка ще ме мотивира да пиша по-подробно по тази тема. За да разберете тази тема, ще ви предложа да прегледате препратките.

Референции:-

  1. Въведение в обобщените линейни модели, второ издание от Анет Добсън.
  2. Разширяване на линейните модели от Джулиан Фарауей.
  3. https://www.ime.usp.br/~abe/lista/pdftGzimaFtH4.pdf
  4. https://online.stat.psu.edu/stat504/lesson/6/6.1