Привет, ребята, прошло много времени с тех пор, как я написал статью о среде. Но сейчас я постараюсь писать почаще. Я буду использовать GLM как сокращенное обозначение обобщенной линейной модели.

Поэтому я хочу дать общее представление о том, почему обобщенные линейные модели (GLM) стали основным инструментом прикладных статистиков. Я уверен, что многие из нас слышали о линейной регрессии, множественной линейной регрессии, логистической регрессии, регрессии Пуассона, биномиальной регрессии, а также общих линейных моделях. Обратите внимание, что мне не нужно было включать линейную регрессию, множественную линейную регрессию, когда я использовал термин общая линейная модель, потому что линейная регрессия и множественная линейная регрессия - это не что иное, как конкретные линейные модели. Но поскольку это более привычные термины, я использовал их. Обратите внимание, что термин общая линейная модель обычно относится к стандартным моделям линейной регрессии для переменной непрерывного отклика с учетом непрерывных и / или категориальных предикторов. Он включает множественную линейную регрессию, а также ANOVA и ANCOVA (только с фиксированными эффектами).

Прежде чем переходить к GLM, важно знать тип ответа. И сосредоточьтесь на изображении ниже: -

Поэтому я хочу, чтобы вы сосредоточились на выделенном поле, что означает, что Yi должен следовать нормальному распределению. Поэтому мы используем Общую линейную модель в основном, когда: -

  1. Наша переменная ответа и член ошибки соответствуют нормальному распределению.
  2. Связь между ответом и независимой переменной линейна.
  3. Ошибки гомоскедастичны и некоррелированы.
  4. Если независимые независимые переменные не коррелированы.

Но в реальной жизни это не всегда нормально, правда? Тогда, если ситуация становится ненормальной, я имею в виду, что если наш ответ и ошибки ненормальные, то что? Мы можем сделать соответствующие преобразования, но мы не можем добиться того, чтобы все предположения выполнялись одновременно. Есть еще несколько проблем, с которыми мы сталкиваемся после преобразования данных в Общую линейную модель, но я не буду их здесь обсуждать.

Следовательно, «Обобщенная линейная модель (GLM) является гибким обобщением общей линейной модели, которая позволяет использовать переменную отклика, которая также имеет модели нормального и ненормального распределения. Это позволяет связать линейный предиктор (например, b0 + b1 * X) с ответом через функцию, которая называется функцией связи. »

Я надеюсь, что до этого момента вы должны получить общее представление о том, почему GLM.GLM представляет собой более широкий класс моделей, позволяющих обрабатывать нормальные и нестандартные ответы, такие как категориальный ответ, подсчет отклика, пропорциональный отклик и т. Д. Все эти типы ответов моделируются с использованием некоторых известных распределений вероятностей. И все они имеют некоторые общие свойства и относятся к семейству экспоненциальных. Вот посмотрите на экспоненциальную семью: -

Если вы можете записать распределение вероятностей в приведенной выше форме f, тогда ваше распределение будет принадлежать к экспоненциальному семейству, а примерами распределений, принадлежащих к экспоненциальному семейству, являются биномиальное, пуассоновское, нормальное, экспоненциальное и т. Д.

Термин обобщенная линейная модель ( GLM) относится к более широкому классу моделей и использовался МакКуллагом и Нелдером. Есть три важных концепции для понимания структуры GLM.

  1. Случайный компонент: означает распределение вероятности ответа yi.
  2. Систематический компонент: - линейная комбинация независимых переменных.
  3. Функция связи: определяет, как ожидаемое значение ответа связано с линейным предиктором независимых переменных.

Эти модели основаны на предположениях, приведенных ниже.

Обратите внимание, что общие линейные модели - это конкретные GLMS, когда ошибки независимы и подчиняются нормальному распределению. А функция связи - это идентичность, потому что мы моделируем среднее значение напрямую в случае общих линейных моделей.

Вывод: -

Моей целью здесь было дать краткий обзор того, зачем нам GLM, когда уже существует так много статистических алгоритмов. Итак, в этой статье мы сначала знали некоторые известные статистические алгоритмы, такие как линейная и множественная линейная регрессия, anova, но мы поняли, что это конкретные модели более широкого класса, называемого общей линейной моделью. Затем мы рассмотрели допущения общих линейных моделей и поняли, что в реальной жизни удовлетворить все эти допущения одновременно довольно сложно. Затем мы получили краткое введение о другом классе, называемом GLM, который также может справиться с нашими обычными и необычными заботами. Позже мы увидели несколько важных концепций для понимания структуры GLM, а затем обзор общих предположений, за которыми последовал этот более широкий класс моделей. И в конце концов мы поняли, что общие линейные модели - это особый вид GLM.

Пожалуйста, оставьте свой отзыв, и, если он вам понравился, просто хлопните и поделитесь со своими людьми. Ваша признательность побудит меня продолжить углубленное изучение этой темы. Чтобы разобраться в теме, я предлагаю вам пройтись по ссылкам.

Ссылки: -

  1. Введение в обобщенные линейные модели, второе издание Аннет Добсон.
  2. Расширение линейных моделей Джулиана Фарауэя.
  3. Https://www.ime.usp.br/~abe/lista/pdftGzimaFtH4.pdf
  4. Https://online.stat.psu.edu/stat504/lesson/6/6.1