хотя я нашел много помощи в отношении подгонки моделей в целом, я продолжаю сталкиваться с конкретной проблемой с моими данными из-за того, как они организованы. Это из вводной книги по статистике, и предполагается, что она представляет выборочные данные об ошибках в зависимости от количества миллиграммов какого-то наркотика.
|-----|-------|-------|-------|
| 0mg | 100mg | 200mg | 300mg |
|-----|-------|-------|-------|
| 25 | 16 | 6 | 8 |
| 19 | 15 | 14 | 18 |
| 22 | 19 | 9 | 9 |
| 15 | 11 | 5 | 10 |
| 16 | 14 | 9 | 12 |
| 20 | 23 | 11 | 13 |
Данные выглядят так, как будто они падают вокруг группы C, а затем немного повышаются для D, следовательно, ищут квадратичное соответствие.
Я пробовал следующее:
scores = c(25, 19, 22, 15, 16, 20,
16, 15, 19, 11, 14, 23,
6, 14, 9, 5, 9, 11,
8, 18, 9, 10, 12, 13)
x_groups = rep(c(0,100, 200, 300), each = 6)
scores.quadratic = lm(scores ~ poly(x_groups, 2, raw = TRUE))
Затем я могу использовать функцию summary()
для просмотра результатов. Я запутался в функции lm()
и в том, как она должна соответствовать квадратичной функции. Насколько я понимаю, он возьмет каждый индекс в x_groups
и возведет его в квадрат, а затем использует линейную подгонку с этим новым вектором, но мне это не кажется правильным.
Может ли кто-нибудь дать отзыв о том, как это должно соответствовать квадратичному соотношению с моими данными, или, если это не так, пожалуйста, помогите мне понять, где я ошибаюсь.
Спасибо.
x
будет соответствоватьintercept + x + x^2 + x^3 + ... + x^n
. Следовательно, квадратное число будет соответствоватьintercept + x + x^2
, и это именно те коэффициенты, которые вы получаете на выходе вашей модели. Похоже, вы ожидали, что это будетintercept + x^2
. - person AntoniosK   schedule 09.12.2017