Интересувам се от сравняване на оценки от различни квантили (един и същ резултат, същите ковариати), използвайки anova.rqlist
функция, извикана от anova
в средата на пакета quantreg
в R. Въпреки това математиката във функцията е отвъд елементарния ми опит. Да кажем, че пасвам на 3 модела в различни квантили;
library(quantreg)
data(Mammals) # data in quantreg to be used as a useful example
fit1 <- rq(weight ~ speed + hoppers + specials, tau = .25, data = Mammals)
fit2 <- rq(weight ~ speed + hoppers + specials, tau = .5, data = Mammals)
fit3 <- rq(weight ~ speed + hoppers + specials, tau = .75, data = Mammals)
След това ги сравнявам с помощта на;
anova(fit1, fit2, fit3, test="Wald", joint=FALSE)
Въпросът ми е кой от тези модели се използва като база за сравнение?
Моето разбиране за теста на Wald (wiki запис)
където θ^ е оценката на параметъра(ите) от интерес θ, който се сравнява с предложената стойност θ0.
Въпросът ми е какво е функцията anova
в quantreg
, която избира като θ0?
Въз основа на pvalue, върната от anova
, моето най-добро предположение е, че той избира най-ниския зададен квантил (т.е. tau=0.25
). Има ли начин да се посочи медианата (tau = 0.5
) или още по-добре средната оценка, получена с помощта на lm(y ~ x1 + x2 + x3, data)
?
anova(fit1, fit2, fit3, joint=FALSE)
всъщност произвежда
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.25 0.5 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
докато
anova(fit3, fit1, fit2, joint=FALSE)
дава точно същия резултат
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.5 0.25 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Редът на моделите очевидно се променя в anova, но как F стойността и Pr(>F) са идентични и в двата теста?