Мне интересно сравнить оценки из разных квантилей (один и тот же результат, одни и те же ковариаты) с использованием функции anova.rqlist
, вызываемой anova
в среде пакета quantreg
в R. Однако математика в функции выходит за рамки моего элементарного опыта. Допустим, я подобрал 3 модели в разных квантилях;
library(quantreg)
data(Mammals) # data in quantreg to be used as a useful example
fit1 <- rq(weight ~ speed + hoppers + specials, tau = .25, data = Mammals)
fit2 <- rq(weight ~ speed + hoppers + specials, tau = .5, data = Mammals)
fit3 <- rq(weight ~ speed + hoppers + specials, tau = .75, data = Mammals)
Затем я сравниваю их, используя;
anova(fit1, fit2, fit3, test="Wald", joint=FALSE)
Мой вопрос: какая из этих моделей используется в качестве основы для сравнения?
Мое понимание теста Вальда (статья в вики)
где θ^ — оценка интересующего(их) параметра(ов) θ, которая сравнивается с предлагаемым значением θ0.
Итак, мой вопрос: что функция anova
в quantreg
выбирает в качестве θ0?
Основываясь на pvalue, возвращенном из anova
, я могу предположить, что он выбирает самый низкий указанный квантиль (т.е. tau=0.25
). Есть ли способ указать медиану (tau = 0.5
) или, что еще лучше, среднюю оценку, полученную с использованием lm(y ~ x1 + x2 + x3, data)
?
anova(fit1, fit2, fit3, joint=FALSE)
на самом деле производит
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.25 0.5 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
пока
anova(fit3, fit1, fit2, joint=FALSE)
дает точно такой же результат
Quantile Regression Analysis of Deviance Table
Model: weight ~ speed + hoppers + specials
Tests of Equality of Distinct Slopes: tau in { 0.5 0.25 0.75 }
Df Resid Df F value Pr(>F)
speed 2 319 1.0379 0.35539
hoppersTRUE 2 319 4.4161 0.01283 *
specialsTRUE 2 319 1.7290 0.17911
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Порядок моделей явно меняется в анова, но как получается, что значение F и Pr(>F) одинаковы в обоих тестах?