Проблемы корреляции с двумя переменными WITH NA

У меня есть две переменные, и я хочу знать, связаны ли они между собой, я распределил их следующим образом:

X = 14,15,16,18,12,13,14,15 Y = NA, 13,12, NA, NA, 16,16, NA   И когда через cor(X, Y) NA


person Claudia    schedule 17.04.2017    source источник
comment
Вы знаете, что X имеет 8 элементов, а Y только 6?   -  person Tim Biegeleisen    schedule 17.04.2017
comment
Извините, это NA, 13,12, NA, NA, 16, 16, NA   -  person Claudia    schedule 17.04.2017


Ответы (1)


Если вы можете пропустить все точки, для которых NA появляется хотя бы в одной из X или Y, вы можете вызвать cor() с опцией use='complete.obs':

X <- c(14, 15, 16, 18, 12, 13, 14, 15)
Y <- c(NA, 13, 12, NA, NA, 16, 16, NA)

cor(X, Y, use='complete.obs', method='pearson')
[1] -0.9393364

Вы можете сами убедиться, что приведенный выше результат такой же, как и при использовании:

X <- c(15, 16, 13, 14)
Y <- c(13, 12, 16, 16)
cor(X, Y, method='pearson')

то есть просто отбрасывая те точки данных, для которых либо X, либо Y имеют значение NA.

person Tim Biegeleisen    schedule 17.04.2017