Excel дает странные вычисления R-квадрата?

Это действительно странно. Я рассчитываю значения R^2 с помощью Excel двумя разными способами, и результаты сильно различаются. Почему?

1) Сначала я использую Excel для построения линейной регрессии с помощью графика и использую функцию правой кнопки мыши «Добавить линию тренда ...», чтобы указать Intercept = 0. Значение R-квадрата показывает -3,253. Уравнение регрессии Y = -0,1321 * X

2) Затем я использую Excel для линейной регрессии с помощью функции ЛИНЕЙН. Я выделяю строки 5x2 и в верхней левой ячейке набираю «=LINEST ([вектор Y]; [вектор X], FALSE, TRUE). False означает, что точка пересечения равна 0, а True означает, что Excel должен печатать дополнительную статистику регрессии. информации. Затем я нажимаю CTRL + SHIFT + Enter. Это покажет мне дополнительную статистику, такую ​​как значение R ^ 2 в третьей левой ячейке. Получается 0,11166. Уравнение регрессии: Y = -0,1321 * X

Мой вопрос; что я делаю неправильно при расчете R ^ 2 с графиком? Python и statsmodels.api подтверждают, что R^2 равно 0,11166, а регрессионное уравнение Y = -0,1321 * X.

Y = 
0.0291970802919708
0.141801551718973
0.145668034655723
0.0691229530946433
0.0431577486597426
0.133618351873374

X = 
-0.35551988
-0.20577599
0.10780785
-0.25028796
-0.42762184
0.02442197

person Orvar Korvar    schedule 26.06.2017    source источник
comment
Кажется, что это старый баг. R^2, сгенерированный точечной диаграммой, неверен, когда точка пересечения равна 0. Вот статья базы знаний об этой проблеме: support.microsoft.com/en-us/help/829249/< /а>   -  person Jiří Pešík    schedule 26.06.2017


Ответы (1)


Ваш расчет правильный. Точечная диаграмма не возвращает правильный R ^ 2, когда точка пересечения равна 0. Это формула для R ^ 2

Формула R^2

куда

Формула SСтот

Если вы используете стандартную модель регрессии, вы используете среднее значение y как y̅. Но когда вы предполагаете, что точка пересечения равна 0, вам нужно установить y̅ как ноль. Если вы используете среднее значение y вместо нуля, вы получите R^2 = -3,252767.

Расчет можно посмотреть здесь. Неправильный столбец SStot использует среднее значение y как y̅. Тогда значение R^2 равно -3,252767. Если вы используете 0 (как я сделал в правом столбце SStot), вы получите 0,111.

введите здесь описание изображения

Это старая ошибка, описанная Microsoft здесь: https://support.microsoft.com/en-us/help/829249/you-will-receive-an-incorrect-r-squared-value-in-the-chart-tool-in-excel-2003 Вам нужно использовать функцию ЛИНЕЙН, чтобы получить правильное значение R^2.

person Jiří Pešík    schedule 27.06.2017