Я пытаюсь выполнить многомерную линейную регрессию, используя Statsmodels в Python, но у меня возникла проблема с организацией данных.
Итак, набор данных по Бостону по умолчанию выглядит так:
И вывод модели линейной регрессии таков:
Мои необработанные данные разделены пробелами следующим образом:
И я смог расположить его в массиве здесь:
Кто-нибудь с большим опытом работы с Python знает, как я могу отформатировать свои данные аналогично набору данных Boston, чтобы я мог легко предварительно сформировать свою модель регрессии? Например, настроить feature_names
, которые соответствуют моим индексам данных.
Вот первые несколько строк моих необработанных данных для справки:
cycles instructions cache-references cache-misses branches branch-misses page-faults Power
62,206,703 32,245,343 611,044 95,558 5,641,681 222,594 421 6.6
77,401,927 61,320,289 822,194 98,898 10,910,837 595,585 1,392 6.1
344,672,658 271,884,884 5,371,884 1,253,294 49,628,843 2,782,476 5,392 7.6
231,536,106 173,069,386 3,239,546 325,881 31,584,329 1,777,599 4,372 7.0
212,658,828 152,965,489 3,100,104 251,128 28,182,710 1,588,984 4,285 6.8
1,222,008,914 1,254,822,100 21,562,804 647,512 228,200,750 8,455,056 5,044 15.6
932,484,581 1,132,190,670 8,591,598 507,549 196,773,155 7,610,639 7,147 12.5
241,069,403 148,143,290 3,745,890 320,577 27,384,544 1,614,852 4,325 7.4
253,961,868 195,947,891 3,399,113 331,988 36,069,348 1,980,045 4,322 7.7
142,030,480 91,300,650 2,026,211 242,980 17,269,376 1,010,190 3,651 6.5
90,317,329 51,421,629 1,309,714 146,585 9,332,184 492,279 1,511 6.2
293,537,472 224,121,684 3,964,357 379,418 41,137,776 1,981,583 3,386 7.9
Спасибо