Това е моят набор от данни, където имам различни държави, различни модели за различните държави, години и цена и обем.
data_dic = {
"Country" : [1,1,1,1,2,2,2,2],
"Model" : ["A","B","B","A","A","B","B","A"],
"Year": [2005,2005,2020,2020,2005,2005,2020,2020],
"Price" : [100,172,852,953,350,452,658,896],
"Volume" : [4,8,9,10,12,6,8,9]
}
Country Model Year Price Volume
0 1 A 2005 100 4
4 2 A 2005 350 12
3 1 A 2020 953 10
7 2 A 2020 896 9
1 1 B 2005 172 8
5 2 B 2005 452 6
2 1 B 2020 852 9
6 2 B 2020 658 8
Бих искал да получа следното, където 1) колона Division_Price е разделението на цената за държава 1 от модел A между 2005 г. и 2020 г. и 2) колона Division_Volume е разделението на обема за държава 1 от модел A между 2005 г. и 2005 г. 2020 г.
data_dic2 = {
"Country" : [1,1,1,1,2,2,2,2],
"Model" : ["A","B","B","A","A","B","B","A"],
"Year": [2005,2005,2020,2020,2005,2005,2020,2020],
"Price" : [100,172,852,953,350,452,658,896],
"Volume" : [4,8,9,10,12,6,8,9],
"Division_Price": [0.953,4.95,4.95,0.953,2.56,1.45,1.45,2.56],
"Division_Volume": [2.5,1.125,1.125,2.5,1,1.33,1.33,1],
}
print(data_dic2)
Country Model Year Price Volume Division_Price Division_Volume
0 1 A 2005 100 4 0.953 2.500
4 2 A 2005 350 12 2.560 1.000
3 1 A 2020 953 10 0.953 2.500
7 2 A 2020 896 9 2.560 1.000
1 1 B 2005 172 8 4.950 1.125
5 2 B 2005 452 6 1.450 1.330
2 1 B 2020 852 9 4.950 1.125
6 2 B 2020 658 8 1.450 1.330
Целият ми набор от данни има до 50 държави и имам до 10 модела с години, вариращи от 1990 до 2030 г. Все още не съм сигурен как да отчета множеството условия на три колони, така че да мога да разделя автоматично колоната Цена и Обем въз основа на три условия (т.е. държава, година и модели)?
Благодаря !
0.953
няма ли да е9.530
? - person Cyttorak   schedule 25.02.2021