кой е най-добрият начин за правене на линейни диаграми година след година с ежедневни данни в боке?
в момента добавям дата (произволно за 2016 г.) и колона за година към първоначалната рамка с данни на дневните стойности. След това преминаване към широки данни по години, попълване на NA (липсващите данни варират през годините) и след това изграждане на боке графика ред по ред през колоните за годината:
Да кажем, че имам таблица с данни за три години:
Колона: Дата и стойност
df = df.set_index('Date')
df['dateline'] = df.index.to_series().dt.strftime('%d-%b-2016')
df['year'] = df.index.to_series().dt.strftime('%Y')
pv = pd.pivot_table(df, index=df['dateline'], columns=df.index.year,
values='value', aggfunc='sum')
pv.index = pd.to_datetime(pv.index, format = '%d-%b-%Y' )
pv.sort_index(inplace=True)
pv = pv.apply(lambda x: x.fillna(method = 'ffill' , limit = 4))
p.line(x= pv.index , y = pv[2017], line_width=1.5, line_color = "red" ,legend = '2017')
p.line(x= pv.index , y = pv[2016], line_width=1.5, line_color = "blue" ,legend = '2016')
p.line(x= pv.index , y = pv[2015], line_width=1.5, line_color = "green" , legend = '2015')
p.line(x= pv.index , y = pv[2014], line_width=1.5, line_color = "orange" ,legend = '2014')
Въпросът, който имам, е може ли това да бъде допълнително оптимизирано? Бих искал да използвам задържане на мишката в бъдеще, така че каква би била най-добрата настройка? Следващата стъпка ще бъде колона за цикли през годините, но трябва ли да вървя по този път?
Идвайки от R, бих искал да запазя данните в дълъг формат и да направя нещо като:
p.line(df, x='dateline' , y = 'value' , color = 'year')
Благодаря за съветите