Работа с двумя наборами данных панелей с одинаковыми датами

Я пытаюсь управлять двумя наборами данных, заполненными:

  • 728 строк и 365 столбцов. Данные представляют собой среднесуточные температуры, измеряемые каждый день в году.
  • 938 строк и 365 столбцов. Данные представляют собой среднесуточные температуры, измеряемые каждый день в году.

Набор данных 1 выглядит так

FUA_CODE               01-01-2018   02-01-2018 ...

IT001L1  --> Milano     290.02020    289.1114   ...
IT002L3  --> Roma       281.20203    288.1235   ...
IT003L4  --> Napoli     287.03030    287.3121   ...
...

Набор данных 2 выглядит так

URAU_CODE     FUA_CODE                         01-01-2018   02-01-2018 ...

IT001C1       IT001L1 --> Milano                  A             B       ...
IT002C1       IT001L1 --> town outside Milano    ...           ...      ...
IT003C1       IT001L1 --> town2 outside Milano   ...           ...       ...
IT004C1       IT002L3 --> Roma                    C             D
IT005C1       IT002L3 --> town outside Roma      ...           ...
IT006C1       IT002L3 --> town2 outside Roma     ...           ...
IT007C1       IT003L4 --> Napoli                  E             F
IT008C1       IT003L4 --> town outside Napoli    ...           ...
IT009C1       IT003L4 --> town2 outside Napoli   ...           ...
              ...

Моя задача - объединить эти два набора данных и рассчитать для каждого дня разницу между температурами одного города (например, Милана) и температур того же города в другом наборе данных.

В идеале результат должен выглядеть так

FUA_CODE                   01-01-2018        02-01-2018      ...

IT001L1  --> Milano     290.02020  -  A       289.1114 - B   ...
IT002L3  --> Roma       281.20203  -  C       288.1235 - D   ...
IT003L4  --> Napoli     287.03030  -  E       287.3121 - F   ...
...

Какие функции я могу использовать?

Большое спасибо


person nflore    schedule 30.10.2020    source источник
comment
Пожалуйста, добавьте данные, используя dput или что-нибудь, что мы можем скопировать и использовать. Прочтите о как задать хороший вопрос и как привести воспроизводимый пример.   -  person Ronak Shah    schedule 30.10.2020


Ответы (1)


вы можете сначала присоединиться к df, а затем использовать summarise для вычисления значения.

вы можете увидеть здесь, чтобы присоединиться к фрейму данных, и здесь, чтобы рассчитать его

person jolii    schedule 30.10.2020
comment
Хорошо спасибо. Наконец, как мне преодолеть тот факт, что во втором наборе данных больше людей с тем же кодом? Когда я использую summarise, я просто хочу вычесть Милан с Миланом, а не Милан со всеми городами с одним и тем же кодом. - person nflore; 02.11.2020
comment
Я думаю, вам следует сделать еще 1 столбец в качестве идентификатора и извлечь IT001L1 --> Milano из fua_code столбца. а затем вы можете использовать group_by и summarise - person jolii; 03.11.2020