Я очень новичок в кодировании (это первый код, который я пишу).
У меня есть несколько CSV-файлов с одинаковыми заголовками. Файлы соответствуют почасовой концентрации озона на каждый день года, и каждый файл представляет собой отдельный год [диапазон с 2009 по 2020 год]. У меня есть столбец «дата», который содержит год-месяц-день, и у меня есть столбец для часа дня (0-23). Я хочу отделить год от дня месяца, объединить час с днем месяца и сделать это индексом, а затем объединить другие файлы csv в один фрейм данных.
Кроме того, мне нужно усреднять значения данных за каждый день в каждый час за все 10 лет, однако три моих файла включают високосные дни (дополнительные 24 значения). Я был бы признателен за любые советы о том, как учитывать високосные годы. Я предполагаю, что мне нужно будет добавить високосный день в файлы без него, затем указать нулевые значения, а затем удалить нулевые значения (но это кажется круговым).
Кроме того, если у вас есть какие-либо советы о том, как упростить мой процесс, не стесняйтесь поделиться!
Заранее спасибо за помощь.
Обновление. Я воспользовался приведенным ниже советом Rookie, но после импорта данных в формате CSV я получаю сообщение об ошибке:
import pandas as pd
import os
path = "C:/Users/heath/Documents/ARB project Spring2020/ozone/SJV/SKNP"
df = pd.DataFrame()
for file in os.listdir(path):
df_temp = pd.read_csv(os.path.join(path, file))
df = pd.concat((df, df_temp), axis = 0)
Сначала я получаю сообщение об ошибке OSError: Initializing from file failed
. Я попытался решить проблему, добавив engine = 'python'
по совету OSError : Ошибка инициализации из файла в CSV в Pandas, но теперь я получаю PermissionError: [Errno 13] Permission denied: 'C:/Users/heath/Documents/ARB project Spring2020/ozone/SJV/SKNP\\.ipynb_checkpoints'
Пожалуйста, помогите, я не знаю, что еще делать. Я отредактировал разрешение, чтобы у всех был доступ для чтения и записи. Однако у меня все еще была ошибка «отказано в доступе», когда я импортировал csv в Windows.