Я пытаюсь собрать все файлы CSV в один HDF5 и импортировать их как набор данных в подгруппу ds1. Я пробовал следующий код, но я не получаю то, что хочу:
import h5py
import numpy.random
import os
import glob
import pandas as pd
os.chdir("/root/Desktop/file/data/dataset/ds1")
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
#combine all files in the list
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames ])
#export to csv
combined_csv.to_csv( "combined_csv.csv", index=False, encoding='utf-8-sig')
#Create a HDF5 file
xxx3 = "xxx3.h5py";
xxx3 = h5py.File(xxx3, "w");
file=pd.HDFStore('/root/Desktop/file/data/dataset/ds1','w')
IR= xxx3.create_group("/root/Desktop/file/data/dataset/ds1");
XAFS = xxx3.create_group("/root/Desktop/file/data/dataset/ds2");
combined_csv.csv=pd.read_csv('/root/Desktop/file/data/dataset/ds1combined_csv.csv')
file.put('combined_csv.csv',combined_csv.csv,format='table',data_columns=True)
xxx3.close()
pandas
, поэтому не могу комментировать этот код. Было бы проще (IMHP) читать файлы CSV с помощьюgenfromtxt()
NumPy и загружать созданные массивы непосредственно в HDF5 с помощьюh5py
илиPytables
(таблицы). - person kcw78   schedule 07.10.2020