Comment ajouter des metadata à une data frame avec pandas sous python ?

Daidalos October 22, 2019


Exemple de comment ajouter des metadata à une data frame avec pandas sous python:

Créer une data frame avec pandas

Exemple de comment créer une simple data frame avec pandas

import pandas as pd
import numpy as np

data = np.arange(1,13)
data = data.reshape(3,4)

columns = ['Home','Car','Sport','Food']
index = ['Alice','Bob','Emma']

df = pd.DataFrame(data=data,index=index,columns=columns)

Ajouter des metadata

On peut alors ajouter des metadata à la data frame comme ceci:

df.scale = 0.1
df.offset = 15

print(df.scale)
print(df.offset)

donne

0.1
15

Sauvegarder dans un fichier hdf5

Pour sauvegarder une data frame et des metadata on peut utiliser un fichier hdf5 avec HDFStore
(voir Save additional attributes in Pandas Dataframe)

store = pd.HDFStore('data.hdf5')

store.put('dataset_01', df)

metadata = {'scale':0.1,'offset':15}

store.get_storer('dataset_01').attrs.metadata = metadata

store.close()

Lire un fichier hdf5 avec pandas

Exemple de comment ensuite lire le fichier

import pandas as pd

with pd.HDFStore('data.hdf5') as store:
    data = store['dataset_01']
    metadata = store.get_storer('dataset_01').attrs.metadata

print(data)

print(metadata)

donne

       Home  Car  Sport  Food
Alice     1    2      3     4
Bob       5    6      7     8
Emma      9   10     11    12
{'scale': 0.1, 'offset': 15}

Références

Liens Site
How to add meta_data to Pandas dataframe? stackoverflow
Adding meta-information/metadata to pandas DataFrame stackoverflow
Using HDFStore riptutorial
Save additional attributes in Pandas Dataframe stackoverflow
pandas.read_hdf pandas.pydata.org
How to: Get the DataFrame metadata kite.com

Licence


Activity


Google Ads