Comment calculer la moyenne sur une colonne d'une dataframe avec pandas en python ?

Comment calculer la moyenne sur une colonne d'une dataframe avec pandas en python ?

Daidalos 18 juin 2020


Exemples de comment calculer la moyenne sur une colonne d'une dataframe avec pandas en python:

1 -- Créer une dataframe

Soit par exemple la dataframe suivante:

import pandas as pd

data = {'Name':['Ben','Anna','Zoe','Tom','John','Steve'], 
        'Age':[20,27,43,30,12,21]}

df = pd.DataFrame(data)

donne

    Name  Age
0    Ben   20
1   Anna   27
2    Zoe   43
3    Tom   30
4   John   12
5  Steve   21

2 -- Calculer la moyenne d'age

Pour calculer une moyenne sur la colonne intitulée 'Age' on peut utiliser la fonction pandas mean(), exemple

df['Age'].mean()

donne

25.5

3 -- Autre exemple avec des données manquantes

import pandas as pd
import numpy as np

data = {'Name':['Ben','Anna','Zoe','Tom','John','Steve','Bob'], 
        'Age':[20,27,43,30,12,21, np.nan]}

df = pd.DataFrame(data)

    Name   Age
0    Ben  20.0
1   Anna  27.0
2    Zoe  43.0
3    Tom  30.0
4   John  12.0
5  Steve  21.0
6    Bob   NaN

df['Age'].mean()

donne

25.5

4 -- Références