Comment trouver la plus petite valeur positive d'une liste en python ?

Exemples de comment trouver la plus petite valeur positive d'une liste en python: [TOC] ### 1 -- Trouver la valeur minimum Soit la liste suivante l = [ 7, 3, 6, 9, 2, -1, -5, -4, -3] pour trouver la valeur minimum on peut utiliser la fonction min() en python: min(l) ce qui donne ici -1 ### 2 -- Trouver la plus petite valeur positive Pour trouver la plus petite valeur positive on peut utiliser une "list comprehension" puis utiliser min() min([i f

Comment obtenir la difference en minutes entre deux dates en python ?

Exemples de comment obtenir la difference en minutes entre deux dates en python: [TOC] ### 1 -- Créer deux dates différentes Créons tout d'abord deux dates time1 et time2 comme ceci en utilisant le module python datetime: import datetime year = 2008 month = 7 day = 8 hour = 12 minute = 47 second = 0 time1 = datetime.datetime(year,month,day,hour,minute,second) hour = 14 minute = 20 time2 = datetime.datetime(year,month,da

Comment sélectionner (filtrer) les lignes d'une dataframe en utilisant une condition avec pandas en python ?

Exemples de comment sélectionner (filtrer) les lignes d'une dataframe en utilisant une condition avec pandas en python: [TOC] ### 1 -- Créer une dataframe Commençons par créer une simple dataframe avec pandas: >>> import pandas as pd >>> data = {'Name':['Ben','Anna','Zow','Tom','John','Steve'], 'Age':[20,27,43,30,12,21], 'Sex':[1,0,0,1,1,1]} >>> df = pd.DataFrame(data) ce qui donne: >>> df Age Name Sex 0 20 Ben 1 1 27 Anna 0 2 43 Zoe 0

Comment éditer les éléments d'une colonne ou une condition est vérifiée avec pandas en python ?

Exemple de comment éditer les éléments d'une colonne ou une condition est vérifiée avec pandas en python: [TOC] ### 1 -- Créer une simple dataframe avec pandas Pour créer une simple dataframe avec 5 colonnes et 20 lignes on peut faire comme ceci: >>> import pandas as pd >>> import numpy as np >>> data = np.arange(1,101) >>> data = data.reshape(20,5) >>> df = pd.DataFrame(data=data,columns=['a','b','c','d','e']) ce qui donne >>> df a b c d e 0 1 2

Comment sélectionner aléatoirement (échantillonner) les lignes d'une dataframe avec pandas en python ?

Exemple de comment sélectionner aléatoirement (échantillonner) les lignes d'une dataframe avec pandas en python: [TOC] ### 1 -- Créer une simple dataframe Créons une simple dataframe avec 5 colonnes et 20 lignes: >>> import pandas as pd >>> import numpy as np >>> data = np.arange(1,101) >>> data = data.reshape(20,5) >>> df = pd.DataFrame(data=data,columns=['a','b','c','d','e']) >>> df a b c d e 0 1 2 3 4 5 1 6 7 8 9 10 2 11 12

Comment sélectionner dans une dataframe les colonnes commençant par *** avec pandas en python ?

Exemple de comment sélectionner dans une dataframe les colonnes commençant par *** avec pandas en python [TOC] ### 1 -- Créer une simple dataframe Créons une simple dataframe avec 8 colonnes: import pandas as pd import numpy as np data = np.arange(1,33) data = data.reshape(4,8) df = pd.DataFrame(data=data,columns=['name','add_01','add_02','add_03', 'counrty','streed','zip code','county']) print(df) donne

How to calculate and plot a cumulative distribution function with matplotlib in python ?

Examples of how to calculate and plot a cumulative distribution function in python [TOC] ### 1 -- Generate random numbers Let's for example generate random numbers from a normal distribution: import numpy as np import matplotlib.pyplot as plt N = 100000 data = np.random.randn(N) ### 2 -- Create an histogram with matplotlib hx, hy, _ = plt.hist(data, bins=50, normed=1,color="lightblue") plt.ylim(0.0,max(hx)+0.05) plt.title('Generate random numbers \n from a

How to calculate a log-likelihood in python (example with a normal distribution) ?

Example of how to calculate a log-likelihood using a normal distribution in python: [TOC] See the note: [How to estimate the mean with a truncated dataset using python ?](https://www.science-emergence.com/Articles/How-to-estimate-the-mean-with-a-truncated-dataset-using-python-/) to understand the interest of calculating a log-likelihood using a normal distribution in python. ### 1 -- Generate random numbers from a normal distribution Let's for example create a sample of 100000 rando

How to add text (units, %, etc) in a heatmap cell annotations using seaborn in python ?

Example of how to add text (units, %, etc) in a heatmap cell annotations using seaborn in python: [TOC] ### 1 -- Create a simple heatmap with seaborn Let's create a heatmap with seaborn: import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt data = np.array([[25.55535942, 1.99598017, 9.78107706], [ 4.95758736, 39.68268716, 16.78109873], [ 0.45401194, 0.10003128, 0.6921669 ]]) df = pd.DataFrame(data=data) fig = plt.fig

How to estimate the mean with a truncated dataset using python ?

Examples of how to estimate the mean with a truncated dataset using python for data generated from a normal distribution: [TOC] ### 1 -- Create a dataset of random numbers from a normal distribution Create a set of random numbers distributed according to a normal distribution: import scipy.stats import numpy as np import matplotlib.pyplot as plt mu_0 = 2.0 srd_0 = 4.0 data = np.random.randn(100000) data = data * srd_0 + mu_0 data = data.reshape(-1, 1) ### 2 --

How to use a Gaussian mixture model (GMM) with sklearn in python ?

Examples of how to use a Gaussian mixture model (GMM) with sklearn in python: [TOC] from sklearn import mixture import numpy as np import matplotlib.pyplot as plt ### 1 -- Example with one Gaussian Let's generate random numbers from a normal distribution with a mean $\mu_0 = 5$ and standard deviation $\sigma_0 = 2$ mu_0 = 5.0 srd_0 = 2.0 data = np.random.randn(100000) data = data * srd_0 + mu_0 data = data.reshape(-1, 1) Plot the data

How to generate random numbers from a log-normal distribution in python ?

Example of how to generate random numbers from a log-normal distribution in python ? [TOC] Log-normal distribution: \begin{equation} \frac{1}{x \sigma \sqrt{2\pi}}.exp(-\frac{(len(x)-\mu)^2}{2\sigma^2}) \end{equation} ### 2 -- Using scipy lognorm Example of how to generate random numbers from a log-normal distribution with $\mu=0$ and $\sigma=0.5$ using scipty function lognorm: from scipy.stats import lognorm import numpy as np import matplotlib.pyplot as plt st

How to add text on an image using pillow in python ?

Example of how to add text on an image using pillow in python: [TOC] ### 1 -- Create an image with pillow and add text on it Example 1: let's for example create a simple image with a red background: from PIL import Image img = Image.new('RGB', (600, 400), color = 'red') img.save('pil_red.png') [image:pilred02 size:50 caption:How to add text on an image using pillow in python ?] To add text, you must first download a 'font' file locally to your machine, for example f

How to increase the size of the cells text (annotations) of a seaborn heatmap in python ?

Example of how to increase the size of the cells text (annotations) of a seaborn heatmap in python: [TOC] ### 1 -- Create a simple heatmap using seaborn Let's first create a simple heatmap using seaborn: import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt data = np.array([[25.55535942, 1.99598017, 9.78107706], [ 4.95758736, 39.68268716, 16.78109873], [ 0.45401194, 0.10003128, 0.6921669 ]]) df = pd.DataFrame(data=data

How to increase the size of axes labels on a seaborn heatmap in python ?

Examples of how to increase the size of axes labels on a seaborn heatmap in python: [TOC] ### 1 -- Create a simple heatmap using seaborn Let's create a first simple heatmap using seaborn: import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt data = np.array([[25.55535942, 1.99598017, 9.78107706], [ 4.95758736, 39.68268716, 16.78109873], [ 0.45401194, 0.10003128, 0.6921669 ]]) df = pd.DataFrame(data=data,columns=['C1','

How to remove lines from a to b in a text file using the editor vi ?

Example of how to remove lines from a to b using vi editor ? [TOC] ### 1 -- Remove lines from a to b (with b>a) To delete lines from a to b, a solution is to use the command: :m,nd Note: to remove from the current line to line n: :,nd ### 2 -- Remove all lines Note: to remove all content in the file: :1,$d ### 3 -- References - [Delete from the current cursor position to a given line number in vi editor](https://stackoverflow.com/questions/6384561/d

Comment utiliser un modèle de mélange gaussien (GMM) avec sklearn en python

Exemples de comment utiliser un modèle de mélange gaussien (GMM) avec sklearn en python : [TOC] from sklearn import mixture import numpy as np import matplotlib.pyplot as plt ### 1 -- Exemple avec une seule gaussienne Générons par exemple des données aléatoirement suivant une loi normale avec une moyenne $\mu_0 = 5$ et une standard déviation $\sigma_0 = 2$ mu_0 = 5.0 srd_0 = 2.0 data = np.random.randn(100000) data = data * srd_0 + mu_0

Comment calculer et tracer une fonction de répartition, ou fonction de distribution cumulative en python ?

Exemples de comment calculer et tracer une fonction de répartition, ou fonction de distribution cumulative en python: [TOC] ### 1 -- Générer des nombres aléatoires Générons par exemple des nombres aléatoires depuis une loi normale: import numpy as np import matplotlib.pyplot as plt N = 100000 data = np.random.randn(N) ### 2 -- Créer un histogramme avec matplotlib hx, hy, _ = plt.hist(data, bins=50, normed=1,color="lightblue") plt.ylim(0.0,max(hx)+0.05) plt.tit

Comment calculer une fonction de vraisemblance (log-likelihood) en python pour des données distribuées selon une loi normale ?

Exemple de comment calculer une fonction de vraisemblance (log-likelihood) en python pour des données distribuées selon une loi normale: [TOC] Pour comprendre l'intérêt de savoir calculer le "log-likelihood" pour estimer une moyenne, voir [Comment estimer une moyenne avec des données tronquées (censurées) en python (exemple avec une loi normale) ? ](https://www.science-emergence.com/Articles/Estimer-une-moyenne-a-partir-dun-ensemble-de-donnees-distribuees-selon-une-distribution-Gaussienn

Générer des nombres aléatoires depuis une loi log-normale en python ?

Exemple de code en python pour générer des nombres aléatoires depuis une loi log-normale em python [TOC] Loi log normal: \begin{equation} \frac{1}{x \sigma \sqrt{2\pi}}.exp(-\frac{(len(x)-\mu)^2}{2\sigma^2}) \end{equation} ### 2 -- Avec scipy lognorm Exemple de comment générer des nombres aléatoires depuis une loi log-normale avec $\mu=0$ et $\sigma=0.5$ en passant par le fonction scipty lognorm: from scipy.stats import lognorm import numpy as np import matplotlib.pyp

How to calculate a Gaussian density probability function at a given point in python ?

Let's consider the normal (Gaussian) distribution with mean equal to 8 and standard deviation equal to 2: [image:probability-normal-distribution size:75 caption:How to calculate a Gaussian density probability function at a given point in python ?] To calculate a Gaussian density probability function at a given point in python, a solution is to do: scipy.stats.norm.pdf(6,8,2) returns: 0.13 Source code to create the plot: import matplotlib.pyplot as plt import sc

Comment estimer une moyenne avec des données tronquées (censurées) en python (exemple avec une loi normale) ?

Exemples de comment estimer une moyenne à partir d'un ensemble de données distribuées selon une distribution Gaussienne en python ? [TOC] ### 1 -- Créer un ensemble de nombres aléatoires distribués suivant une Gaussienne import scipy.stats import numpy as np import matplotlib.pyplot as plt mu_0 = 2.0 srd_0 = 4.0 data = np.random.randn(100000) data = data * srd_0 + mu_0 data = data.reshape(-1, 1) ### 2 -- Données complètes hx, hy, _ = plt.hist(data, bins=50,

How to create a global variable in python ?

Example of how to create a global variable in python: [TOC] ### 1 -- Using global To declare for example a as a global variable: global a ### 2 -- Illustration with a function Using global variables in a function: >>> global a,b >>> a = 0.5 >>> b = 2 >>> def function( x ): ... return a * x + b ... >>> function(1) 2.5 >>> b = 4 >>> function(1) 4.5 ### 3 -- References - [Python function global variab

Comment supprimer les lignes allant de m a n dans un fichier avec l'editeur vi ?

Exemple de comment supprimer les lignes allant de m a n dans un fichier avec l'éditeur vi [TOC] ### 1 -- Supprimer les lignes allant de m à n (n>m) Pour supprimer les lignes allant de m à n il suffit d'utiliser la commande suivante: :m,nd Note: pour supprimer de la ligne courant à n: :,nd ### 2 -- Supprimer toutes les lignes Note: si on veut supprimer toutes les lignes du fichier: :1,$d ### 3 -- Références - [Delete from the current cursor position t

Comment augmenter la taille des labels sur les axes d'une heatmap avec seaborn en python ?

Exemples de comment augmenter la taille des labels sur les axes d'une heatmap avec seaborn en python: [TOC] ### 1 -- Créer une simple heatmap avec seaborn Commençons par créer une simple heatmap avec seaborn, comme dans cet exemple import seaborn as sns import numpy as np import pandas as pd import matplotlib.pyplot as plt data = np.array([[25.55535942, 1.99598017, 9.78107706], [ 4.95758736, 39.68268716, 16.78109873], [ 0.45401194, 0.10003128, 0.6921669 ]])