5. Variables aléatoires discrètes#

Nous allons définir les variables aléatoires: concept clé de la probabilité.

  • types de variables aléatoires: discrète, continue.

  • variables discrètes usuelles: Bernouli, binomiale, Poisson.

  • variables continues usuelles: Gaussienne, uniforme, exponentielle;

Après avoir effectué une expérience aléatoire, on s’intéresse davantage à une fonction du résultat, plutôt qu’au résultat lui-même.

Définition 5.2 (Variable aléatoire)

Une variable aléatoire définie sur un ensemble fondamental \(\Omega\) est une fonction de \(\Omega\) dans \( \mathbb{R}\) (ou dans un sous-ensemble de \(H \subset \mathbb{R}\) ):

\[\begin{align*} X : && \Omega \longrightarrow \mathbb{R}\\ && \omega \longrightarrow X(\omega), \end{align*}\]

\(\omega \in \Omega\). Notez donc que \(H\) est l’image de \(\Omega\) par \(X\). Une variable peut prendre des valeurs discrètes ou continues. Plus généralement, pour \(A\subset \mathbb{R}\), on écrit \(\{X \subset A\}\) l’événement

\[\begin{gather*} \{\omega \in \Omega \ :\ X(\omega) \in A \}. \end{gather*}\]

Exemple 5.3 (Le jeu de Catane)

Au jeu de Catane, on lance deux dés et on fait la somme. Ici, on a

\[\begin{gather*} \Omega = \{(i,j) \ : \ i,j = 1,2,\dots, 6\}, \end{gather*}\]

et la variable aléatoire représentant le jeu de Catane est

\[\begin{gather*} X: \Omega \rightarrow \mathbb{R}, \quad (i,j)\mapsto i + j. \end{gather*}\]

Exemple 5.4

Identifions l’ensemble \(H\) pour les variables suivantes:

  • Nombre de buts dans un match de foot.

  • Nombre de grammes de chocolat consommé en un an par Alice.

  • Température en Celsius demain matin.

Définition 5.3 (Variable discrètes)

Une variable aléatoire est discrète si elle prend un nombre fini ou dénombrable de valeurs.

Définition 5.4 (Fonction de masse/fréquences)

Pour une variable discrète \( X \), la fonction:

\[\begin{gather*} f_X (x_i) := \mathbb{P} ( X = x_i ) \end{gather*}\]

est dite fonction de masse (ou fonction de fréquences).

Une variable \( X \) est complètement caractérisée par

  • les valeurs que \(X\) peut prendre, c’est-à-dire \(H = \{x_1, \dots,x_k, \dots \}\);

  • la liste de probabilités de ces valeurs

\[\begin{gather*} \mathbb{P}(X=x_1), \dots, \mathbb{P}(X=x_k), \dots \end{gather*}\]

\(f_X\) définit donc complètement une variable discrète.

Propriété 5.1 (Fonction de masse)

La fonction \(f_X\) satisfait:

  • \(0\leq f_X(x_i) \leq 1\) pour tout \(i = 1,\dots, n\).

  • \(f_X(x) = 0\) pour toutes les autres valeurs de \(x\).

  • \( \sum_{x_i \in H} f_X (x_i) = 1 \)

Exemple 5.5

Calculez la fonction de masse:

  • de la somme de deux dés (jeu de Catane);

  • du maximum.

Définition 5.5 (Fonction de répartition)

La fonction de répartition \(F_x\) d’une variable aléatoire \( X \) est définie par:

\[\begin{gather*} F_X(x) = \mathbb{P} (X \leq x).\end{gather*}\]

Propriété 5.2 (Fonction de répartition)

Toute fonction de répartition a les propriétés suivantes:

  • \(F_X\) prend ses valeurs dans \( [0,1] \).

  • \(F_X\) est monotone, croissante (pas nécessairement strictement).

  • On a

\[\begin{gather*} \lim_{x \rightarrow -\infty}F_X(x) = 0, \quad \lim_{x \rightarrow +\infty}F_X(x) = 1.\end{gather*}\]
  • Si \(X\) est une variable aléatoire discrète, alors

\[\begin{gather*} F_X(x) = \sum_{i \text{ tq } x_i \leq x} \mathbb{P} (X = x_i);\end{gather*}\]
  • On a \(\mathbb{P}(a < X \leq b) = F_X(b) - F_X(a).\)

  • \(F_X\) est continue à droite en \(x_i,\) pour tout \(x_i \in H\).

Définition 5.6 (Fonction quantile)

Soit la fonction quantile définie comme

\[\begin{gather*} F: ]0,1[ \rightarrow \mathbb{R}, \quad F^{-}(\alpha) = \inf \{t\in \mathbb{R}\ :\ F(t)\geq \alpha \}. \end{gather*}\]
  • Si \(F_X\) est strictement croissante et continue alors, il existe une fonction réciproque \(F^{-1}\) et elle coïncide avec \(F^{-}\).

  • Si \(F_X\) est seulement continue à droite et croissante, alors la fonction \(F^{-}\) est bien définie. Pour \(\alpha\in ]0,1[\), on appelle \(q_\alpha = F^{-}(\alpha)\) le \(\alpha-\)quantile. Par commodité, on va utiliser la notation \(F^{-1}\) pour \(F^{-}\), y compris lorsque \(F\) n’est pas strictement croissante et continue.

../_images/quantile_explication.svg

Exemple 5.6

Supposons que \(X\sim \text{Exp}(\lambda)\). On a alors

\[\begin{gather*} f_X(x) = \lambda e^{-\lambda x}, \quad x>0.\end{gather*}\]

Soit \(\alpha \in ]0,1[\). Calculez le quantile \(q_\alpha\) correspondant.

Note

Quelques notations

  • Les majuscules \( X,Y,Z,T\dots\) désignent des variables aléatoires.

  • Les minuscules \(x,y\dots\) désignent des valeurs possibles ou des réalisations de \(X,Y\dots\).

  • La majuscule \(F_X\) est la fonction de répartition de \(X\).

  • La minuscule \(f_x\) dénote la fonction de masse ou la densité de \(X\).

  • On écrit \(f,F\) (sans l’indice) s’il n’y a pas de risque de confusion.

  • \(X \sim F\) veut dire: « la variable aléatoire \(X\) suit la loi \(F\) » .

  • \(X \dot{\sim} F\) (point au dessus du tilde) veut dire: « la variable aléatoire \(X\) suit approximativement la loi \(F\) ».

Définition 5.7 (Variable de Bernouilli)

Une variable aléatoire de Bernoulli satisfait:

\[\begin{gather*} X = \left\{ \begin{array}{cl} x_1 = 0 & \text{ probabilité }1-p \\ x_2 = 1 & \text{ probabilité } p \end{array} \right. \end{gather*}\]

On écrit \( X \sim \mathcal{B}(p) \). Sa loi de probabilité est donnée par:

\[\begin{gather*} \begin{array}{c|c|c|c} X = x_i & 0 & 1&\mbox{Total}\\ \hline f_X(x_i) =\mathbb{P}(X=x_i)& 1-p & p &1 \end{array} \end{gather*}\]

Elle a un paramètre: la probabilité de succès \(p\). On peut l’utiliser pour modéliser des expériences qui ont deux issues possibles.

Définition 5.8 (Variable binomiale)

On jette une pièce de monnaie \(n\) fois indépendamment et \(\mathbb{P}(\text{Pile}) = p\) est fixée. Soit \( X \) le nombre total de piles obtenus. On dit alors que \(X\) suit une loi binomiale \(X \sim \mathcal{B}(n,p) \). Sa fonction de masse est donnée par

\[\begin{gather*} f_X(x) = \binom{n}{x} p^x (1-p)^{n-x} \hspace{1.5cm} x = 0,1 \dots n. \end{gather*}\]

La loi binomiale a deux paramètres: le nombre d’essai \(n\) et la probabilité de succès \(p\). Pour \(n=1\), on retrouve une variable de Bernoulli.

Exemple 5.7 (Anniversaires mensuels)

Calculons la loi du nombre de personnes \(X\) présentes à ce cours ayant leur anniversaire ce mois ci.

Note

Est-ce bien une fonction de masse? Il faut vérifier les trois propriétés:

  • \(0\leq f_X(x_i) \leq 1\) pour tout \(i = 1,\dots, n\).

  • \(f_X(x) = 0\) pour toutes les autres valeurs de \(x\).

  • \( \sum_{x_i \in H} f_X (x_i) = 1 \) On a trivialement que les propriétés 1 et 2 sont satisfaites. On vérifie aisément la propriété 3:

Il suffit de se souvenir de la formule du binôme de Newton et le résultat est immédiat:

\[\begin{gather*} \sum_{x =0}^n \binom{n}{x} p^x (1-p)^{n-x} = [p + (1-p)]^n = 1. \end{gather*}\]

Définition 5.9 (Variable de Poisson)

Une variable de Poisson a un paramètre \(\lambda > 0\):

\[\begin{gather*} f_X(x) = \frac{\lambda^x}{x!} e^{-\lambda} \hspace{1.4cm} x \in \mathbb{N}.\end{gather*}\]

Toute les valeurs \( x \in \mathbb{N} \) sont possibles! On écrit \( X \sim \text{Poiss}(\lambda).\)

Une variable de Poisson peut-être utilisé, par exemple, pour modéliser:

  • nombre d’appels téléphoniques par minute dans une centrale;

  • nombre d’avalanches mortelles en Suisse en une année.

Note

Est-ce bien une fonction de masse? Il suffit de se souvenir de la de la définition de l’exponentielle et le résultat est immédiat:

\[\begin{gather*} \sum_{x =0}^\infty \frac{\lambda^x}{x!} e^{-\lambda} = e^{-\lambda} \sum_{x =0}^\infty \frac{\lambda^x}{x!} = e^{-\lambda} e^\lambda = 1. \end{gather*}\]

Exemple 5.8 (E. Coli.)

Un échantillon d’eau saine contient 4 E. Coli en moyenne. Trouver la probabilité qu’il en contienne \(0,1,2,3,4\). Si on trouve 10 bactéries dans l’échantillon, pensez vous que l’eau soit bonne?

Si \(X \sim \mathcal{B}(n,p) \) avec \(n\) grand et \(p\) petit, alors on peut approximer par \( X \dot{\sim} \text{Poiss}(\lambda = np)\). Parfois, on appelle ce théorème la loi des petits nombres.

Exemple 5.9 (Les anniversaires)

Soit \(X\) le nombre de personnes qui ont leur anniversaire aujourd’hui. Calculez la probabilité que \(X=0,1,2,3\) et \(X>1\) sous la loi binomiale et son approximation poissonienne.