Variables aléatoires discrètes
5. Variables aléatoires discrètes#
Nous allons définir les variables aléatoires: concept clé de la probabilité.
types de variables aléatoires: discrète, continue.
variables discrètes usuelles: Bernouli, binomiale, Poisson.
variables continues usuelles: Gaussienne, uniforme, exponentielle;
Après avoir effectué une expérience aléatoire, on s’intéresse davantage à une fonction du résultat, plutôt qu’au résultat lui-même.
(Variable aléatoire)
Une variable aléatoire définie sur un ensemble fondamental \(\Omega\) est une fonction de \(\Omega\) dans \( \mathbb{R}\) (ou dans un sous-ensemble de \(H \subset \mathbb{R}\) ):
où \(\omega \in \Omega\). Notez donc que \(H\) est l’image de \(\Omega\) par \(X\). Une variable peut prendre des valeurs discrètes ou continues. Plus généralement, pour \(A\subset \mathbb{R}\), on écrit \(\{X \subset A\}\) l’événement
(Le jeu de Catane)
Au jeu de Catane, on lance deux dés et on fait la somme. Ici, on a
et la variable aléatoire représentant le jeu de Catane est
Identifions l’ensemble \(H\) pour les variables suivantes:
Nombre de buts dans un match de foot.
Nombre de grammes de chocolat consommé en un an par Alice.
Température en Celsius demain matin.
Solution
Nombre de buts
Le maximum jamais atteint (match international) est de 31 buts Austalie - Samoa Américaines: 31 - 0;
Nombre de grammes de chocolat:
Témprature en Celsius:
ou
(Variable discrètes)
Une variable aléatoire est discrète si elle prend un nombre fini ou dénombrable de valeurs.
(Fonction de masse/fréquences)
Pour une variable discrète \( X \), la fonction:
est dite fonction de masse (ou fonction de fréquences).
Une variable \( X \) est complètement caractérisée par
les valeurs que \(X\) peut prendre, c’est-à-dire \(H = \{x_1, \dots,x_k, \dots \}\);
la liste de probabilités de ces valeurs
\(f_X\) définit donc complètement une variable discrète.
(Fonction de masse)
La fonction \(f_X\) satisfait:
\(0\leq f_X(x_i) \leq 1\) pour tout \(i = 1,\dots, n\).
\(f_X(x) = 0\) pour toutes les autres valeurs de \(x\).
\( \sum_{x_i \in H} f_X (x_i) = 1 \)
Calculez la fonction de masse:
de la somme de deux dés (jeu de Catane);
du maximum.
Solution
(Fonction de répartition)
La fonction de répartition \(F_x\) d’une variable aléatoire \( X \) est définie par:
(Fonction de répartition)
Toute fonction de répartition a les propriétés suivantes:
\(F_X\) prend ses valeurs dans \( [0,1] \).
\(F_X\) est monotone, croissante (pas nécessairement strictement).
On a
Si \(X\) est une variable aléatoire discrète, alors
On a \(\mathbb{P}(a < X \leq b) = F_X(b) - F_X(a).\)
\(F_X\) est continue à droite en \(x_i,\) pour tout \(x_i \in H\).
(Fonction quantile)
Soit la fonction quantile définie comme
Si \(F_X\) est strictement croissante et continue alors, il existe une fonction réciproque \(F^{-1}\) et elle coïncide avec \(F^{-}\).
Si \(F_X\) est seulement continue à droite et croissante, alors la fonction \(F^{-}\) est bien définie. Pour \(\alpha\in ]0,1[\), on appelle \(q_\alpha = F^{-}(\alpha)\) le \(\alpha-\)quantile. Par commodité, on va utiliser la notation \(F^{-1}\) pour \(F^{-}\), y compris lorsque \(F\) n’est pas strictement croissante et continue.
Supposons que \(X\sim \text{Exp}(\lambda)\). On a alors
Soit \(\alpha \in ]0,1[\). Calculez le quantile \(q_\alpha\) correspondant.
Solution
On a donc
On a alors \(F_X(x) = 1-e^{-\lambda x}\) et on déduit fonction quantile en inversant cette fonction:
Ainsi,
Note
Quelques notations
Les majuscules \( X,Y,Z,T\dots\) désignent des variables aléatoires.
Les minuscules \(x,y\dots\) désignent des valeurs possibles ou des réalisations de \(X,Y\dots\).
La majuscule \(F_X\) est la fonction de répartition de \(X\).
La minuscule \(f_x\) dénote la fonction de masse ou la densité de \(X\).
On écrit \(f,F\) (sans l’indice) s’il n’y a pas de risque de confusion.
\(X \sim F\) veut dire: « la variable aléatoire \(X\) suit la loi \(F\) » .
\(X \dot{\sim} F\) (point au dessus du tilde) veut dire: « la variable aléatoire \(X\) suit approximativement la loi \(F\) ».
(Variable de Bernouilli)
Une variable aléatoire de Bernoulli satisfait:
On écrit \( X \sim \mathcal{B}(p) \). Sa loi de probabilité est donnée par:
Elle a un paramètre: la probabilité de succès \(p\). On peut l’utiliser pour modéliser des expériences qui ont deux issues possibles.
(Variable binomiale)
On jette une pièce de monnaie \(n\) fois indépendamment et \(\mathbb{P}(\text{Pile}) = p\) est fixée. Soit \( X \) le nombre total de piles obtenus. On dit alors que \(X\) suit une loi binomiale \(X \sim \mathcal{B}(n,p) \). Sa fonction de masse est donnée par
La loi binomiale a deux paramètres: le nombre d’essai \(n\) et la probabilité de succès \(p\). Pour \(n=1\), on retrouve une variable de Bernoulli.
(Anniversaires mensuels)
Calculons la loi du nombre de personnes \(X\) présentes à ce cours ayant leur anniversaire ce mois ci.
Solution
Pour une personne donnée, la probabilité que son anniversaire tombe un mois donné est \( 1 / 12 \). De plus, pour deux personnes qui n’ont pas de lien de parenté, leurs dates d’anniversaires sont indépendantes. On peut donc utiliser un modèle Binomial \( \mathcal{B}(n,1/12) \) pour représenter le nombre d’anniversaires dans le mois d’un groupe de \( n \) personnes.
Note
Est-ce bien une fonction de masse? Il faut vérifier les trois propriétés:
\(0\leq f_X(x_i) \leq 1\) pour tout \(i = 1,\dots, n\).
\(f_X(x) = 0\) pour toutes les autres valeurs de \(x\).
\( \sum_{x_i \in H} f_X (x_i) = 1 \) On a trivialement que les propriétés 1 et 2 sont satisfaites. On vérifie aisément la propriété 3:
Il suffit de se souvenir de la formule du binôme de Newton et le résultat est immédiat:
(Variable de Poisson)
Une variable de Poisson a un paramètre \(\lambda > 0\):
Toute les valeurs \( x \in \mathbb{N} \) sont possibles! On écrit \( X \sim \text{Poiss}(\lambda).\)
Une variable de Poisson peut-être utilisé, par exemple, pour modéliser:
nombre d’appels téléphoniques par minute dans une centrale;
nombre d’avalanches mortelles en Suisse en une année.
Note
Est-ce bien une fonction de masse? Il suffit de se souvenir de la de la définition de l’exponentielle et le résultat est immédiat:
(E. Coli.)
Un échantillon d’eau saine contient 4 E. Coli en moyenne. Trouver la probabilité qu’il en contienne \(0,1,2,3,4\). Si on trouve 10 bactéries dans l’échantillon, pensez vous que l’eau soit bonne?
Solution
Le calcul nous donne:
qui nous donne la fonction de masse:
Il est très improbable d’observer 10 bactéries ou plus: \( \mathbb{P}(X\geq 10 ) \leq 0.01 \). Une telle observation nous fait donc penser que cette eau est contaminée.
Si \(X \sim \mathcal{B}(n,p) \) avec \(n\) grand et \(p\) petit, alors on peut approximer par \( X \dot{\sim} \text{Poiss}(\lambda = np)\). Parfois, on appelle ce théorème la loi des petits nombres.
(Les anniversaires)
Soit \(X\) le nombre de personnes qui ont leur anniversaire aujourd’hui. Calculez la probabilité que \(X=0,1,2,3\) et \(X>1\) sous la loi binomiale et son approximation poissonienne.
Solution
On suppose que \(p =1/365\) et on a \(n=247\). Le calcul montre qu’on a effectivement des résultats quasi identiques. Si on arrondit à 0.01, on trouve dans les deux cas la fonction de masses suivante (pour \( n = 247 \)):
On a donc \(49\% \) de chances que quelqu’un ait son anniversaire aujourd’hui. Est-ce que c’est le cas?