Série2
Contents
Série2#
Exercice 1:#
Nous avons à notre disposition les données d’échec ou de réussite de l’examen de cette matière de 2020. Nous allons nous intérésser en particulier à deux variables binaires de ces données:
La section: S \(\in\{\text{GM},\text{EL}\}\)
Le succes à l’examen: A \(\in\{0,1\}\)
Dans le cadre des probabilités conditionnelles, avec deux variables binaires, une erreur qui revient souvent est de penser que:
Néanmoins, cela est généralement faux. Nous allons donc nous appliquer à montrer que cela est faux dans notre cas, ainsi que de voir quel serait la version correcte de cette équation.
import pandas as pd
data = pd.read_csv("Success_ProbaStat.csv")
1) Synthétiser ces données de façon à avoir le nombre d’échec ou de réussite par section.
# Place your answer here
2) Montrer expérimentalement que \( \mathbb{P}\left(\textbf{A} = 1 | \textbf{S} = \text{GM}\right) + \mathbb{P}\left(\textbf{A} = 1 | \textbf{S} = \text{EL}\right) \neq 1 \):
# Place your answer here
3) Cette erreur est plutôt commune et vient d’une confusion avec une autre équation qui elle est correcte:
Vérifier expérimentalement que cette équation est correcte.
# Place your answer here
Exercice 2:#
Nous allons considérer quatre fonctions définies de l’ensemble \(\left\{0, 1, 2, ..., 10\right\}\) dans \(\mathbb{R}\). Le but de cet exercice est de vérifier lesquels de ces fonctions sont des fonctions de masses.
import fonction
X = [0,1,2,3,4,5,6,7,8,9,10]
# Vous pouvez accéder à ces quatres fonctions, f1,f2,f3,f4, de la manière suivante
fonction.f2(2)
1) La fonction f1
est-elle une fonction de masse ?
Solution:
# Place your answer here
2) La fonction f2
est-elle une fonction de masse ?
Solution:
# Place your answer here
3) La fonction f3
est-elle une fonction de masse ?
Solution:
# Place your answer here
4) La fonction f4
est-elle une fonction de masse ?
Solution:
# Place your answer here
Exercice 3:#
Le but de cet exercice est de déterminer si les fonctions suivantes peuvent être des fonctions de répartitions.
from matplotlib import pyplot as plt
import numpy as np
fig, (ax1, ax2, ax3) = plt.subplots(1, 3,figsize = (10,4))
ax1.plot(np.array([-10.,0.,0.,10.,10.,20.,20.,30.,30.,40.,40.,50.,50.,60.,60.,70.,70.,80.,80.,90.,90.,100.,100.,120.,120.]),
np.array([0.,0.,0.1,0.1,0.19,0.19,0.25,0.25,0.34,0.34,0.45,0.45,0.5,0.5,0.57,0.57,0.61,0.61,0.63,0.63,0.65,0.65,0.67,0.67,0.67]))
ax1.set_title("Figure 1")
ax2.plot(np.array([-10.,0.,0.,10.,10.,20.,20.,30.,30.,35.,35.,50.,50.,54.,54.,70.,70.,83.,83.,90.,90.,115.,115.,120.,120.]),
np.array([0.,0.,0.05,0.05,0.09,0.09,0.15,0.15,0.34,0.34,0.39,0.39,0.47,0.47,0.67,0.67,0.86,0.86,0.89,0.89,0.91,0.91,1.,1.,1.]))
ax2.set_title("Figure 2")
ax3.plot(np.array([-10.,0.,0.,10.,10.,20.,20.,30.,30.,35.,35.,50.,50.,54.,54.,70.,70.,83.,83.,90.,90.,115.,115.,120.,120.]),
np.array([0.,0.,0.05,0.05,0.09,0.09,0.15,0.15,0.34,0.34,0.39,0.39,0.47,0.47,0.67,0.67,0.86,0.86,0.84,0.84,0.91,0.91,1.,1.,1.]))
ax3.set_title("Figure 3")
plt.show()
1) La Figue 1 est-elle le plot d’une fonction de répartition ?
Solution:
2) La Figue 2 est-elle le plot d’une fonction de répartition ?
Solution:
3) La Figue 3 est-elle le plot d’une fonction de répartition ?
Solution:
Exercice 4: Lien entre une variable de Bernoulli et une variable géométrique#
Considérons un archer, qui vise le milieu de la cible. Il tire autant de flèche que nécessaire et s’arrête une fois qu’une d’entre elle frappe le centre de la cible. On suppose qu’il parvient à atteindre son but avec une probabilité \(p\) à chaque flèche et que chaque tir est indépendant des autres.
Le fait que le \(i^{ème}\) tir atteigne le centre de la cible peut alors être modéliser par la variable aléatoire \(X_i \sim Bern(p)\).
De même, le nombre de flèches nécéssaires avant d’atteindre le centre de la cible peut être modéliser par la variable aléatoire \( S = \min\left\{{i\in\mathbb{N} | X_i = 1}\right\}\), qui suit une loi géométrique de paramètre \(p\).
1) Dans question nous allons créer une fonction bern
qui génère aléatoirement une variable de Bernouilli pour un paramètre \(p\) donné en argument.
a) En utilisant la fonction random.uniform
, du package numpy
, qui permet de générer des réalisations de variables aléatoires uniformes, et la fonction indicatrice \(\mathbf{1}_{\{U<p\}}\) (où \(U \sim Unif(0,1)\)) écrire une fonction bern
qui génère \(n\) réalisations de variables de Bernoulli \(X\) avec probabilité de succès \(p\in[0,1]\).
import numpy as np
def bern(p,n):
# Générer une variable aléatoire de Bernouilli avec probabilité de succès p
X = ...
return X
b) En fixant \(p = 0.3\), générer un grand nombre de variables de Bernoulli, disons \(n = 10000\) avec la fonction bern
et à l’aide d’un plot vérifier expérimentalement que \(\mathbb{P}(X = 1) = 0.3\) et que \(\mathbb{P}(X = 0) = 1-p = 0.7\).
Solution:
from matplotlib import pyplot as plt
n = 10000
p = 0.3
# Générer n variable de Bernoulli avec probabilité de succès p
X = ...
# Calcul de la moyenne empirique
mean = ...
print(f"La moyenne de la variable générée est {mean}")
# Plot pour vérifier expérimentalement que la fonction bern génère bien des variables de Bernoulli
...
c) Pourriez-vous envisager d’autres fonctions indicatrices pour générer une variable de Bernoulli de paramètres \(p\)?
Solution:
2) En utilisant la fonction bern
, écrire une fonction geom
qui simule la génération d’une variable aléatoire \(S = \min\left\{{i\in\mathbb{N} | X_i = 1}\right\}\), où \(X_i \sim Bern(p)\).
def geom(p):
if abs(p)<1e-10:
raise("La probabilité de succès doit être supérieure à zéro.")
...
return S
3) Nous allons maintenant estimer quelques probabilités liées à notre variable aléatoire \(S\):
a) Grâce à un plot et une valeure numérique, estimer la valeure de \(\mathbb{P}(S = 1)\) (\(n = 10000\) devrait être suffisant pour une bonne estmination).
Solution:
n = 10000
p = 0.3
# Générer n observations de S
S = ...
# Proposer une estimation de P(S = 1)
...
# Faire un plot montrant la convergence de cette probabilité
...
b) De la même manière que la question précédente, estimer la probabilité \(\mathbb{P}(S>3)\).
Solution:
n = 10000
p = 0.3
# Générer n observations de S
S = ...
# Proposer une estimation de P(S > 3)
...
# Faire un plot montrant la convergence de cette probabilité
...
c) Enfin, pour des valeures \(m\) et \(t\) fixées, vérifier que \(\mathbb{P}(S > t + m| S > t) = \mathbb{P}(S > m)\).
Solution:
n = 10000
p = 0.3
t = 4
m = 2
# Générer deux ensemble de n observations de S pour estimer chacunes de ces
# deux probabilités avec deux ensembles distinct
S1 = ...
S2 = ...
# Proposer une estimation de P(S > t + m | S > t)
...
# Proposer une estimation de P(S > m)
...
# Faire un plot montrant la convergence de la différence entre ces deux probabilités
...
Exercice 5:#
1) Laquelle des fonctions suivantes est la densité d’une variable continue ? Reconnaissez-vous cette loi ?
Solution:
from matplotlib import pyplot as plt
import numpy as np
fig, axs = plt.subplots(2, 2,figsize = (8,6))
axs[0,0].plot(np.array([-1.,0.,0.,1.,1.,2.]),
np.array([0.,0.,2.,2.,0.,0.]))
axs[0,0].set_title("Figure 1")
axs[0,1].plot(np.array([-1.,0.25,0.25,0.75,0.75,2.]),
np.array([0.,0.,1.,1.,0.,0.]))
axs[0,1].set_title("Figure 2")
axs[1,0].plot(np.array([-1.,0.,0.,1.,1.,2.]),
np.array([0.,0.,1.,1.,0.,0.]))
axs[1,0].set_title("Figure 3")
axs[1,1].plot(np.array([-1.,-0.5,0.,0.5,1.,1.5,2.,2.5]),
np.array([0.,0.,1.,0.,0.,1.,0.,0.]))
axs[1,1].set_title("Figure 4")
plt.show()
Exercice 6:#
1) Est-ce que les fonctions suivantes sont des fonctions de répartition? Si oui, le sont-elles pour des variables continues ou discrètes ?
Solution:
from matplotlib import pyplot as plt
import numpy as np
fig, axs = plt.subplots(2, 3,figsize = (8.5,6.5))
axs[0,0].plot(np.array([-10.,0.,0.,10.,10.,20.,20.,30.,30.,40.,40.,50.,50.,60.,60.,70.,70.,80.,80.,90.,90.,100.,100.,120.,120.]),
np.array([0.,0.,0.1,0.1,0.19,0.19,0.25,0.25,0.34,0.34,0.45,0.45,0.5,0.5,0.57,0.57,0.61,0.61,0.63,0.63,0.65,0.65,0.67,0.67,0.67])/0.67)
axs[0,0].set_title("Figure 1")
axs[0,1].plot(np.linspace(-2,4,100),np.exp(np.linspace(-2,4,100))/(1+np.exp(np.linspace(-2,4,100))))
axs[0,1].set_title("Figure 2")
axs[0,2].plot(np.array([-1.,0.,1.,2.]),
np.array([0.,0.,1.,1.]))
axs[0,2].set_title("Figure 3")
axs[1,0].plot(np.array([-1.,0,1,2,2,3,4]),
np.array([0.,0.,0.4,0.4,0.6,1.,1]))
axs[1,0].set_title("Figure 4")
axs[1,1].plot(np.array([-1.,0,1,2,2,3,4]),
np.array([0.,0.,0.4,0.,0.6,1.,1]))
axs[1,1].set_title("Figure 5")
axs[1,2].plot(np.array([-1.,0,0,1,1,2]),
np.array([0.,0.,0.4,0.4,1.,1]))
axs[1,2].set_title("Figure 6")
plt.show()