1 / 37

Plan du cours

Plan du cours. Introduction Statistique descriptive Echantillonnage Calcul des probabilités et variables aléatoires Inférence statistique Estimation Tests d’hypothèses Régression linéaire. Inférence. Un premier cas : Moyenne dans une population

mingan
Télécharger la présentation

Plan du cours

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Plan du cours • Introduction • Statistique descriptive • Echantillonnage • Calcul des probabilités et variables aléatoires • Inférence statistique • Estimation • Tests d’hypothèses • Régression linéaire

  2. Inférence • Un premier cas : Moyenne dans une population • Variable : distribution dans la population. • Exemple : • Budget annuel « transport » d’un étudiant ULCO. • Budget annuel moyen ? • Echantillon : prélevé dans la population (échantillon aléatoire). • Moyenne de l’échantillon. • Erreur d’échantillonnage ? • Distribution d’échantillonnage.

  3. Distribution d’échantillonnage • Exemple : • Expérience aléatoire : lancer d’un dé. • Population (infinie) : résultats de lancers du dé. • Variable aléatoire : X = points obtenus. • Distribution de probabilité de X :

  4. Distribution de la population • Normalement inconnue ! • Moyenne population : • Variance population : • Ecart-type population :

  5. Problème • Supposons  inconnue. • Comment estimer la valeur de  à partir d’un échantillon ? • Exemple : échantillon de 2 lancers de dé. • n = 2 • Calculer la moyenne échantillon • Ecart entre et m ?

  6. Distribution d’échantillonnage • En fonction de tous les échantillons possibles(échantillon aléatoire simple – n fixé). • 36 échantillons possibles (même probabilité pour chacun)

  7. Distribution d’échantillonnage • Pour la moyenne échantillon :

  8. Distribution d’échantillonnage • Paramètres de la distribution d’échantillonnage pourn = 2 :

  9. Distribution d’échantillonnage 1 2 • Théorème central limite :Plus n est grand, plus la distribution d’échantillonnage se rapproche de celle d’une v.a. normale ! 3 4

  10. Distribution d’échantillonnage et inférence • Estimation d’un paramètre. • Test d’une hypothèse.

  11. Distribution d’échantillonnage pour une proportion • Population : proportion p d’individus ayant une certaine caractéristique. • Problème : p est inconnue ! • Echantillon de n individus : • X présentent la caractéristique parmi les n. • Estimation de p : • Distribution d’échantillonnage de X :

  12. Inférence statistique Individu Population Paramètres Distribution Distribution d’échantillonnage Statistique Distribution d’échantillonnage

  13. Plan du cours • Introduction • Statistique descriptive • Echantillonnage • Calcul des probabilités et variables aléatoires • Inférence statistique • Estimation • Tests d’hypothèses • Régression linéaire

  14. Estimation • Quelle est la valeur d’un paramètre population ? • Utilisation d’une statistique provenant d’un échantillon. • Estimation ponctuelle : • Calcul d’une valeur unique (estimateur). • Estimation intervalle : • Calcul d’un intervalle, prenant en compte l’erreur d’échantillonnage (intervalle de confiance).

  15. Propriétés des estimateurs • Non biais : • Si l’espérance de l’estimateur est égale au paramètre population. • Convergence : • Si l’erreur d’échantillonnage tend vers 0 lorsque la taille de l’échantillon augmente. • Efficacité : • Si l’estimateur est de variance minimum (distribution d’échantillonnage).

  16. Estimation d’une moyenne • On étudie une variable définie sur une population : X • Distribution de X : m et s • On suppose m inconnue (et s connu). • Echantillon aléatoire simple de n observations. • Estimateur : moyenne échantillon

  17. Distribution échantillonnée de la moyenne échantillon • Normale : si la distribution de X est normale. • Approximativement normale : si n est suffisamment grand (n ≥ 30). • Variable normale réduite :

  18. Quantiles de la normale réduite

  19. Quantiles de la normale réduite

  20. Intervalle de confiance pour m

  21. Intervalle de confiance pour m • Intervalle de confiance au niveau de confiance 1a : • Largeur de l’intervalle : • Diminue lorsque n grandit, • Augmente avec s, • Diminue lorsque a grandit.

  22. Exemple : lancer d’un dé. • On lance 100 fois un dé (n=100). • On connait s=1,71 • On observe : • Intervalle de confiance pour m au niveau de confiance 95% (a=0,05) :

  23. Si s est inconnu ! • Si n est grand (n ≥ 30), on remplace s par s (approximation). • Si n est petit et si la distribution de X est normale, on a :Et l’intervalle de confiance pour m est :

  24. Exemple • On s’intéresse au poids de paniers de pommes. • Un échantillon de 12 paniers donne une moyenne de 738 g et un écart-type de 124 g. • Trouver un intervalle de confiance, aux niveaux 95% et 99%, pour le poids moyen des paniers de pommes.

  25. Exemple • Données : • Supposition : poids distribué normalement. • Intervalle de confiance :

  26. Estimation d’une proportion • On s’intéresse à une caractéristique présente sur une proportion p des individus de la population étudiée. • La proportion p est inconnue. • Echantillon aléatoire simple de n observations. • Soit X le nombre d’observations présentant la caractéristique, et :

  27. Distributions échantillonnées • Distribution exacte de X : • Distribution approchée normale pour un grand échantillon :

  28. Intervalle de confiance • Pour p, au niveau de confiance 1a :ou :

  29. Exemple • Dans une enquête menée auprès de 1000 ménages, on constate que 340 d’entre eux trient correctement leurs déchets. Construire un intervalle de confiance pour la proportion population de ménages qui trient correctement leurs déchets.

  30. Plan du cours • Introduction • Statistique descriptive • Echantillonnage • Calcul des probabilités et variables aléatoires • Inférence statistique • Estimation • Tests d’hypothèses • Régression linéaire

  31. Test d’hypothèse • Objectif : essayer de valider une hypothèse relative à un paramètre population, à partir d’un échantillon. • Exemple : paniers de pommes • Peut-on dire que le poids moyen des paniers de pommes est inférieur à 750g (poids annoncé) ? • On pèse 12 paniers pris au hasard et on observe un poids moyen de 738g et un écart-type de 124g.

  32. Principe de test • On teste une hypothèse H0 (hypothèse nulle) contre une hypothèse alternative H1. • H0 est choisie de façon à connaître la distribution échantillonnée de la statistique utilisée sous H0 (si H0 est vraie). • On définit une règle de décision : • RH0 : On rejette H0 si l’on dispose d’éléments suffisamment convaincants pour le faire. • On ne rejette pas H0 dans le cas contraire.

  33. Exemple • Hypothèses : • Statistique : • Distribution sous H0 : • On observe : • Règle de décision ?

  34. Règle de décision • Rejeter H0 si la valeur observée est peu vraisemblable sous H0 et plus vraisemblable si H1 est vraie. • Deux types d’erreurs peuvent être commises : • Type 1 : Rejeter H0 alors qu’elle est vraie. • Type 2 : Ne pas rejeter H0 alors qu’elle est fausse.

  35. Règle de décision • Risques d’erreurs : • Type 1 : • Type 2 : • Diminuer a augmenter b ! • On fixe a (car distribution connue sous H0). Souvent 5% ou 1%. • On établit la règle de décision en fonction de la distribution sous H0 et de a.

  36. Exemple • Rejeter H0 (a = 5%) si : • Test unilatéral à gauche. • Conclusion : • On ne peut pas rejeter H0. • On ne peut donc pas montrer que m < 750g. • On ne peut pas en conclure que m≥ 750g !

  37. Exemple • En 2007, 48 étudiants de M1, parmi lesquels 36 « Lille3 » et 12 « ULCO », ont obtenu les notes suivantes en statistique.

More Related