1 / 51

Y - 7102 STATISTIQUE

PARAMTRES vs STATISTIQUES. Population est caractrise par des paramtres souvent inconnus que l'on doit estimer.Un chantillon est caractris par des statistiques ou des estims.. Moyenne et cart-type. Population: moyenne= m = S X/N cart-type s = S(X-m)2/(N)chantillon: moye

hue
Télécharger la présentation

Y - 7102 STATISTIQUE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Y - 7102 STATISTIQUE

    2. PARAMTRES vs STATISTIQUES Population est caractrise par des paramtres souvent inconnus que lon doit estimer. Un chantillon est caractris par des statistiques ou des estims.

    3. Moyenne et cart-type Population: moyenne= m = S X/N cart-type s = S(X-m)2/(N) chantillon: moyenne=X = S X/N cart-type s = S(X-X)2/(N-1)

    4. s = S(X-X)2/(N-1) Pourquoi N-1? Supposons une moyenne de population de 5. Si je prends 5 chiffres (donc un chantillon de 4 sujets) et que ma moyenne de population est 5, le 5e chiffre de ma distribution est fix par les 4 autres: (1+4+7+?+2)/5=5 (14+?)=25 ?=25-14=11. Chaque fois que je prendrai une nouvelle distribution, mon 5e chiffre sera dpendant des autres. Donc je peux le prdire avec les autres et la moyenne fixe. Il nest pas indpendant.

    5. Moyenne et cart-type du nombre de mets dans la population

    6. Moyenne des moyennes

    7. Erreur type et cart-type Erreur-type: cart-type de la distribution des moyennes (standard error of mean: SEM) s (SEM) = s/ VN cart-type d une distribution des donnes d un chantillon s = VS(X-X)2/(N-1)

    8. Erreur-type vs cart-type Lerreur-type est la moyenne du carr des carts entre les diffrentes valeurs possibles des X des chantillons et la moyenne de la population m. S(X-m)2 N Erreur -type: est fonction de lcart-type et du N. Plus N est grand, plus lerreur-type (SEM= standard error of mean) est petit.

    9. Erreur type et cart type Erreur type (ET) = indice de variabilit des moyennes par rapport la moyenne m de la population. Un > erreur type = chantillon moins reprsentatif. Conclusions tires risquent dtre fausses dans population.

    10. cart type (T) Moyenne du carr des carts entre les scores et la moyenne de lchantillon. Indice de variabilit des scores autour de moyenne de chantillon: X sorte de moyenne des distances de chaque sujet par rapport la moyenne du groupe s= VS(X-X)2/(N-1)

    11. Reprsentation gomtrique de T

    12. Diffrence entre ErT et cT dans la notation Supposons: N=100, X =8.5, s=2.5 X = 8.52 (sd): 95% des sujets de lchantillon sont entre 3.5 (8.5-2(2.5))et 13(8.5+2(2.5)). X=8.5 2(SEm): 95% de chance que la moyenne de population soit entre 8 (8.5-2(.25)) et 9 (8.5+2(.25)).

    13. Prsentation graphique avec les erreurs-types

    14. Prsentation graphique avec les cart-types

    16. tapes de linfrence statistique 1- Slection dun chantillon alatoire reprsentatif de la population. 2- Rpartition alatoire des sujets en groupes exprimental et contrle. 3- Formulation de lhypothse de recherche.

    17. tapes de l infrence statistique 4- Formulation de lhypothse nulle et des hypothses alternatives. 5- Choix du seuil alpha ainsi que de la puissance. 7- Infrence partir des rsultats du test statistique.

    18. Slection et rpartition alatoire

    19. Hypothse de recherche Le groupe recevant le bta bloqueur aura une meilleure performance leffort, telle que mesure par le tapis roulant.

    20. Formulation des hypothses nulle et alternative

    22. Hypothse nulle Hypothse nulle = le hasard seul amnerait aucune diffrence entre les groupes. On cherche rfuter Ho. Pourquoi poser Ho? Il est impossible de savoir ce qui arriverait dans la population. On assume Ho vrai jusqu preuve du contraire.

    23. Bicaudal vs unicaudal (bidirectionnel vs unidirectionnel (one tail vs two tails) Rejet de Ho = acceptation de Ha. UNICAUDAL= une seule possibilit. Le groupe exprimental ne peut pas tre pire que le contrle BICAUDAL= le groupe exprimental peut tre meilleur mais pourrait tre pire!!!!

    24. Unicaudal Situation utiliser avec prcaution. On doit sappuyer sur la littrature ou sur une argumentation clinique solide pour ngliger une des possibilits. Si cela est possible, il y a augmentation de puissance

    25. Probabilit dapparition dune valeur de z, avec distribution dont la moyenne est 0

    26. Bicaudal vs unicaudal (bidirectionnel vs unidirectionnel (one tail vs two tails)

    27. Rejet de Ho Lhypothse de recherche doit spcifier une direction. Le rejet de Ho amne acception de Ha. Non rejet de Ho nest pas confirmation de Ho. On ne confirme jamais Ho puisquelle est postule vraie au dpart. On ne peut que la rejeter ou non. Conclusion: tant donn taille de lchantillon, sa reprsentativit et la taille de leffet de traitement, on ne peut rejeter Ho.

    28. Erreur a et erreur b Rejet de Ho (me=mc) peut occasionner ERREUR ALPHA ou de type I. Erreur alpha: conclure que le traitement est efficace alors quil ne lest pas. Cot: donn une clientle un traitement potentiellement inutile ou dangereux.

    29. Erreur a et erreur b Non rejet de Ho (me<mc, me>mc): ERREUR BETA ou de type II. Erreur beta: conclure que le traitement nest pas efficace alors quil lest. Cot: priver une clientle dun traitement potentiellement utile.

    30. Erreur a et erreur b

    31. Conclusion sur les erreurs Types derreurs: Type I: rejeter par erreur lhypothse nulle type II: accepter par erreur lhypothse nulle type III: rsoudre le mauvais problme au mauvais moment dans la mauvaise organisation et par la mauvaise personne. (Mitroff, 1977) (error of the third kind) Type IV: poser des questions pour identifier un problme mal dfini, quand la nature vraie ou fausse des questions est indtermine au sens absolu. (Loveridge, 1997) (error of the fourth kind)

    32. PUISSANCE Probabilit de rejeter Ho si elle est fausse. Probabilit de dtecter une diffrence significative alors quil y a un effet. Cest le contraire de erreur Beta. Choix du seuil a = niveau de probabilit de rejeter Ho. Ho toujours assume vraie, on veut navoir que 5% ou 1% de chance dobserver une diffrence de taille Y.

    33. Seuil alpha .05 Si Ho tait vraie, 5% de chances dobtenir une diffrence de taille Y. 5% de chances de rejeter Ho vraie avec une diffrence de taille Y. 95% de chances de ne pas rejeter Ho si elle est vraie, avec une diffrence de taille < Y. Seuil alpha est dcid a priori. Fonction du cot de lerreur alpha. Voir document PDF 1

    34. Winer: When the power of a test is likely to be low under these levels of significance (0,05 or 0,01), and when the type 1 and the type 2 errors are of approximately equal importance, the 0.30 and 0,20 levels of significance may be more appropriate than the 0,05 and 0,01 levels p.14). Cohen mentionne que dans de telles conditions, le rapport erreur Bta / erreur Alpha devrait plutt tendre vers 1 . Winer, Statistical principles in experimental design. second edition ed. 1971, New York: McGraw-Hill. Cohen, Statistical power analysis for the behavioural sciences. 1969, New York: Academic Press.

    35. Puissance et seuil b Un seuil de b .20 = 20% de chance de ne pas rejeter Ho alors quelle est fausse, 80% de pouvoir rejeter Ho alors quelle est fausse, 80% de chance de pouvoir dtecter une diffrence significative un seuil a donn = PUISSANCE

    36. Exemple (niveau de dpression sur lInventaire de dpression de Beck

    37. Relation entre a, b et puissance Choix de a sous dcision du chercheur, selon le cot de a. a plus svre la puissance car + difficile dobtenir une diffrence significative .001 qu .05.

    38. Facteurs influenant la puissance Le seuil alpha choisi: seuil moins svre (0.10 ou 0.05 au lieu de 0.01) puissance. Plus leffet de traitement (D) est grand plus la puissance . Plus lcart-type(s) est petit, plus la puissance . Plus la taille du N (avec seuil a, s et D constant) plus la puissance .

    39. Calcul de la taille de leffet (effect size) Pour une diffrence de moyenne entre deux groupes: d de Cohen: (1 - 2)/ s combins g de Hedges: (M1 - M2)/ s combins r de Pearson: corrlation: voir PDF document 2.

    40. Critres pour choisir une taille deffet, a priori Recherches antrieures: examiner les moyennes et cart type donnes dans les tudes. Diffrence juge cliniquement intressante ou importante: pidmiologie vs recherche clinique. Convention: petit, moyen grand: 0.20, 0.50, 0.80

    43. Calcul de la puissance Calcul de delta d pour une moyenne: d = d ? ? N d = moy. 1 - moy. population moyenne des carts type Calcul de d pour 2 moyennes: d = d ? ? N/2

    44. Calcul de la puissance Calcul de d pour chantillons relis: d =d /? N ou d =moy. 1 - moy. 2 s x1-x2 et s (x1-x2)= s ? 2(1-r)

    45. Calcul de la taille dchantillon ncessaire En se servant de la table, on trouve le d qui correspond la puissance recherche pour un seuil alpha donn. Ex: 80% 0,05 donne un d de 2.8. Dans la formule: N = 2(d/d)2 si d=0,5 on a: N=2(2.8/0,5)2 =63 sujets

    46. Calcul du nombre initial pour contrler la perte de sujets Faire le calcul de puissance selon les besoins de ltude. Appliquez la formule: Ni = N / (1-Pd) Ni = nombre initial N = nombre calcul sans perte Pd = probabilit de perte

    47. Logiciels calcul de puisance Review of statistical power analysis software http://www.zoology.ubc.ca/~krebs/power.html GPOWER http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/index.html PASS 2000 power analysis http://www.ncss.com/passinfo.html NQuery http://www.statsol.ie/index.html Power and Precision http://www.power-analysis.com/

    49. Background Given an observed test statistic and its degrees of freedom, one may compute the observed P value with most statistical packages. It is unknown to what extent test statistics and P values are congruent in published medical papers.

    50. Methods We checked the congruence of statistical results reported in all the papers of volumes 409412 of Nature (2001) and a random sample of 63 results from volumes 322323 of BMJ (2001). We also tested whether the frequencies of the last digit of a sample of 610 test statistics deviated from a uniform distribution (i.e., equally probable digits).

    51. Results 11.6% (21 of 181) and 11.1% (7 of 63) of the statistical results published in Nature and BMJ respectively during 2001 were incongruent, probably mostly due to rounding, transcription, or type-setting errors. At least one such error appeared in 38% and 25% of the papers of Nature and BMJ, respectively. In 12% of the cases, the significance level might change one or more orders of magnitude. The frequencies of the last digit of statistics deviated from the uniform distribution and suggested digit preference in rounding and reporting.

    52. Conclusions This incongruence of test statistics and P values is another example that statistical practice is generally poor, even in the most renowned scientific journals, and that quality of papers should be more controlled and valued.

More Related