520 likes | 750 Vues
PARAMTRES vs STATISTIQUES. Population est caractrise par des paramtres souvent inconnus que l'on doit estimer.Un chantillon est caractris par des statistiques ou des estims.. Moyenne et cart-type. Population: moyenne= m = S X/N cart-type s = S(X-m)2/(N)chantillon: moye
E N D
1. Y - 7102STATISTIQUE
2. PARAMTRES vs STATISTIQUES Population est caractrise par des paramtres souvent inconnus que lon doit estimer.
Un chantillon est caractris par des statistiques ou des estims.
3. Moyenne et cart-type Population: moyenne= m = S X/N cart-type s = S(X-m)2/(N)
chantillon: moyenne=X = S X/N cart-type s = S(X-X)2/(N-1)
4. s = S(X-X)2/(N-1) Pourquoi N-1? Supposons une moyenne de population de 5.
Si je prends 5 chiffres (donc un chantillon de 4 sujets) et que ma moyenne de population est 5, le 5e chiffre de ma distribution est fix par les 4 autres: (1+4+7+?+2)/5=5
(14+?)=25 ?=25-14=11.
Chaque fois que je prendrai une nouvelle distribution, mon 5e chiffre sera dpendant des autres. Donc je peux le prdire avec les autres et la moyenne fixe. Il nest pas indpendant.
5. Moyenne et cart-type du nombre de mets dans la population
6. Moyenne des moyennes
7. Erreur type et cart-type Erreur-type: cart-type de la distribution des moyennes (standard error of mean: SEM)
s (SEM) = s/ VN
cart-type d une distribution des donnes d un chantillon
s = VS(X-X)2/(N-1)
8. Erreur-type vs cart-type Lerreur-type est la moyenne du carr des carts entre les diffrentes valeurs possibles des X des chantillons et la moyenne de la population m. S(X-m)2 N
Erreur -type: est fonction de lcart-type et du N. Plus N est grand, plus lerreur-type (SEM= standard error of mean) est petit.
9. Erreur type et cart type Erreur type (ET) = indice de variabilit des moyennes par rapport la moyenne m de la population. Un > erreur type = chantillon moins reprsentatif.
Conclusions tires risquent dtre fausses dans population.
10. cart type (T) Moyenne du carr des carts entre les scores et la moyenne de lchantillon. Indice de variabilit des scores autour de moyenne de chantillon: X
sorte de moyenne des distances de chaque sujet par rapport la moyenne du groupe
s= VS(X-X)2/(N-1)
11. Reprsentation gomtrique de T
12. Diffrence entre ErT et cT dans la notation Supposons: N=100, X =8.5, s=2.5
X = 8.52 (sd): 95% des sujets de lchantillon sont entre 3.5 (8.5-2(2.5))et 13(8.5+2(2.5)).
X=8.5 2(SEm): 95% de chance que la moyenne de population soit entre 8 (8.5-2(.25)) et 9 (8.5+2(.25)).
13. Prsentation graphique avec les erreurs-types
14. Prsentation graphique avec les cart-types
16. tapes de linfrence statistique 1- Slection dun chantillon alatoire reprsentatif de la population.
2- Rpartition alatoire des sujets en groupes exprimental et contrle.
3- Formulation de lhypothse de recherche.
17. tapes de l infrence statistique 4- Formulation de lhypothse nulle et des hypothses alternatives.
5- Choix du seuil alpha ainsi que de la puissance.
7- Infrence partir des rsultats du test statistique.
18. Slection et rpartitionalatoire
19. Hypothse de recherche Le groupe recevant le bta bloqueur aura une meilleure performance leffort, telle que mesure par le tapis roulant.
20. Formulation des hypothses nulle et alternative
22. Hypothse nulle Hypothse nulle = le hasard seul amnerait aucune diffrence entre les groupes.
On cherche rfuter Ho.
Pourquoi poser Ho?
Il est impossible de savoir ce qui arriverait dans la population. On assume Ho vrai jusqu preuve du contraire.
23. Bicaudal vs unicaudal(bidirectionnel vs unidirectionnel(one tail vs two tails) Rejet de Ho = acceptation de Ha.
UNICAUDAL= une seule possibilit. Le groupe exprimental ne peut pas tre pire que le contrle
BICAUDAL= le groupe exprimental peut tre meilleur mais pourrait tre pire!!!!
24. Unicaudal Situation utiliser avec prcaution.
On doit sappuyer sur la littrature ou sur une argumentation clinique solide pour ngliger une des possibilits.
Si cela est possible, il y a augmentation de puissance
25. Probabilit dapparition dune valeur de z, avec distribution dont la moyenne est 0
26. Bicaudal vs unicaudal(bidirectionnel vs unidirectionnel(one tail vs two tails)
27. Rejet de Ho Lhypothse de recherche doit spcifier une direction.
Le rejet de Ho amne acception de Ha.
Non rejet de Ho nest pas confirmation de Ho. On ne confirme jamais Ho puisquelle est postule vraie au dpart. On ne peut que la rejeter ou non.
Conclusion: tant donn taille de lchantillon, sa reprsentativit et la taille de leffet de traitement, on ne peut rejeter Ho.
28. Erreur a et erreur b Rejet de Ho (me=mc) peut occasionner ERREUR ALPHA ou de type I.
Erreur alpha: conclure que le traitement est efficace alors quil ne lest pas.
Cot: donn une clientle un traitement potentiellement inutile ou dangereux.
29. Erreur a et erreur b Non rejet de Ho (me<mc, me>mc): ERREUR BETA ou de type II.
Erreur beta: conclure que le traitement nest pas efficace alors quil lest.
Cot: priver une clientle dun traitement potentiellement utile.
30. Erreur a et erreur b
31. Conclusion sur les erreurs Types derreurs:
Type I: rejeter par erreur lhypothse nulle
type II: accepter par erreur lhypothse nulle
type III: rsoudre le mauvais problme au mauvais moment dans la mauvaise organisation et par la mauvaise personne. (Mitroff, 1977) (error of the third kind)
Type IV: poser des questions pour identifier un problme mal dfini, quand la nature vraie ou fausse des questions est indtermine au sens absolu. (Loveridge, 1997) (error of the fourth kind)
32. PUISSANCE Probabilit de rejeter Ho si elle est fausse.
Probabilit de dtecter une diffrence significative alors quil y a un effet.
Cest le contraire de erreur Beta.
Choix du seuil a = niveau de probabilit de rejeter Ho. Ho toujours assume vraie, on veut navoir que 5% ou 1% de chance dobserver une diffrence de taille Y.
33. Seuil alpha .05 Si Ho tait vraie, 5% de chances dobtenir une diffrence de taille Y.
5% de chances de rejeter Ho vraie avec une diffrence de taille Y.
95% de chances de ne pas rejeter Ho si elle est vraie, avec une diffrence de taille < Y.
Seuil alpha est dcid a priori. Fonction du cot de lerreur alpha. Voir document PDF 1
34. Winer: When the power of a test is likely to be low under these levels of significance (0,05 or 0,01), and when the type 1 and the type 2 errors are of approximately equal importance, the 0.30 and 0,20 levels of significance may be more appropriate than the 0,05 and 0,01 levels p.14).
Cohen mentionne que dans de telles conditions, le rapport erreur Bta / erreur Alpha devrait plutt tendre vers 1 .
Winer, Statistical principles in experimental design. second edition ed. 1971, New York: McGraw-Hill.
Cohen, Statistical power analysis for the behavioural sciences. 1969, New York: Academic Press.
35. Puissance et seuil b Un seuil de b .20 =
20% de chance de ne pas rejeter Ho alors quelle est fausse,
80% de pouvoir rejeter Ho alors quelle est fausse,
80% de chance de pouvoir dtecter une diffrence significative un seuil a donn = PUISSANCE
36. Exemple (niveau de dpression sur lInventaire de dpression de Beck
37. Relation entre a, b et puissance Choix de a sous dcision du chercheur, selon le cot de a.
a plus svre la puissance car + difficile dobtenir une diffrence significative .001 qu .05.
38. Facteurs influenantla puissance Le seuil alpha choisi: seuil moins svre (0.10 ou 0.05 au lieu de 0.01) puissance.
Plus leffet de traitement (D) est grand plus la puissance .
Plus lcart-type(s) est petit, plus la puissance .
Plus la taille du N (avec seuil a, s et D constant) plus la puissance .
39. Calcul de la taille de leffet (effect size) Pour une diffrence de moyenne entre deux groupes:
d de Cohen: (1 - 2)/ s combins
g de Hedges: (M1 - M2)/ s combins
r de Pearson: corrlation:
voir PDF document 2.
40. Critres pour choisir une taille deffet, a priori Recherches antrieures: examiner les moyennes et cart type donnes dans les tudes.
Diffrence juge cliniquement intressante ou importante: pidmiologie vs recherche clinique.
Convention: petit, moyen grand:
0.20, 0.50, 0.80
43. Calcul de la puissance Calcul de delta d pour une moyenne: d = d ? ? N
d = moy. 1 - moy. population moyenne des carts type
Calcul de d pour 2 moyennes:
d = d ? ? N/2
44. Calcul de la puissance Calcul de d pour chantillons relis:
d =d /? N
ou d =moy. 1 - moy. 2 s x1-x2
et s (x1-x2)= s ? 2(1-r)
45. Calcul de la taille dchantillon ncessaire En se servant de la table, on trouve le d qui correspond la puissance recherche pour un seuil alpha donn. Ex: 80% 0,05 donne un d de 2.8. Dans la formule:
N = 2(d/d)2 si d=0,5 on a:
N=2(2.8/0,5)2 =63 sujets
46. Calcul du nombre initialpour contrler la perte de sujets Faire le calcul de puissance selon les besoins de ltude.
Appliquez la formule:
Ni = N / (1-Pd)
Ni = nombre initial
N = nombre calcul sans perte
Pd = probabilit de perte
47. Logiciels calcul de puisance Review of statistical power analysis software
http://www.zoology.ubc.ca/~krebs/power.html
GPOWER
http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/index.html
PASS 2000 power analysis
http://www.ncss.com/passinfo.html
NQuery
http://www.statsol.ie/index.html
Power and Precision
http://www.power-analysis.com/
49. Background
Given an observed test statistic and its degrees of freedom, one may compute the observed P value with most statistical packages. It is unknown to what extent test statistics and P values are congruent in published medical papers.
50. Methods
We checked the congruence of statistical results reported in all the papers of volumes 409412 of Nature (2001) and a random sample of 63 results from volumes 322323 of BMJ (2001). We also tested whether the frequencies of the last digit of a sample of 610 test statistics deviated from a uniform distribution (i.e., equally probable digits).
51. Results
11.6% (21 of 181) and 11.1% (7 of 63) of the statistical results published in Nature and BMJ respectively during 2001 were incongruent, probably mostly due to rounding, transcription, or type-setting errors. At least one such error appeared in 38% and 25% of the papers of Nature and BMJ, respectively. In 12% of the cases, the significance level might change one or more orders of magnitude. The frequencies of the last digit of statistics deviated from the uniform distribution and suggested digit preference in rounding and reporting.
52. Conclusions
This incongruence of test statistics and P values is another example that statistical practice is generally poor, even in the most renowned scientific journals, and that quality of papers should be more controlled and valued.