300 likes | 431 Vues
Ateliers méthodologiques Département de Biostatistique et unité Epitraumac SPSS - STATA. Quelques éléments de comparaison M. Dramaix. Les fichiers – les fenêtres. SPSS : approche similaire de celle des autres logiciels WINDOWS (EXCEL) Données : éditables directement dans la fenêtre
E N D
Ateliers méthodologiquesDépartement de Biostatistique et unité Epitraumac SPSS - STATA Quelques éléments de comparaison M. Dramaix 13 novembre 2007
Les fichiers – les fenêtres • SPSS : approche similaire de celle des autres logiciels WINDOWS (EXCEL) • Données : éditables directement dans la fenêtre • Exportation et importation de nombreux types de fichiers: EXCEl, DBF, STATA, SAS… • STATA : plus proche d’EPIINFO • Pas de sauvegarde possible de l’output à posteriori • A l’écran, longueur de l’output lisible limitée • Données: visibles avec DATA BROWSER • Données: éditables avec DATA EDITOR • Exportation – importation plus limité: fichiers ASCII, SAS XPORT 13 novembre 2007
Les fenêtres de SPSS 13 novembre 2007
13 novembre 2007 Les fenêtres de STATA
13 novembre 2007 SPSS DATA VIEW
13 novembre 2007 STATA DATA BROWSER
Les commandes (I) • Dans SPSS • Plus simple • La plupart directement accessibles par les menus • Commandes facilement identifiables • Commandes non accessibles: utilisation dans la programmation, par ex: DO REPEAT 13 novembre 2007
Les commandes (II) • Dans STATA • Plus complexe • Mais logique dans l’écriture pour options, sélection… • Pas simple de retrouver toutes les commandes par les menus 13 novembre 2007
Les commandes (III) • Dans STATA • Dans certains cas, plusieurs commandes nécessaires pour une commande SPSS • Plus grande nécessité de connaître la théorie pour trouver les commandes adéquates moins de risque d’erreur dans le choix des méthodes • Pas d’abréviations, fautes « orthographe », ne confond pas majuscules et minuscules 13 novembre 2007
Exemple 1: test t - SPSS T-TEST GROUPS = PPN(0 1) /MISSING = ANALYSIS /VARIABLES = PoidM /CRITERIA = CI(.95) . 13 novembre 2007
Exemple 1: test t - STATA robvar PoidM, by( PPN ) ttest PoidM, by(PPN) ttest PoidM, by(PPN) unequal 13 novembre 2007
Exemple 2 – Régression (I) 13 novembre 2007
Exemple 2 – Régression STATA (suite) 13 novembre 2007
Exemple 2 – Régression (2) REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA COLLIN TOL /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT Pnaiss /METHOD=ENTER POIDMK AGEM Tabac Probur /SCATTERPLOT=(*ZRESID ,*ZPRED ) /RESIDUALS HIST(ZRESID) NORM(ZRESID) . Commande SPSS (paste) regress Pnaiss POIDMK AGEM Tabac Probur, beta predict fit predict sdres, rstandard qnorm sdres twoway (scatter sdres fit) estat vif Commandes STATA 13 novembre 2007
Exemple 3 – procédure pas à pas REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT POIENF /METHOD=STEPWISE AGEM ETCIV PERBG BAUDE BMI . Commande SPSS stepwise, pe(0.05): regress POIENF AGEM ETCIV PERBG BAUDE BMI stepwise, pe(0.05): regress POIENF AGEM ETCIV PERBG BAUDE BMI stepwise, pe(0.05): regress POIENF AGEM ETCIV PERBG BAUDE BMI Commande STATA Commande STATA xi: stepwise, pe(0.05): regress POIENF AGEM i.ETUM ETCIV PERBG BAUDE BMI i.grparite xi: stepwise, pe(0.05): regress POIENF AGEM i.ETUM ETCIV PERBG BAUDE BMI i.grparite xi: stepwise, pe(0.05): regress POIENF AGEM i.ETUM ETCIV PERBG BAUDE BMI i.grparite xi: stepwise, pe(0.05): regress POIENF AGEM i.ETUM ETCIV PERBG BAUDE BMI i.grparite Commande STATA avec décomposition en indicateurs Commande STATA avec décomposition en indicateurs Commande STATA avec décomposition en indicateurs 13 novembre 2007
Les méthodes disponibles • Plus étendues dans STATA • Plus de méthodes appliquées en épidémiologie • Ex: analyse des tables, taille échantillon… • Sorties différentes avec les deux logiciels: plus ou moins de statistiques avec l’un ou l’autre • Ex: mesures association dans les tables, ANOVA, procédures pas à pas…plus détaillé dans SPSS • Ex: test d’égalité des variances, mesures épidémiologiques dans les tables, courbes ROC…plus détaillé dans STATA 13 novembre 2007
Méthodes 13 novembre 2007
Sortie test t - SPSS 13 novembre 2007
Sortie test t – STATA (I) . robvar PoidM, by( PPN ) | Summary of Poids mère avant | (pounds) PPN | Mean Std. Dev. Freq. ------------+------------------------------------ >= 2500g | 133.3 31.724016 130 < 2500g | 122.13559 26.559275 59 ------------+------------------------------------ Total | 129.81481 30.57938 189 W0 = 1.12854604 df(1, 187) Pr > F = 0.28945567 W50 = 0.50995689 df(1, 187) Pr > F = 0.47604792 W10 = 0.74660652 df(1, 187) Pr > F = 0.38865972 13 novembre 2007
Sortie test t – STATA (II) . ttest PoidM, by(PPN) Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- >= 2500g | 130 133.3 2.78238 31.72402 127.795 138.805 < 2500g | 59 122.1356 3.457723 26.55928 115.2142 129.057 ---------+-------------------------------------------------------------------- combined | 189 129.8148 2.224323 30.57938 125.427 134.2027 ---------+-------------------------------------------------------------------- diff | 11.16441 4.743297 1.807157 20.52166 ------------------------------------------------------------------------------ diff = mean(>= 2500g) - mean(< 2500g) t = 2.3537 Ho: diff = 0 degrees of freedom = 187 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.9902 Pr(|T| > |t|) = 0.0196 Pr(T > t) = 0.0098 13 novembre 2007
Sorties Tables - SPSS 13 novembre 2007
Sorties Tables – STATA (I) . tabulate Tabac PPN, chi2 column exact expected lrchi2 V +--------------------+ | Key | |--------------------| | frequency | | expected frequency | | column percentage | +--------------------+ Tabagisme | durant | PPN grossesse | >= 2500g < 2500g | Total -----------+----------------------+---------- Non | 86 29 | 115 | 79.1 35.9 | 115.0 | 66.15 49.15 | 60.85 -----------+----------------------+---------- Oui | 44 30 | 74 | 50.9 23.1 | 74.0 | 33.85 50.85 | 39.15 -----------+----------------------+---------- Total | 130 59 | 189 | 130.0 59.0 | 189.0 | 100.00 100.00 | 100.00 Pearson chi2(1) = 4.9237 Pr = 0.026 likelihood-ratio chi2(1) = 4.8674 Pr = 0.027 Cramér's V = 0.1614 Fisher's exact = 0.036 1-sided Fisher's exact = 0.020 13 novembre 2007
Sorties Tables – STATA (II)Tables pour “épidémiologistes” . cc PPN Tabac Proportion | Exposed Unexposed | Total Exposed -----------------+------------------------+------------------------ Cases | 30 29 | 59 0.5085 Controls | 44 86 | 130 0.3385 -----------------+------------------------+------------------------ Total | 74 115 | 189 0.3915 | | | Point estimate | [95% Conf. Interval] |------------------------+------------------------ Odds ratio | 2.021944 | 1.029092 3.965864 (exact) Attr. frac. ex. | .5054264 | .0282695 .7478481 (exact) Attr. frac. pop | .2569965 | +------------------------------------------------- chi2(1) = 4.92 Pr>chi2 = 0.0265 13 novembre 2007
Sorties Analyse Stratifiée – SPSS (I) 13 novembre 2007
Sorties Analyse Stratifiée – SPSS (II) 13 novembre 2007
Sorties Analyses Stratifiée - STATA . cc PPN Tabac, by(Ethnie) pool Ethnie | OR [95% Conf. Interval] M-H Weight -----------------+------------------------------------------------- Blanc | 5.757576 1.657574 25.1388 1.375 (exact) Noir | 3.3 .4865385 23.45437 .7692308 (exact) Autres | 1.25 .273495 5.278229 2.089552 (exact) -----------------+------------------------------------------------- Crude | 2.021944 1.029092 3.965864 (exact) Pooled (direct) | 2.945162 1.371751 6.323289 M-H combined | 3.086381 1.49074 6.389949 ------------------------------------------------------------------- Test of homogeneity (direct) chi2(2) = 3.02 Pr>chi2 = 0.2213 Test of homogeneity (M-H) chi2(2) = 3.03 Pr>chi2 = 0.2197 Test that combined OR = 1: Mantel-Haenszel chi2(1) = 9.41 Pr>chi2 = 0.0022 13 novembre 2007
Autres exemples • ANOVA • Logistique stepwise • … 13 novembre 2007
Graphiques • Performants avec les deux logiciels: édition, exportation • Plus de possibilités avec STATA • Exemples 13 novembre 2007
Graphiques SPSS 13 novembre 2007
Conclusion • Recherche • STATA + • Enseignement • SPSS + • STATA exige d’aller plus en profondeur dans la théorie éventuellement plus de détails mathématiques nécessaires 13 novembre 2007