360 likes | 1.16k Vues
Qu'est-ce qu'une analyse discriminante?. Permet d'
E N D
1. Analyse Discriminante Fatim Ciss
Brigitte Lalonde
Frdric Moisan
Katleen Tessier
2. Quest-ce quune analyse discriminante? Permet dtudier la diffrence entre 2 ou plusieurs groupes en tenant compte de multiples variables simultanment
Groupes mutuellement exclusifs
Ncessite 2 groupes ou plus, qui diffrent sur plusieurs variables: celles-ci peuvent tre mesures 2 niveaux de mesure (intervalle et ratio)
Intro: anal. Discrim. Est une procdure stats avance et complexe, nous allons tenter dtre le plus simple possible
Voir schma p.10
Interval: pas de 0 absolu
Ratio: avec 0 absolu
Intro: anal. Discrim. Est une procdure stats avance et complexe, nous allons tenter dtre le plus simple possible
Voir schma p.10
Interval: pas de 0 absolu
Ratio: avec 0 absolu
3. Quest-ce quune analyse discriminante? (suite)
Le but dune analyse discriminante est dtudier les relations entre une variable qualitative et un ensemble de variables explicatives quantitatives
Aide analyser les diffrences entre les groupes et/ou donne les moyens pour assigner (classifier) les cas dans le groupe lui ressemblant le plus
Cas: voir plus tard dans notre ex.Cas: voir plus tard dans notre ex.
4. Objectifs de lanalyse discriminante Dterminer les variables explicatives les plus discriminantes vis vis des classes dtermines
Dterminer quel groupe appartient un individu partir de ses caractristiques
Mais surtout valider une classification ou faire un choix entre plusieurs classifications pour savoir laquelle est la plus pertinente. (Lanalyse discriminante intervient donc postriori dune classification).
5. Quand utiliser lanalyse discriminante? Prsence de 2 ou plusieurs groupes mutuellement exclusifs
Chacun des cas (unit danalyse; ce qui est tudi) doivent appartenir 1 seul groupe
Exception: cas nappartient aucun groupe car - exclu
- va tre classifi plus tard dans le processus Data cases (ex. Animaux, pays.etc.)
Exception: exclu pour une raison x par le chercheur
clasiffi plus tard bas, car incidents fururs Data cases (ex. Animaux, pays.etc.)
Exception: exclu pour une raison x par le chercheur
clasiffi plus tard bas, car incidents fururs
6. Quand utiliser lanalyse discriminante? (suite) Analyse discriminante: un terme large, englobant plusieurs activits statistiques trs relies
Le chercheur ne les utilise pas toutes la fois, il en slectionne quelques unes
Plus frquemment: celles pour interprter les diffrences entre les groupes et celles pour classer les cas dans des groupes
Ex: Wilks Lambda, Canonical Discriminant Function Coefficient, Eigenvalue, etc. Wilks est le + utilisWilks est le + utilis
7. Quand utiliser lanalyse discriminante? (suite) Le chercheur est appel interprter la faon dont les groupes diffrent
il discrimine!
Selon certaines caractristiques
Formules mathmatiques drivant des fonctions discriminantes (gnres par SPSS)
Aussi utilis pour classifier
Discriminer selon certaines caractristiques, les discriminants les plus puissants
Come mentionn prcdemment: pas juste pour interp., mais pour classifier comme dit plus ttDiscriminer selon certaines caractristiques, les discriminants les plus puissants
Come mentionn prcdemment: pas juste pour interp., mais pour classifier comme dit plus tt
8. Quand utiliser lanalyse discriminante? (suite) Variables discriminantes: caractristiques pour distinguer les groupes (intervalle et ratio)
Aucunes limites pour le nombre de variables discriminantes, en autant que le nombre total de cas dpasse le nombre de variables par 2 ou plus
9. Quand utiliser lanalyse discriminante? (suite) Quelques limites:
1- Les variables explicatives doivent tre mtriques ou binaires
2- Aucune variable ne peut tre une combinaison linaire dautres variables discriminantes
3- La matrice de covariance de la population est gale pour chaque groupe
4- Chaque groupe est tir dune population ayant une distribution multivarie normale
Si les donnes ne les respectent pas, les rsulats statistiques ne rflteront pas bien la ralit Limites au niveau des proprits statistiques que les var.discri. Peuvent avoir
1-rapel; combinaison linaire est la somme dune ou plusieurs var. ayant t weighted en terme constant
(raisons math, mais aussi logique, car une combinaison napporte ien de nouveau, cest redondant)
3- sinon, linterprtation de la significance devra tre faite avec qqs bmolsLimites au niveau des proprits statistiques que les var.discri. Peuvent avoir
1-rapel; combinaison linaire est la somme dune ou plusieurs var. ayant t weighted en terme constant
(raisons math, mais aussi logique, car une combinaison napporte ien de nouveau, cest redondant)
3- sinon, linterprtation de la significance devra tre faite avec qqs bmols
10. En rsumcest quoi?
Analyse discriminante est utilise pour tudier la diffrence entre 2 ou + groupes et un ensemble de variables discriminantes
Cette technique relie 1 variable nominale plusieurs variables dintervalles
Petit rapel.montrer encore la figure 1 (p.10)Petit rapel.montrer encore la figure 1 (p.10)
11. Attention! Aucune mention de direction de leffet
Les groupes nont pas t identifis comme tant des VD ou des VI, ni les variables discriminantes
Sinon, cest une rgression multiple
Donc, la principale diffrence est que lanalyse discriminante traite la VD comme tant mesure au niveau nominal (groupes) Voir schma 1: pas de flche
Sinon cest une rg. Mul.: si les gr sont identifis comme dpendants des var,discriminantesVoir schma 1: pas de flche
Sinon cest une rg. Mul.: si les gr sont identifis comme dpendants des var,discriminantes
12. En rsumconditions 2 ou plusieurs groupes
Minimum de 2 cas par groupe
Nimporte quel nombre de variables discriminantes, mais moins que le total du nombre de cas - 2
Variables disriminantes: niveau de mesure dintervalle
Aucune variable discriminante nest la combinaison linaire de dautres variables discriminantes
Chaque groupe est tir dune population avec une distribution multivarie normale des variables discriminantes Rapel des supp retenirRapel des supp retenir
13. Exemple de cas: Les Terroristes
14. Dmarche suivre dans SPSS Aller dans Analyse > Classify > discriminant
Dans Grouping Variable (i.e. les critre de regroupement), il faut indiquer la variable expliquer en la slectionnant dans la partie de droite puis en cliquant sur la flche qui pointe vers la droite. SPSS demande alors de dfinir lintervalle, cest--dire les diffrentes modalits que la variable peut prendre.
Dans Independents (i.e. les variables explicatives), il faut indiquer les variables mtriques que lon souhaite intgrer lanalyse. Il est important de choisir Use stepwise method (i.e. la mthode pas pas).
15. Dmarche suivre dans SPSS (suite) Trois options soffrent alors nous :
statistics : Dans la bote qui apparat, il convient de cocher Means (moyennes), Univariate ANOVAs (ANOVA 1 facteur) et Boxs M (Test de Box) dans Descriptives et Fischers ainsi que Unstandardized dans Function Coefficients .
Classify : Dans la bote qui apparat, il convient de cocher Summary Table (option qui permet laffichage de la matrice de confusion) et Leave-one-out classification dans Display .
(On ne touchera pas aux diffrentes options de Mthode )
16. Analyse des rsultats Une analyse discriminante se droule en 3 tapes:
1. On vrifie lexistence de diffrences entre les groupes.
2. On valide ltude.
3. On vrifie le pouvoir discriminant des axes.
4. On juge la qualit de la reprsentation du modle.
La 3me tape peut tre passe dans la plupart des cas.