470 likes | 1.12k Vues
Plan de la prsentation. Mise en contexteThorieDmonstration avec SPSSAnalyse des rsultats. Mise en contexte. Plusieurs phnomnes sociaux sont discrets et qualitatifs plutt que continus et quantitatifsPlusieurs de ces phnomnes sont dichotomiques Ex: tre malade ou ne pas l'tre, voter
E N D
1. La rgression logistique Mlanie Bourdon
ve-Marie Filiatrault
velyne Robineau
2. Plan de la prsentation
Mise en contexte
Thorie
Dmonstration avec SPSS
Analyse des rsultats
3. Mise en contexte Plusieurs phnomnes sociaux sont discrets et qualitatifs plutt que continus et quantitatifs
Plusieurs de ces phnomnes sont dichotomiques
Ex: tre malade ou ne pas ltre, voter ou ne pas voter
En utilisant une variable binaire pour reprsenter un phnomne, la moyenne de cette variable reprsente la proportion de fois o elle prend une valeur de 1, ce qui peut tre interprt comme une probabilit
4. Mise en contexte La rgression linaire nest alors pas possible pour deux raisons:
La rgression linaire peut stendre linfini lorsque la valeur de la variable indpendante saccrot jusqu linfini, alors quune probabilit, par dfinition, doit se situer entre 0 et 1
La rgression avec une variable binaire ne pourrait pas respecter le principe de la distribution normale, car toutes les valeurs se situent 0 ou 1
5. Mise en contexte
6. Mise en contexte La rgression logistique, une extension de la rgression multiple, est une solution ce problme
Elle fournit davantage dinformation que lanalyse discriminante (ex: pseudo R2)
7. Thorie But: prdire la probabilit dun phnomne
? ex dans Julien: prdire la probabilit dabsentisme en se basant sur la satisfaction au travail
La variable dpendante ne peut prendre que deux valeurs
En codant cette variable de faon binaire, soit 0 et 1, les rsultats peuvent tre interprts en termes de probabilit
Il est possible de coder une variable dpendante catgorielle ou mtrique en variable binaire
La variable indpendante peut tre catgorielle ou mtrique
8. Thorie Chances = Probabilit que le phnomne se produise
Probabilit quil ne se produise pas
Ex: Probabilit quil pleuve = 20%
Probabilit quil ne pleuve pas = 80%
Chances quil pleuve = 0,20 = 1 = 0,25
0,80 4
Donc, il y a une chance contre quatre quil pleuve.
Cela signifie aussi que la pluie se manifestera 0,25 fois pour chaque fois quelle ne se manifestera pas (ou 25 fois pour chaque 100 fois)
9. Thorie Aprs quelques manipulations mathmatiques, la formule se transforme comme suit:
10. Dmonstration avec SPSS Vrification du fichier de Julien
Vrification des frquences ? les valeurs manquantes sont bien dclares
Tendance chez les rpondants
Le premier rpondant semble ne pas avoir rpondu attentivement au questionnaire, nous avons donc choisi de dclarer des valeur manquantes
11. Dmonstration avec SPSS Codage de la variable binaire
Puisque dans Julien la seule variable qui pourrait tre dj binaire est le sexe, et que cette variable ne peut pas tre une variable dpendante, nous avons choisi de coder labsentisme.
Nous avons donc dfini les deux tats de la variable binaire comme tant une absence faible (0) et une absence leve (1)
1) Aucun jour ? 0
2) 1 3 jours ? 0
3) 4 6 jours ? 1
4) 7 9 jours ? 1
5) 10 jours et plus ? 1
17. Dmonstration SPSS Maintenant, il faut identifier des variables indpendantes qui pourraient influencer labsentisme. Nous avons choisi les diffrentes dimensions de la satisfaction au travail identifies par Julien:
La richesse de la tche
Les avantages conomiques de lemploi
Les relations avec les collgues
Les objectifs dexcellence
Les pratiques de gestion du suprieur immdiat
Les conditions facilitant le travail
Les perspectives de carrire
18. Dmonstration SPSS Chacune de ces dimensions est mesure par plusieurs questions dans le questionnaire de Julien
Nous avons donc d calculer la moyenne des rponses aux questions se rapportant chaque dimension afin dobtenir une seule valeur pour chaque dimension
Il est noter que cette manipulation change la variable ordinale en variable mtrique, car la moyenne ne sera pas ncessairement un nombre entier
22. Les questions se rapportant chaque dimension de la satisfaction au travail Perspectives de carrire : q3d q3g
Avantages conomiques de lemploi : q3a q3i
Relations avec les collgues : q3j
Richesse de la tche : q4d q4l
Objectifs dexcellence : q4a q4c
Conditions facilitant le travail : q3h et q3i
Pratiques de gestion du superviseur : q2a q2e
24. Rgression logistique
26. Rgression logistique En utilisant la mthode forward-LR, SPSS procdera une premire tape (step1) o il choisira la dimension la plus significative pour prvoir labsentisme
SPSS procdera alors une seconde tape (step2) o il choisira la seconde variable la plus significative pour prvoir labsentisme. Et ainsi de suite, jusqu ce que le test statistique quil effectue ne soit plus significatif pour les dimensions suivantes, qui ne seront alors pas ajoutes lquation
30. Analyse des rsultats
38. Interprtation des coefficients (possibilit 1) Une faon dinterprter les coefficients est de les insrer dans la formule des chances. Par exemple, pour savoir limpact de la variation dune unit de satisfaction envers la richesse de la tche:
39. Interprtation des coefficients (possibilit 2) Il est aussi possible de calculer limpact sur la probabilit de la faon suivante:
1) Trouver la moyenne de la variable binaire dpendante
44. Interprtation des coefficients 2) ? probabilit (phnomne arrive) = bi p (1-p)
= - 0,515 0,44 (1-0,44)
= - 0,13
Donc, une unit de satisfaction de plus envers la richesse de la tche diminue de 13% la probabilit davoir un absentisme lev
? probabilit (phnomne arrive) = bi p (1-p)
= - 0,404 0,44 (1-0,44)
= - 0,10
Donc, une unit de satisfaction de plus envers les perspectives de carrire diminue de 10% la probabilit davoir un absentisme lev
46. Questions ?