1 / 45

La r gression logistique

Plan de la prsentation. Mise en contexteThorieDmonstration avec SPSSAnalyse des rsultats. Mise en contexte. Plusieurs phnomnes sociaux sont discrets et qualitatifs plutt que continus et quantitatifsPlusieurs de ces phnomnes sont dichotomiques Ex: tre malade ou ne pas l'tre, voter

gellert
Télécharger la présentation

La r gression logistique

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. La rgression logistique Mlanie Bourdon ve-Marie Filiatrault velyne Robineau

    2. Plan de la prsentation Mise en contexte Thorie Dmonstration avec SPSS Analyse des rsultats

    3. Mise en contexte Plusieurs phnomnes sociaux sont discrets et qualitatifs plutt que continus et quantitatifs Plusieurs de ces phnomnes sont dichotomiques Ex: tre malade ou ne pas ltre, voter ou ne pas voter En utilisant une variable binaire pour reprsenter un phnomne, la moyenne de cette variable reprsente la proportion de fois o elle prend une valeur de 1, ce qui peut tre interprt comme une probabilit

    4. Mise en contexte La rgression linaire nest alors pas possible pour deux raisons: La rgression linaire peut stendre linfini lorsque la valeur de la variable indpendante saccrot jusqu linfini, alors quune probabilit, par dfinition, doit se situer entre 0 et 1 La rgression avec une variable binaire ne pourrait pas respecter le principe de la distribution normale, car toutes les valeurs se situent 0 ou 1

    5. Mise en contexte

    6. Mise en contexte La rgression logistique, une extension de la rgression multiple, est une solution ce problme Elle fournit davantage dinformation que lanalyse discriminante (ex: pseudo R2)

    7. Thorie But: prdire la probabilit dun phnomne ? ex dans Julien: prdire la probabilit dabsentisme en se basant sur la satisfaction au travail La variable dpendante ne peut prendre que deux valeurs En codant cette variable de faon binaire, soit 0 et 1, les rsultats peuvent tre interprts en termes de probabilit Il est possible de coder une variable dpendante catgorielle ou mtrique en variable binaire La variable indpendante peut tre catgorielle ou mtrique

    8. Thorie Chances = Probabilit que le phnomne se produise Probabilit quil ne se produise pas Ex: Probabilit quil pleuve = 20% Probabilit quil ne pleuve pas = 80% Chances quil pleuve = 0,20 = 1 = 0,25 0,80 4 Donc, il y a une chance contre quatre quil pleuve. Cela signifie aussi que la pluie se manifestera 0,25 fois pour chaque fois quelle ne se manifestera pas (ou 25 fois pour chaque 100 fois)

    9. Thorie Aprs quelques manipulations mathmatiques, la formule se transforme comme suit:

    10. Dmonstration avec SPSS Vrification du fichier de Julien Vrification des frquences ? les valeurs manquantes sont bien dclares Tendance chez les rpondants Le premier rpondant semble ne pas avoir rpondu attentivement au questionnaire, nous avons donc choisi de dclarer des valeur manquantes

    11. Dmonstration avec SPSS Codage de la variable binaire Puisque dans Julien la seule variable qui pourrait tre dj binaire est le sexe, et que cette variable ne peut pas tre une variable dpendante, nous avons choisi de coder labsentisme. Nous avons donc dfini les deux tats de la variable binaire comme tant une absence faible (0) et une absence leve (1) 1) Aucun jour ? 0 2) 1 3 jours ? 0 3) 4 6 jours ? 1 4) 7 9 jours ? 1 5) 10 jours et plus ? 1

    17. Dmonstration SPSS Maintenant, il faut identifier des variables indpendantes qui pourraient influencer labsentisme. Nous avons choisi les diffrentes dimensions de la satisfaction au travail identifies par Julien: La richesse de la tche Les avantages conomiques de lemploi Les relations avec les collgues Les objectifs dexcellence Les pratiques de gestion du suprieur immdiat Les conditions facilitant le travail Les perspectives de carrire

    18. Dmonstration SPSS Chacune de ces dimensions est mesure par plusieurs questions dans le questionnaire de Julien Nous avons donc d calculer la moyenne des rponses aux questions se rapportant chaque dimension afin dobtenir une seule valeur pour chaque dimension Il est noter que cette manipulation change la variable ordinale en variable mtrique, car la moyenne ne sera pas ncessairement un nombre entier

    22. Les questions se rapportant chaque dimension de la satisfaction au travail Perspectives de carrire : q3d q3g Avantages conomiques de lemploi : q3a q3i Relations avec les collgues : q3j Richesse de la tche : q4d q4l Objectifs dexcellence : q4a q4c Conditions facilitant le travail : q3h et q3i Pratiques de gestion du superviseur : q2a q2e

    24. Rgression logistique

    26. Rgression logistique En utilisant la mthode forward-LR, SPSS procdera une premire tape (step1) o il choisira la dimension la plus significative pour prvoir labsentisme SPSS procdera alors une seconde tape (step2) o il choisira la seconde variable la plus significative pour prvoir labsentisme. Et ainsi de suite, jusqu ce que le test statistique quil effectue ne soit plus significatif pour les dimensions suivantes, qui ne seront alors pas ajoutes lquation

    30. Analyse des rsultats

    38. Interprtation des coefficients (possibilit 1) Une faon dinterprter les coefficients est de les insrer dans la formule des chances. Par exemple, pour savoir limpact de la variation dune unit de satisfaction envers la richesse de la tche:

    39. Interprtation des coefficients (possibilit 2) Il est aussi possible de calculer limpact sur la probabilit de la faon suivante: 1) Trouver la moyenne de la variable binaire dpendante

    44. Interprtation des coefficients 2) ? probabilit (phnomne arrive) = bi p (1-p) = - 0,515 0,44 (1-0,44) = - 0,13 Donc, une unit de satisfaction de plus envers la richesse de la tche diminue de 13% la probabilit davoir un absentisme lev ? probabilit (phnomne arrive) = bi p (1-p) = - 0,404 0,44 (1-0,44) = - 0,10 Donc, une unit de satisfaction de plus envers les perspectives de carrire diminue de 10% la probabilit davoir un absentisme lev

    46. Questions ?

More Related