1 / 23

INF L14 Initiation aux statistiques

INF L14 Initiation aux statistiques. 4 – Classement et cumul. Classement des modalités. Non classées : pas très lisible. Classement des modalités. Classement par fréquences décroissantes. Classement des modalités. Polygone de fréquences. Classement des modalités. Diagramme en secteurs.

hank
Télécharger la présentation

INF L14 Initiation aux statistiques

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INF L14Initiation aux statistiques 4 – Classement et cumul

  2. Classement des modalités Non classées : pas très lisible...

  3. Classement des modalités Classement par fréquences décroissantes

  4. Classement des modalités Polygone de fréquences

  5. Classement des modalités Diagramme en secteurs

  6. Rangs

  7. Rangs Quand les modalités sont très nombreuses, on utilise plutôt les rangs sur l’axe des abscisses (X), par exemple de 10 en 10, 100 en 100, etc.

  8. Changement d’échelle Lorsque les modalités sont très nombreuses et les fréquences très inégales on peut utiliser un changement d’échelle des axes (coordonnées logarithmiques).

  9. Loi de Zipf Approximativement : rang x fréquence = constante • George Zipf (1935) s’est aperçu que cette relation rang-fréquence était une propriété de tous les textes.

  10. Exemples

  11. Fréquences cumulées Etape 1 : Classement par fréquences décroissantes

  12. Fréquences cumulées

  13. Fréquences cumulées Idem, expression en pourcentages

  14. Exemple • Petit Prince • 15351 occurrences • 2414 formes • Rappel : loi de Zipf

  15. Fréquences cumulée • Environ • 50 mots = 50% • 1000 mots = 90% Vocabulaire fondamental

  16. Agrandissement

  17. Mots les plus fréquents

  18. Antidictionnaire • Mots outils • Mots grammaticaux • Présents dans tous les textes • Parmi les plus fréquents

  19. Exemple $ £ a A à afin ah ai aie aient aies ailleurs ainsi ait alentour alias allais allaient allait allons allez alors Ap. Apr. après après-demain arrière as assez attendu au aucun aucune au-dedans au-dehors au-delà au-dessous au-dessus au-devant ...

  20. Programme Dico

  21. Tous les mots

  22. Filtré On voit apparaître les mots-clés du texte

  23. Rang Coordonnées logarithmiques Loi de Zipf Fréquences cumulées Termes à retenir

More Related