1 / 59

Applications des lois infométriques en science de l’information

Thierry Lafouge Thierry.lafouge@univ-lyon1.fr Université Claude Bernard Lyon1 Laboratoire URSIDOC http://docsi.univ-lyon1.fr/. Applications des lois infométriques en science de l’information. Dualité,champ infométrique d’usage et de production.

Télécharger la présentation

Applications des lois infométriques en science de l’information

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Thierry Lafouge Thierry.lafouge@univ-lyon1.frUniversité Claude Bernard Lyon1Laboratoire URSIDOChttp://docsi.univ-lyon1.fr/ Séminaire Lirdhist 11janvier

  2. Applications des lois infométriques en science de l’information Dualité,champ infométrique d’usage et de production. Du bon usage des mathématiques en science de l’information Séminaire Lirdhist 11janvier

  3. Contexte • ISI (1955) • Scientométrie (1970) • Bibliométrie (1969) • Infométrie (1980) • X métrie Séminaire Lirdhist 11janvier

  4. Domaines de recherche • Infométrie mathématique • Modèles de circulation des documents • Distribution<->Théorie de l’information(TMC :Shannon) • Scientométrie: usage des périodiques scientifiques • Webométrie : structuration de corpus sur le web Séminaire Lirdhist 11janvier

  5. Infométrie mathématique • Régularités statistiques observées • Lois puissances (Inverse power law) • Usages: circulation des documents Séminaire Lirdhist 11janvier

  6. Régularités statistiques observées • Sources items • Chercheurs produisent des articles(Lotka) • Revues éditent des articles (Bradford) • Mots produisent des occurrences (Zipf) • Ouvrages produisent des emprunts • Articles produisent des commandes Séminaire Lirdhist 11janvier

  7. Régularités statistiques observées Séminaire Lirdhist 11janvier

  8. Régularités statistiques observées • Bibliométrie distributionnelle • (fréquence - effectif) Séminaire Lirdhist 11janvier

  9. Régularités statistiques observées • Loi de Lotka (fréquence - effectif) • En 1926 Lotka observe une régularité entre le nombre de publications dans un domaine scientifique et le nombre de ses membres. Séminaire Lirdhist 11janvier

  10. Séminaire Lirdhist 11janvier

  11. Régularités statistiques observées • Loi de Bradford (rang-fréquences cumulées) • En 1934 bradford pour résoudre le problème du « chaos documentaire »de la littérature scientifique observe une régularité de la répartition des articles dans les journaux selon leur aptitude à représenter un domaine scientifique. Séminaire Lirdhist 11janvier

  12. Séminaire Lirdhist 11janvier

  13. Régularités statistiques observées • Loi de Zipf (rang fréquence) • En 1935 Zipf analyse des corpus de données textuelles et observe des régularités sur la fréquence des mots. Séminaire Lirdhist 11janvier

  14. Séminaire Lirdhist 11janvier

  15. Lois Puissances Séminaire Lirdhist 11janvier

  16. Lois puissances • Caractéristiques • Décroissance avec une longue queue • Distributions asymétriques • Concentration forte d’un coté, large dispersion de l’autre • Caractéristique du champ social • Il existe un petit nombre de chercheurs qui publient un grand nombre d’articles. • Présentes dans beaucoup d’autres domaines • épidémiologie Séminaire Lirdhist 11janvier

  17. Lois puissances • Propriétés mathématiques • Pas de moments d’ordre n < a • Invariance d’échelle • Lien avec la théorie de l’information • (Loi du moindre effort :fonction d’effort) Séminaire Lirdhist 11janvier

  18. Lois puissances • Robustesse de la loi de lotka • Probabilité de publier n articles sachant que les chercheurs publient x articles en moyenne • Poisson Séminaire Lirdhist 11janvier

  19. Lois puissances • Modèle Probabiliste • Loi de Pareto Séminaire Lirdhist 11janvier

  20. Lois puissances • Modèle probabiliste • Modèle de l’Urne de Polya • Le succès engendre le succès • Le résultat de Price de 1976 • Loi des avantages cumulés • Comportement asymptotique = loi puissance Séminaire Lirdhist 11janvier

  21. Une autre approche • Quelques questions • Lien entre comportement social et description statistique ? • Échec = Non évènement • Prendre en compte le paramètre « No Use » • Processus discret / continu Séminaire Lirdhist 11janvier

  22. Usages • Deux caractéristiques • Croissance de la quantité d’information • Mesure : augmentation de la littérature scientifique • Obsolescence de l’information • Mesure : taux de citation d’un article • La demi vie de citation d’une revue(indicateur ISI) • Mesure : % du fonds actif Séminaire Lirdhist 11janvier

  23. Usagescirculation des documents • Exemples • Circulation des ouvrages dans une bibliothèque • Commandes des articles chez un fournisseur de documents • Téléchargements de documents Séminaire Lirdhist 11janvier

  24. Usages paramètres de circulation des documents • Corpus • Temps • Durée d’observation • Fréquence d’observation • Prise en compte des « No use » • Fi : i =0,1,2……..imax, nombre d’ items demandés i fois Séminaire Lirdhist 11janvier

  25. Emprunts livres : Bibliothèque Bordeaux Collection Payot Science 1984 Séminaire Lirdhist 11janvier

  26. Commandes articles-InistParfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier

  27. Usage / Productiondualité Séminaire Lirdhist 11janvier

  28. Séminaire Lirdhist 11janvier Tableau - 2 – Commandes des revues à l’Inist durant la première semaine de janvier 1997

  29. Séminaire Lirdhist 11janvier

  30. Séminaire Lirdhist 11janvier

  31. Usages : modèle mathématique • Modèle mathématique probabiliste • xt nombre de circulations pendant la période [o t] Xt processus connu pour un paramètre L Séminaire Lirdhist 11janvier

  32. Usages : modèle mathématique • Lois de probabilité discrète • P : Processus Poissonien de taux L / fL fonction gamma -> Loi Binomiale négative Loi géométrique Séminaire Lirdhist 11janvier

  33. Emprûnts livres – Bibliothèque Bordeaux Collection Payot Science 1984Ajustement par la moi binomiale négative Séminaire Lirdhist 11janvier

  34. Commandes Articles / Parfums cosmétique 1985Fonction Puissance Séminaire Lirdhist 11janvier

  35. Usages commandesVolumes / Parfums cosmétique 1985Fonction Puissance Séminaire Lirdhist 11janvier

  36. Usage : IPP ordre 2 • Sources : revues/articles Séminaire Lirdhist 11janvier

  37. Usages : nombre d’articles revue- JCR /1999 Séminaire Lirdhist 11janvier

  38. Usages : nombre d’articles produitsrevue- JCR /1999 Séminaire Lirdhist 11janvier

  39. Usage champ infométrique Séminaire Lirdhist 11janvier

  40. Usage champ infométrique • Analyse de la distribution de la demande • Les articles demandés (sources primaires) • Comptage au niveau des volumes (sources secondaires) Séminaire Lirdhist 11janvier

  41. Commandes articles-InistParfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier

  42. USAGEmodèle mathématique • X (i) = probabilité pour qu’un volume soit demandé i fois • A(i) = probabilité pour qu’un article soit demandé i fois • Y( j) = probabilité pour qu’un volume ait j articles • po = probabilité pour qu’un article ne soit pas demandé • Gj(i) = probabilité pour qu’un volume ayant j articles soit demandé i fois Séminaire Lirdhist 11janvier

  43. USAGEutilisation d’un modèle • Approche positiviste • Ajuster une distribution observée par une distribution théorique • Une autre approche Séminaire Lirdhist 11janvier

  44. Approche positivisteAjustement d’une distribution statistique • Ajuster : pourquoi ? • Vérifier une loi • Modèle explicatif raisonnable • Ajuster : intérêt • Analyse prévisionnelle • Création d’indicateurs • Ajuster : comment ? Séminaire Lirdhist 11janvier

  45. Commandes des Revues en chimie en 1985 Inist • Génie chimique 43 titres • Appliqués : 23 • Théoriques: 22 • Polymères 51 titres • Appliqués: 22 • Théoriques 29 • Matériaux construction 22 titres • Peintures et Vernis 10 titres • Bois et Papier 6 titres • Parfums,cosmétiques 13 titres Séminaire Lirdhist 11janvier

  46. Questions posées • Revues appliquées • Un article leader • C’est moins vrai pour les revues fondamentales -> Créer des indicateurs Séminaire Lirdhist 11janvier

  47. Réponses • Indicateur : • Indicateur Séminaire Lirdhist 11janvier

  48. Réponses • Ajuster la courbe de distribution des volumes / connaissant la distribution des articles . • Proportion d’articles non demandés dans les volumes demandés • Répartition des articles dans les volumes • Modèles d’ajustement Séminaire Lirdhist 11janvier

  49. Ajustement Parfums cosmétique Corps gras 1985 Séminaire Lirdhist 11janvier

  50. Ajustement Indicateurs Séminaire Lirdhist 11janvier

More Related