1 / 20

SOUTENANCE D’HDR

SOUTENANCE D’HDR. La recherche d’information sur Internet au prisme de la théorie des facettes. Eric Boutin le 9 Octobre 2008. Plan de l’exposé. I- La recherche d’information sur Internet au prisme de la théorie des facettes Contexte Théorie des facettes Méthode expérimentale Résultats

marlo
Télécharger la présentation

SOUTENANCE D’HDR

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. SOUTENANCE D’HDR La recherche d’information sur Internet au prisme de la théorie des facettes Eric Boutin le 9 Octobre 2008

  2. Plan de l’exposé I- La recherche d’information sur Internet au prisme de la théorie des facettes • Contexte • Théorie des facettes • Méthode expérimentale • Résultats II- Projet de recherche • Ancrage en SIC & transversalité • Étude et utilisation des réseaux • Méthodologie

  3. Une démarche intuitive à l’origine de mon objet d’étude Une même requête… …différentes attentes Handicap Dossier de veille Exposé pour la maîtresse … Attaques Informationnelles

  4. Lisibilité Indicateurs Accessibilité Polarité Subjectivité … Intégration d’indicateurs au prototype Facetmap

  5. WEB Problématique :Proposer un indicateur de pertinence centré sur l’utilisateur Web • Google : • Une vision unique & globale du monde • Objectif : • plusieurs vues du monde • … selon le contexte

  6. 633 = céréales 633.18 = riz 633.189 = maladies du riz 633.189.8 = maladies du riz d’origine virale Classifications : hiérarchique / à facettes (DDC) Exemple : code désignant les maladies virales du riz  633 189 8 « Pigeon hole » Ranganathan - 1924

  7. Classifications : hiérarchique / à facettes (Colon) Exemple : code désignant les maladies virales du riz  EJ,381;421:5 • Chaque objet est décrit par 5 facettes : • P : personnalité • M : matière • E : énergie • S : espace • T : temps EJ = agriculture : facette principale 381 = riz : facette Personnalité 421 = maladie virale : facette Matière 5 = éradication : facette Énergie Démonstration de legos à l’origine de la théorie des facettes en 1924 D’après Garfield (1984)

  8. Indicateurs Lisibilité Accessibilité Polarité Subjectivité Méthodologie Marqueurscandidats LINGUISTIQUE COMPUTATIONNELLE PSYCHOLOGIE APPLIQUEE outils dico Université Descartes Richesse lexicale Nombre de syllabes par mot Nombre de mots par phrase Dico occurrences Balise textuelle par image Contrastes entre couleurs Dico de valence Dép. de psychologie Univ. Catho. de Louvain Polarité des termes Rôle des pronoms personnels (je) Marques de ponctuation (!) Nombre d’adjectifs par phrase Verbe au conditionnel Adresse URL du site TextPipe Pro WebPipe Pro FOUILLE DE DONNEES TEXTUELLES

  9. négative neutre positive neutre positive Méthode expérimentale : exemple polarité Aspiration de pages web WebPipe Pro Corpus de pages Dictionnaire De valence Dictionnaire langue Qualification automatique négative Pages consensuelles Qualification humaine Test de Concordance De Kappa

  10. Résultats par facette

  11. Positionnement de ce travail • Ancrage en SIC et transversalité • S’adapter pour survivre • Avoir des logiques transversales • Étude et utilisation des réseaux • Comprendre et traiter les réseaux • Travailler en réseau • Méthodologie • Utiliser une méthodologie de constitution d’état de l’art • Effectuer une veille scientifique efficace

  12. La fragmentation des savoirs Quantité d’information disponible Temps D’après Swanson - 1986 Importance des logiques transversales

  13. Logiques transversales de ce mémoire Application à la recherche d’information Documentation Théorie des facettes HDR Médecine psychologie Test de Kappa Usage des TIC Valence, subjectivité, lisibilité, accessibilité Science du web Linguistique computationnelle Psychologie

  14. Logiques transversales de mon cursus Théorie de l’Engagement Information / Communication Théorie des organisations Culture Sémiologie COMMUNICATION 5 6 14 7 7 7 9 INFORMATION 5 cursus 1995-1997 1998-2000 2001-2003 2004-2006 2007-2008 PSYCHO ; SOCIO LINGUISTIQUE ; GESTION Linguistique Psychologie Sociologie Gestion

  15. Logiques transversales des doctorants co-encadrés 2001 2008 2002 2003 2004 2005 2006 2007 2009 2010 2011 Hajer, Maher, Dang Hanene Pei Pedro Franck Philippe Roberto Intelligence Economique et Territoriale C C C C Analyse réseau Jean Pierre Découverte de connaissances Jean Do Médiatisation Eve Guillaume Mohamed Sciences du web C Natacha Stéphane C Thèse en cotutelle

  16. A : laboratoireCrrm ou doctorants de Luc Quoniam Eric Boutin B laboratoire I3M site de Toulon + Gallezot C 2 chercheurs du Loria E école normale de Shanghai D Chercheurs de l’Université de Commerce du Vietnam Réseau des collaborations depuis 1999 Légende Sociopro doctorant MCF ou PR 45 collaborations

  17. Contrats de recherche Détermination automatique de la polarité de pages web sur le web chinois 2008 Découverte de connaissances dans le domaine médical 2005-2007 Prise en compte de facteurs colorimétriques dans l’indicateur de pertinence des moteurs de recherche 2006 Étude du Web public en région PACA 2005 Élaboration d’un booster de pertinence de moteur de recherche 2000-2004

  18. Ma biblio • 5 • 8 • 9 • 3 • 66 • 44 • 2 • 57 • Liste de • réponses • 1 • 2 • 3 • 4 • 5 • 6 • 7 • 8 • 9 • 10 • … • N Interactions = collaboration, citation, concept commun disjoint Construction de l’état de l’art : méthode

  19. Vers une veille scientifique Front de recherche Base intellectuelle Analyse de citation Analyse réseau Indicateur de centralité

  20. Limites, prolongements … perspectives • Limites : • Caractère réducteur des facettes • Limite de l’interface • Prolongements : • Académiques : publications scientifiques • Valorisation industrielle • Perspectives de recherche : • D’autres chantiers dans le domaine des sciences du web • Collaborations internationales en Asie et au Maghreb

More Related