1 / 51

Outils de traitements et d’analyse d’information

Outils de traitements et d’analyse d’information. Introduction Pourquoi le traitement et l’analyse d’information. Spécificités techniques et fonctionnelles Les outils disponibles Le marché Conclusion. Pourquoi l’analyse et le traitement d’information.

sean-madden
Télécharger la présentation

Outils de traitements et d’analyse d’information

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Outils de traitements et d’analyse d’information Introduction Pourquoi le traitement et l’analyse d’information. Spécificités techniques et fonctionnelles Les outils disponibles Le marché Conclusion

  2. Pourquoi l’analyse et le traitement d’information • L’important volume de données que possèdent les sociétés. • Éliminer les informations inutiles • Le besoin de réactivité dans un environnement en évolution continue et rapide. • Le besoin d’analyse rapide, ce qui permet des gains en productivité. • Le besoin de trouver de l'information qui ait un sens, de façon rapide et efficace. • Le besoin de plus d'information que les concurrents ou plus d'information sur les concurrents.

  3. Pourquoi l’analyse et le traitement d’information • Le besoin d’analyser les informations sur Internet ce qui est vital pour certaines entreprises parce que l’essentiel de l’information qui les concerne y est désormais disponible: ce qu’on dit d’elles de leurs produits, de leurs concurrents • Les besoins de gestion des connaissances • Le besoin de Localisation d’expertise: Un exemple: chez BAE System, Il suffit de saisir une phrase de recherche pour obtenir l’avis d’un expert sur le sujet

  4. Outils de traitements et d’analyse Objectif: Retrouver, organiser et lire plus facilement l'information interne et externe à l'entreprise

  5. Spécificités fonctionnelles et techniques • Texte • Sémantique • Linguistique • Statistique • Calcul de sens • Traduction • Résumé • Classification … • Cartographie • Image • Contenu (ADN) • Reconnaissance de formes • Comparaison d’images • Filtrage, Sécurité • Surveillance, Protection • Indexation, class. • Son • Indexation (partition) • Contenu (fréquences) • Reconnaissance de mélodie • Reste marginal ou • expérimental

  6. Le calcul de sens

  7. Le calcul de sens

  8. Le calcul du sens

  9. Le calcul du sens

  10. La traduction automatique dictionnaire électronique classique dictionnaire spécialisé, dictionnaire de synonymes corpus Analyse linguistique Analyse morphologique Analyse statistique, dénombrement, fréquences. Analyse sémantique

  11. Le résumé Les résumés: identification des concepts clés d'un texte et en extrait les phrases les plus marquantes par l’utilisation des algorithmes basés sur des calculs statistiques et des données linguistiques.

  12. Classification, catégorisation, clustering, taxonomie La catégorisation (taxonomie) : L'information est classée au sein d'une arborescence de catégories, dans laquelle l'utilisateur navigue de manière logique .

  13. Catégorisation(Taxonomie) • Points Forts : • L’utilisateur navigue d’une façon logique. • Les catégories sont bâties en amont de la recherche, de manière à donner du sens à l'information • Points Faibles : • Les outils qui automatisent la création de catégories donnent généralement des résultats décevants. • Le processus de création de catégories idéal est manuel.

  14. La cartographie La cartographie des résultats: a pour objectif de synthétiser sur une seule page la montagne d'informations résultant d'une requête.

  15. Cartographie • Points Forts : • La cartographie donne du sens en masquant l'information au profit des liens et des catégorisations. On peut ainsi voir ce qui se cache derrière l'information brute. • Prend tout sens quand l’utilisateur n’a pas une idée précise de ce qu’il cherche. • Points Faibles : • L'effort à fournir pour s'approprier l'outil est important, notamment afin de réussir à comprendre la création de liens entre les informations.

  16. Le Traitement de l’image

  17. Pour finir Fonctionnalités qui vont sûrement évoluer rapidement Une part des fonctionnalités existantes sont offertes par des outils propriétaires développés en interne.

  18. Outils disponibles • Copernic Summarizer Résumé automatique de textes • Fonctionnalités • Traitement de fichiers, de pages web, d'hyperliens et de mails • Multilingue: anglais, français, allemand et espagnol • Possibilité de déterminer la longueur des résumés (pourcentage ou nombre maximum de mots requis) • Identification et surlignage des concepts-clés • Possibilité de modifier en temps réel la longueur d'un résumé

  19. Outils disponibles • Exemple

  20. Outils disponibles • Lingway KM • Moteur de recherche sémantique: “cross-language” • Moteur d’indexation et de catégorisation • Basé sur une structuration XML • Traitement de fichiers, de pages web (Office, HTML, PDF,TXT) • Multilingue: Français, Anglais, Espagnol, Allemand, Néerlandais • Moteur de présentation et d’aide à la lecture

  21. Outils disponibles • Lingway KM Moteur d’indexation et de catégorisation • Fonctionnalités • Balisage de la structure: version XML du document • Extraction des entités nommées: personnes, lieux, organisations, dates… • Extraction des termes: descripteurs pour l’indexation du document sous forme de méta-données

  22. Outils disponibles Moteur d’indexation et de catégorisation • Exemple

  23. Outils disponibles Moteur d’indexation et de catégorisation • Exemple (Suite)

  24. Outils disponibles • Lingway KM Moteur de présentation et d’aide à la lecture • Fonctionnalités • Marquage des phrases typiques: annonce thématique, conclusion, phrases soulignées par l’auteur • Résumé et colorisation • Clustering et cartographie

  25. Outils disponibles Moteur de présentation et d’aide à la lecture • Exemple

  26. Outils disponibles Moteur de présentation et d’aide à la lecture • Exemple (Suite)

  27. Outils disponibles Moteur de présentation et d’aide à la lecture • Exemple (Suite)

  28. Outils disponibles • WorldMapper • Fonctionnalités • Traitement de fichiers, de pages web (Office, HTML, PDF,TXT) • Multilingue: anglais, français, allemand • Indexation: dictionnaire des mots équivalents, des mots-outils à ignorer, des mots obligatoires • Clustering et cartographie • Résumé automatique de textes • Analyse de l’évolution dans le temps et détection des signaux faibles

  29. Outils disponibles • WorldMapper • Exemple

  30. Outils disponibles • WorldMapper • Exemple (Suite)

  31. Outils disponibles • Intellixir Destiné à la recherche scientifique • Fonctionnalités • Traitement d’articles scientifiques et de brevets • Extraction des entités nommées: personnes, organisations • Extraction des termes: concepts pour l’indexation du document sous forme de méta-données • Cartographie • Analyse de l’évolution dans le temps et détection des signaux faibles

  32. Outils disponibles • Intellixir • Exemple

  33. Outils disponibles • Intellixir • Exemple (Suite)

  34. Outils disponibles • Intellixir • Exemple (Suite)

  35. Outils disponibles • Intellixir • Exemple (Suite)

  36. Outils disponibles VERITY Recherche d’informations et de catégorisation La technologie VERITY • recherches avancées • classifier et de personnaliser l’information • résoudre les problèmes de découverte, d’organisation de l’information et d’exploitation de la connaissance • Intranet, Extranet • Administration et des structures communes recherche et extraction des données taxinomie • définition de concepts • recherches avancées et de configurer des règles de gestions • Analyse de la grammaire, proximité des mots • Gestion de la sécurité • Organisation des contenus à l’aide de méta données • 200 formats de fichiers et de données gérées

  37. Outils disponibles Suite • Clientèle : Répond à des projets de portail Intranet ou Entreprise, sites de e-commerce, service en ligne, application de gestions des connaissances) • Prix : 60.000 Euros pour 1000 usagers • + maintenance 20% du prix (assistance incluse) • + formation : 1.400 euros la journée

  38. Outils disponibles AUTONOMY Solution destinées au Intranet, Extranet et Web • Dynamic Reason Engine (DRE) : agrégation des données en provenance de bases diverses sur des plateforme distantes et de les compiler de manière structurée • Module de recherche permettant de retrouver des documents en fonction des requêtes saisies en texte intégral • Les requêtes sont mises en forme avec des documents contenant des concepts connexes • Utilisation de 2 méthodes mathématiques : • Théorie de l’information de Shannon • Inférence Baysienne • Identification des échantillons de lettres ou de mots dans un document • Calcul la probabilité que le concept corresponde au concept requis par l’utilisateur • Génère la liste classée par degré de pertinence

  39. Outils disponibles • Clientèle : • Grandes entreprises, PME • client Eurosport, France Télécom, TF1 … • Prix : 100.000 euros pour 250 utilisateurs

  40. Outils disponibles TROPES ZOOM • Classification automatique des mots clés • Contraction du texte • Détection contexte global du document • Catégorisation des mots clés(analyse qualitative) • Séries chronologiques(analyse du discours) • Relation entre thèmes (lexicométrie) • Dictionnaires sémantiques personnalisables (fabriquer rapidement des outils d’interprétation ou des thésaurus automatique) • Affichage sélectif par thème ou par catégorie linguistique • Filtrage des thèmes en fonction de leurs pertinences • Graphe hypertexte permettant d’analyser et de naviguer dans les documents • Fouille de texte • Administration de base de données

  41. Outils disponibles Prix : 5382 euros + formation (1 ou 2 personnes) 1554 euros Clientèle  : Aérospatiale, Airbus, Armée de l’air, Wanadoo, Vivendi….

  42. Outils disponibles APERTO LIBRO

  43. Outils disponibles • Prix : 29 750 euros en mode intégrés à un SI (hors taxes) • 655 euros hors taxes par mois en mode ASP (hors taxes) • Clientèle : • EDF, Observatoire de la Concurrence • Le Ministère de l’Agriculture et de la Pêche, Site thématique de suivi de la sécurité alimentaire à accès réservé • Education Nationale (France) • Journal Quotidien Régional (France) • Zetascribe, Station de travail du « journaliste rédacteur » • France Télécom, Veille technologique des Télécoms en Asie Océanie. • Citroën, Veille Marketing sur la voiture Multimédia. • Vedior BIS, Constitution de Cvthèques Acquisition et extraction de CVs "natifs"

  44. Comparatif

  45. Le marché • Créer de la valeur par l’information • Informatique Décisionnelle: Système interprétant des données complexes permettant la recherche active, l’analyse et l'exploitation de l'ensemble des renseignements qu'une entreprise doit posséder et peut acquérir. Les données sont analysées selon plusieurs dimensions afin de prendre des décisions en connaissance de cause.

  46. Le marché • Les domaines couverts: • CRM • GRH • Knowledge Management • Risk Management • Supply Chain Management… • Analyse Multidimensionnelle / Prédictive

  47. Le marché • Résistant et Dynamique: • Dans un environnement difficile, les entreprises ont plus que jamais besoin d'un pilotage affiné de leurs activités. • Un panel de solutions du couvrant la quasi-totalité des besoins • les PME comme nouvelle cible

  48. Le marché • Quelques acteurs: • Éditeurs de solutions intégrées: Business Objects; Cognos; Hyperion; SAS; Oracle; SAP • Prestataires spécialisés: Keyrus; Business & Decisions; Micropole Univers

  49. Le marché • Positionnement: Revenus Licences et Maintenance (IDC, 2004) • * Informatique Décisionnel: • Data Mining • Applications Analytiques • Reporting ERP ID* Sécurité CRM

  50. Conclusion “La cartographie répond à des besoins d'utilisation industrielle de l'information” Emmanuel Meriot, directeur général d'Autonomy “la tendance est à une évolution graduelle, avec l'ajout de fonctions de recherche d'experts aux outils de recherche de et d’analyse des documents” Eric Woods (Ovum)

More Related