1 / 44

Quelle stratégie d'indexation mettre en œuvre avec Microsoft SharePoint 2010 et FAST Search

Quelle stratégie d'indexation mettre en œuvre avec Microsoft SharePoint 2010 et FAST Search. Mercredi 10 février 2010 . Aissam MEZHOUD FAST Technology Specialist Microsoft. Didier BOTELLA Manager Sopra Consulting. Les moteurs de recherche d’entreprise 10 ans d’histoire.

nizana
Télécharger la présentation

Quelle stratégie d'indexation mettre en œuvre avec Microsoft SharePoint 2010 et FAST Search

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Quelle stratégie d'indexation mettre en œuvre avec Microsoft SharePoint 2010 et FAST Search Mercredi 10 février 2010 Aissam MEZHOUD FAST TechnologySpecialist Microsoft Didier BOTELLA Manager Sopra Consulting

  2. Les moteurs de recherche d’entreprise10 ans d’histoire

  3. Une explosion des contenus Internet Intranet Volumétrie • 1997 : 100 millions de pages • 2007 : 100 milliards de pages Volumétrie des projets • 1997 : 100 000 documents • 2007 : 100 millions de documents Contenus • File systems • Serveur Web • Gestionnaire de contenus (Notes, Documentum, Sharepoint, etc.) • Base de données • Mail • Archivage (mail, file system) • Record Management

  4. La recherche en entreprise DESKTOP Mono utilisateur Contenu maîtrisé Fonds classé par l’utilisateur Pas de problème de sécurité Contenu peu interconnecté ENTERPRISE Multi-utilisateurs Contenu non maîtrisé Fonds en vrac Sécurité multiple Contenu en silos INTERNET Multi-utilisateurs Contenu illimité Fonds en vrac Pas de sécurité Contenu interconnecté

  5. Un projet moteur de recherche

  6. L’apport de l’indexation sur la recherche

  7. Les étapes de la stratégie d’indexation

  8. Les étapes de la stratégie d’indexation

  9. Profils de recherche

  10. Les étapes d’une indexation

  11. L’étude de la stratégie d’indexation

  12. Les spécificités du contenu • Sources/Repositories • Sharepoint, Site Web, Système de fichiers, Base de données, etc. • Fonds • Site Sharepoint, etc. • Contenu

  13. Les spécificités des sources Sources Organisation • Nombre de sources • Nombre de documents par source • Type de repository Une collection par source Plusieurs collections par source Plusieurs sources par collection

  14. Les spécificités du fonds (1/2) Fonds Organisation • Volumétrie • Fréquence de mises à jour • Taux des mises à jour Plusieurs collections ou une collection Indexation à la volée ou par lot

  15. Les spécificités du fonds (2/2) Fonds Organisation • Information pertinente/non pertinente • Formats • Type d’information • Structuré • Non-structuré Choix de l’information à indexer ou non Choix de l’information à utiliser pour les facettes

  16. Les contraintes opérationnelles Contraintes Organisation • Nécessité de 24/24 7/7 • Nécessité de mises à jour temps réel • Gestion des pannes • Gestion de la montée en charge • Gestion des périodes d’indisponibilité • Des sources • Des index Duplication des collections sur plusieurs serveurs Collection journalière et collection totale Heures d’indexation

  17. Les spécificités de la recherche Contraintes Organisation Gestion des langues Recherche par facettes Boost de document Gestion des profils Niveau d’interaction lors de la recherche Gestion du « 0 résultat » • Niveau de lemmatisation • Définition des facettes • Combien • De quel type • Best betsstatiques/dynamiques • Prévisualisation de documents • Did You Mean

  18. L’organisation des index Plusieurs topologies Gains Un index par serveur Un index réparti sur plusieurs serveurs Un index répliqué sur plusieurs serveurs Configuration simple Meilleurs temps de réponse Loadbalancing/gestion des arrêts/gestion des pannes

  19. La configuration des index Configuration Gains Niveau de gestion de la(des) langue(s) Nombre de facettes Best bet Did You Mean Normalisation de certaines expressions Temps d’indexation Navigation Garbage in/Qualityout

  20. Le mode d’indexation Mode Organisation Indexation complète Indexation incrémentale Comment le moteur est prévenu des mises à jour de la source Temps d’initialisation Temps des mises à jour Indexation push/pull

  21. Offre et produits Solutions pourInternet Business Solutions pourBusiness Productivity Techno FAST FAST Search for SharePoint Internet Sites FAST Search for Internal Applications FAST Search For Internet Business FAST Search for SharePoint SharePoint Server for Internet Sites SharePoint Server Techno SharePoint Search Server Solutions entrée de gamme Search Server Express

  22. SharePoint Server 2010 • Fonctionnalités de base • Interface de recherche • plus riche • Pertinence • Recherche communautaire • Recherche d’experts • Amélioration de la recherche en fonction du comportement des utilisateurs • Déploiement et gestion • Architecture ouverte

  23. FAST Search for SharePoint • Recherche haut de gamme, intégrée dans SharePoint avec la simplicité Microsoft et un coût réduit • Interface de recherche: Interactive • Gestion de la recherche: Personnaliser l’interface pour améliorer la productivité • Traitement de contenu: Enrichir et exploiter le potentiel de votre contenu • Apports pour l’exploitant: Architecture flexible et scalable • Apports pour le développeur: Construire des applications métiers s’appuyant sur la recherche Apports

  24. Interface de recherche interactive • Repères visuels et appels à l'action • Vignettes, prévisualisation et défilement des pages PowerPoint • Best Bets Visuels • Ouverture, modification du document dans le navigateur, … • Exploration et Navigation • Génération automatique de filtres pour affiner la recherche • Recherche par similarité • Suggestion (did you mean) utilisant les termes de l’index • Pertinence • Plusieurs profils de pertinence • Tri par modèle de pertinence, par «Managed Property» ou par combinaisons (multi-tri)

  25. Pré-visualisation Microsoft PowerPoint et Microsoft Word • Pré-visualisation: • Afficher les images de prévisualisation de toutes les pages pour PowerPoint et Word • Glisser l’image vers la gauche ou la droite, ou utiliser les flèches gauche et droite pour voir plus de pages

  26. Ouvrir le document dans le navigateur

  27. Best Bets Visuels Lié au mot-clé de requête et au contexte de l'utilisateur • Définir des Best Bets Visuels pour les mots-clés les plus importants: • Afficher un contenu riche pour un mot clé spécifique • Tout type de contenu (HTML / Flash / Silverlight - affiché dans une iframe)

  28. Affiner les résultats de la recherche • Les résultats de la recherche peuvent être affinés par: • Metadata de SharePoint (Auteur) • Metadata extraites automatiquement – extraction d entités (comme un nom de société)

  29. Recherche de documents similaires • Des documents similaires sont trouvés : • En cliquant sur le lien «SimilarResults» • La requête est enrichie avec des termes du document. • La requête enrichie est exécutée pour récupérer un nouveau jeu de résultats avec des documents similaires.

  30. Tri des résultats • Tri des résultats: • Tri par défaut activé pour la Pertinence et la Date •  Les champs supplémentaires sont activés dans la configuration de la Webpart, par exemple modèle de pertinence personnalisé

  31. Utiliser la gestion de la recherche pour souligner les informations importantes utilisation des best bets, best bets visuels et promotion de documents/sites Visual Best Bets • Interface de recherche • Gérer et faire évoluer l’interface de recherche Best Bets Promote / Demote Results Personnaliser les composants WebPartpour façonner l'expérience utilisateurAffecter aux utilisateurs des droits de contrôles et d’accès aux fonctions de configuration

  32. Gestion de la recherche • Gestion de mots-clés • Synonymes • Best Bets • Best Bets Visuels • Promotion/ rétrogradation de documents • Optimisation du modèle de pertinence : « User Context » Keyword Best Bets Visuels Best Bets Promote / Rétrogradation

  33. Gestion de mots-clés

  34. Promotion Top services sites - Germany http://intranet.comp.de/Konnektor.aspx http://intranet.comp.de/Sicherheit.aspx http://intranet.comp.de/Schnittstell.aspx http://intranet.comp.de/Federierte.aspx Germany - Services

  35. Configuration des Best Bets Visuels Productivity Emergency Dashboard Banner http://intranet.company.com/events/EmergDash.html Healthcare

  36. Optimisation du modèle de pertinence Kevin Kennedy Santé ”Quelles sont les dernières nouvelles sur la productivité ?” Alan Brewer Finance ” Quelles sont les dernières nouvelles sur la productivité ?”

  37. Traitement de contenu The Content Pipeline Processing & refinement Date • Très large couverture linguistique • 82 langues détectées • 45 langues avec traitements avancés • Corrections orthographiques & synonymes améliorent l’interface de recherche • Pipeline de traitement de contenu configurable • Traitement automatique de contenu • Indexe plus de 400 formats de documents • Extraction d’entités • Extracteurspré-configurés: Nom de personne, Lieu, Nom d’entreprise • Extracteurs génériques à configurer Location Amount Company REDMOND, Wash., and OSLO, Norway — Jan. 8, 2008 Microsoft Corp. (Nasdaq “MSFT”) today announced that it will make an offer to acquire Fast Search & Transfer ASA (OSE: “FAST”), a leading provider of enterprise search solutions, through a cash tender offer for 19.00 Norwegian kroner (NOK) per share. This offer represents a 42 percent premium to the closing share price on Jan. 4, 2008 (the last trading day prior to this announcement), and values the fully diluted equity of FAST at 6.6 billion NOK (or approximately $1.2 billion U.S. ). FAST’s board of directors has unanimously recommended that its shareholders accept the offer. Mapper … Configurable Stages EntityExtraction Language Detection Format Conversion

  38. Installation et déploiement faciles • Plateforme flexible et scalable • Apports pour l’exploitant Pour tout type de besoin Volume de requêtes Volume de contenu Gérer, optimiser et administrer ManagedPropertyCollectionmpc = schema.AllManagedProperties; foreach (ManagedPropery mp in mpc)

  39. FAST Search for SharePoint Montée en charge • Montée en charge sur plusieurs dimensions • Volume de requêtes • Volume de contenu • Traitement de contenu et Latence d’indexation • Options de redondance • Recherche • Indexation Indexation et recherche Query Volume Traitement de requêtes Content Volume «Crawling» et traitement de contenu

  40. Apports pour le développeur Content search Extensions dédiées aux applications exigeantes FAST Search for SharePoint back-end + End Users Content+ Directories People search Des fonctions avancées qui nécessitaient jadis des développements sont désormais disponibles par simple configuration SharePoint SharePoint Server back-end

  41. Personnalisation des Web parts Exemple: Ajout d’un nouveau filtre • Go to the result page • Select Site Actions – Edit Page • Refinement panel – Modify shared Web Part • In Refinement - View XML file • Add the new refiner to the XML file • Change number of categories to display

  42. Personnalisation du modèle de pertinence • Un ensemble de modèles de pertinence peut être défini à partir des paramètres du modèle par défaut. • Le modèle de pertinence est configurable en affectant des coefficients aux différentsparamètres • “Authority” • “Freshness” • “Quality (multiple values)” • Etc • Le modèle de pertinence peutêtresélectionné par l’utilisateur au moment de la recherche. Il estprésenté sous forme de critère de tri. • Quelintérêt? • Optimisation du modèle de pertinence par application • Possibilitéofferte à l’utilisateur de trier les résultats à saconvenance

  43. Q&R

More Related