1 / 38

Référencement et recherche sur le web

Référencement et recherche sur le web. Quelques « adresses internet ». http://www.univ-brest.fr http://doelan-gw.univ-brest.fr:8080/ http://geai.univ-brest.fr/~carpenti/ http://geai.univ-brest.fr/recherche/index.html#publis https://www.secure.bnpparibas.net/ ftp://ftp.nai.com.

sezja
Télécharger la présentation

Référencement et recherche sur le web

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Référencement et recherche sur le web

  2. Quelques « adresses internet » http://www.univ-brest.fr http://doelan-gw.univ-brest.fr:8080/ http://geai.univ-brest.fr/~carpenti/ http://geai.univ-brest.fr/recherche/index.html#publis https://www.secure.bnpparibas.net/ ftp://ftp.nai.com

  3. Schéma général d’une URI URI : Uniform Resource Identifier URL : Uniform Resource Locator Schéma général : Scheme://nom:mot de passe@ machine.domaine.suffixe:port/ chemin/fichier?parametre=valeur

  4. Syntaxe d’un URI - Partie 1 Scheme : protocole utilisé. Exemples : http : hypertext transfer protocol https : http sécurisé ftp : file transfert protocole telnet : telnet Liste non exhaustive. Essayer par exemple, dans Mozilla Firefox : about:plugins

  5. Syntaxe d’un URI - Partie 2 www.univ-brest.fr www : nom (ou alias) de la machine serveur N.B. De nombreux sites Web ont un nom commençant par www. Mais ce n’est qu’une convention… univ-brest.fr : domaine .fr : suffixe du domaine Exemples : .be, .uk, .eu, .net, .org, .com, .edu

  6. Syntaxe d’un URI - Partie 3 Ex: http://doelan-gw.univ-brest.fr:8080/ Un serveur Web utilise en général le port 80. Autrement dit, on pourrait insérer :80 dans la plupart des URI. Mais, en utilisant d’autres ports, on peut disposer de plusieurs serveurs sur une même machine.

  7. Syntaxe d’un URI - Partie 4 Chemin et fichier :Hiérarchie de répertoires et nom du fichier demandé Cas particuliers et remarques : geai.univ-brest.fr/~carpenti : site personnel de l’utilisateur carpenti L’extension du nom de fichier renseigne sur la technologie utilisée :geai.univ-brest.fr/secretariats.html : page htmlgeai.univ-brest.fr/~carpenti/statistiques/table1.php : page en php

  8. Moteurs et annuaires • Annuairesbases de données gérées manuellement par des documentalistes • Moteurs de recherchebases de données alimentées par des robots logiciels • Méta-moteursinterrogent en parallèle différents moteurs et compilent les résultats Objectif commun : permettre la recherche d’informations

  9. Annuaires Ce sont des bases de données renseignées manuellement. Les auteurs proposent leur site au référencement Un documentaliste apprécie l’intérêt du site, rédige un descriptif, classe le site dans une catégorie... • Avantages : bonne qualité générale des informations fournies • Inconvénients : en général taille assez réduite

  10. Exemples d’annuaires • Le guide Web sur Yahoo : www.yahoo.com, www.yahoo.fr, fr.dir.yahoo.com • Nomade : www.nomade.tiscali.fr • Looksmart : www.looksmart.com, www.looksmart.co.uk • Open Directory Project : www.dmoz.org

  11. Exemples • Rechercher, sur Yahoo, les sites sur l’impressionnismePar exemple : • faire la recherche sur www.yahoo.fr (300000 résultats) • puis utiliser le guide (une vingtaine de résultats pertiments).

  12. Moteurs de recherche • Un robot logiciel (spider, crawler) parcourt le Web à la recherche de nouvelles pages à indexer • Le contenu des pages trouvées est indexé dans une base de données • Avantages : nombreuses pages indexées • Inconvénients : fonctionnement peu intelligent.

  13. Exemples de moteurs Altavista : www.altavista.com, www.altavista.fr Excite : www.excite.com, www.excite.fr Francité : www.francite.com Google : www.google.com, www.google.fr Hotbot : www.hotbot.lycos.com, www.hotbot.fr Lycos : www-english.lycos.com, www.lycos.fr NorthernLight : www.northernlight.com Voilà : www.voila.fr

  14. Meta-moteurs • Interrogent en parallèle plusieurs moteurs de recherche • Suppriment (en principe) les doublons dans les réponses obtenues • Renvoient à l’utilisateur une compilation des résultats

  15. Exemples de meta-moteurs • Metacrawler : www.metacrawler.com • Profusion : www.profusion.com • Askjeeves : www.ask.com • Dogpile : www.dogpile.com • Highway61 : www.highway61.com

  16. Limites de la démarche Moteurs de recherche et annuaires permettent-ils l’accès à l’ensemble du Web ? Réponse : pas du tout. Certains auteurs estiment même que 90 % de l’information présente sur le Web leur échappeParmi les obstacles à l’indexation :- les images- les documents de formats autres que HTML- les bases de données et le Web dynamique

  17. Référencement d’un site Position du problème : nous avons réalisé un site, qui est mis en ligne chez un hébergeur. Avons-nous une chance de voir le site apparaître dans les réponses d’un moteur de recherche ?Réponse : non, pratiquement aucune, si nous ne demandons pas le référencement du site

  18. Référencement d’un site sur un annuaire Tous les moteurs et les annuaires proposent des formulairespermettant de demander l’inscription du site. Pour les annuaires, les indications à fournir sont simples : - adresse (url) du site - résumé du contenu - « catégorie » souhaitéeExemple : référencement sur Yahoo

  19. Référencement d’un site sur un moteur de recherche Exemple : essayons de référencer une page sur Google.

  20. Problèmes liés au référencement Il ne suffit pas de demander le référencement…. Problèmes de délais : parfois plusieurs mois pour quenotre demande soit prise en compteDe même, pour les moteurs de recherche, délai important entre deux visitesProblèmes de cohérence entre les bases de données d’unmême moteur : Yahoo-France et Yahoo-US par exemple

  21. Rester référencé… • J’ai proposé mon site au référencement… • suis-je sûr de le voir accepté ? • - restera-t-il référencé ?- où apparaîtra-t-il dans les réponses des moteurs ?

  22. La stratégie Google Google évalue la « popularité » d’un site d’aprèsle nombre de liens pointant vers ce site : page rank Quelle prise en compte pour des sites délivrantune information très spécialisée ?

  23. Scoring En principe, indexation en « texte intégral »En fait :- exploration tronquant les pages trop longues- poids différents donnés aux différentes parties du document (titres, parties marquées par des balises <H1>, etc)- problème des images : renseigner correctement les attributs ALT=….

  24. Guider les robots indexeurs Balises meta : <META name=« keywords » content=« ….. »> <META name=« description » content=« … »> Normalisation Dublin Core <META name=« DC.Creator » content….

  25. Piloter le robot indexeur Le fichier robots.txt. Exemple :User-agent: *Disallow: /manualUser-agent: susedigDisallow: Les balises meta robots <META name=« robots » content=« index,follow »>

  26. Recherche d’informations Utiliser les moteurs et les annuaires pour rechercherde l’information- les outils ont des capacités variées, mais sont complémentaires- ne pas se limiter à un seul moteur- utiliser les possibilités de recherche « étendue »

  27. Syntaxe de recherche sur Google - par défaut, un ET entre les différents termes spécifiés- non-prise en compte des mots « vides », sauf s’ils sont précédés de « + »- guillemets permettant de spécifier une expression- caractères accentués ignorés- ciblage de la recherche : opérateurs link: et site:- pas de jokers

  28. Syntaxe utilisée par Altavista • Opérateurs booléens : AND, OR, NOT, NEAR- Prise en compte des diacritiques, des majuscules- Jokers * et ? • Expressions : guillemets- Indicateurs de « niveau de recherche » : text: title: url: host: domain: image:

  29. Exemples de recherche 1) Trouver des sites proposant des cours d’Internet (des cours enseignant l’internet) Mots-clés possibles : Internet, cours, guide, tutoriel, leçons, exercices Penser à rechercher les mots clés dans le titre de la page 2) Trouver les pages hébergées à l’UBO et qui citent le M2 Rédacteur/Traducteur

  30. La recherche d’images Même principe que la recherche de documents textuels, mais problèmes liés à l’indexation. Google utilise en général : - soit le nom du fichier - soit le contenu de la balise « alt » dans le code HTML de la page : <IMG SRC=« toto.jpg » ALT=« photo de toto »>

  31. La recherche d’images (2) Exercice : Cherchez les portraits d’un personnage connu en utilisant l’option « images » de Google Affichez le site affichant l’un d’eux Recherchez l’indice à partir duquel Google a pu référencer cette image. Pour cela, vous devrez sans doute afficher le code source de la page.

  32. Recherche de publications scientifiques Le SUDOC (Système Universitaire de documentation) est le catalogue collectif des universités françaises. Adresse : http://corail.sudoc.abes.fr Le catalogue de la BU de l’UBO : Adresse : http://zoe.univ-brest.fr/brest.html Google Scholar : Adresse : http://scholar.google.com

  33. Bien utiliser son navigateur • Enregistrer une pageAvec Mozilla Firefox : « Web Page - Complete » : avec les images, rassemblées dans un répertoire • Imprimer une page Page HTML simple : en général sans problème (sauf caractères blancs sur fond foncé)Page comportant des cadres (frames) : de préférence, affichez le cadre désiré dans une fenêtre, puis imprimez-la

  34. Bien utiliser son navigateur (2) • Imprimer une page (suite)Page comportant des tableaux : le comportement dépend de la manière dont le code de la page a été écrit. Pensez au format « paysage » ...Page d’un site « dynamique » utilisant Javascript, etc : l’auteur n’a-t-il pas prévu un bouton « imprimer » ou « version imprimable »

  35. Bien utiliser son navigateur (3) • Récupérer une image, télécharger un fichier .doc, .pdf, etcCliquez avec le bouton droit de la souris sur l’image, ou le lien vers le fichierDans le menu contextuel qui apparaît, sélectionnez la commande « Enregistrer l’image sous... », « Enregistrez le lien sous... »

  36. Bien utiliser son navigateur (4) • Utiliser plusieurs fenêtres, ou plusieurs onglets au cours de la navigationCliquez avec le bouton droit de la souris sur le lien vers la page cible. • Dans le menu contextuel qui apparaît, sélectionnez la commande « Ouvrir le lien dans une nouvelle fenêtre», « Ouvrir le lien dans un nouvel onglet »Remarque : Certains liens sont configurés pour ouvrir la page cible dans une nouvelle fenêtre.

  37. Bien utiliser son navigateur (5) • Conserver l’adresse des sites intéressantsLes navigateurs possèdent un menu « Ajouter aux signets », « Add to bookmarks », « Ajouter aux favoris »Il existe également des menus permettant de gérer ces signets : renommer, supprimer, structurer de façon hiérarchique...

  38. Bibliographie • Samier H., Sandoval V., la recherche intelligente sur l’Internet, Hermès • Garcia L. et al., La recherche d’information, Formation au C2i, http://www.c2imes.org/PDF/B2.pdf • Différents documents mis en ligne par l’URFIST de Bretagne et Pays de Loire : http://www.uhb.fr/urfist/supports.htm

More Related