220 likes | 321 Vues
COMMENT FONCTIONNE GOOGLE. QUE FAIT UN MOTEUR DE RECHERCHE?. Contrairement à une base de données structurée dont on peut facilement extraire des informations, le WEB est une immense collection de textes de toutes natures qui évolue en permanence.
E N D
QUE FAIT UN MOTEUR DE RECHERCHE? Contrairement à une base de données structurée dont on peut facilement extraire des informations, le WEB est une immense collection de textes de toutes natures qui évolue en permanence.
Le moteur de recherche copie préalablement les pages sur des milliers d’ordinateurs (60 000 pour Google!) et les trie par ordre alphabétique (selon les mots clé). Lors d’une requête relative à un mot clé, le moteur répond par la liste des pages contenant ce mot clé. Mais il y en a des dizaines de milliers en général.
LE CLASSEMENT PAR ORDRE DE PERTINENCE C’estici qu’intervient l’innovation de Larry PAGE (fondateur avec Serguei BRIN de Google) connue sous le nom de PAGERANK. L’idée est de répondre à la requête en citant les pages par ordre de pertinence.
Le WEB est un graphe Le Web a une structure due au fait que les pages se citent mutuellement. c’est le principe de l’hypertexte : les pages se citent mutuellement par les fameux liens. On va donc partir de l’idée que plus une page est citée, plus elle est pertinente. On verra à la fin que ce principe a des limites.
Mise en place d’un degré de pertinence • Comptage « naïf » Il est clair qu’une page importante reçoit de nombreux liens. Naïvement, on peut croire que si une page reçoit beaucoup de liens, elle est importante et on définit son importance par:
Avec p=0,15, on obtient assez rapidement la limite à 0,01 près
En guise de conclusion Au départ Google se voulait un outil descriptif. Si une page est importante, elle doit apparaître en tête du classement. Mais le succès de Google l’a transformé en outil normatif: si une page apparaît en tête, alors elle est considérée par la communauté comme importante!