Internet
Les Moteurs de recherches
Google

Dès son ouverture, Google présente une interface de recherche ouverte sur les recherches du Web.

Il est possible de cliquer sur les onglets Images, Groupes et Répertoires pour effectuer un type de recherche précis. Il est possible de rechercher tout le Web, uniquement les images, les groupes Google ou le répertoire Google.

Interface Générale de recherches Web

Interface Recherche d'image

Présentation de Google par Google

« L'élément fondamental de notre logiciel est PageRank, un système de classement des pages Web mis au point par les fondateurs de Google (Larry Page et Sergey Brin) à l'université de Stanford. Et pendant que plusieurs dizaines d'ingénieurs et de spécialistes consacrent leurs journées à améliorer les différents aspects de Google, PageRank reste la pierre angulaire de nos outils de recherche. » 

Ce système PageRank profite des innombrables liens du Web pour évaluer le contenu des pages Web et leur pertinence vis-à-vis des requêtes exprimées. Son principe est simple : tout lien pointant de la page A à la page B est considéré comme un vote de la page A en faveur de la page B. Toutefois, Google ne limite pas son évaluation au nombre de liens (votes) reçus par la page, il procède également à une analyse de la page qui contient le lien. Les liens présents dans des pages jugées importantes par Google ont plus de « poids », et contribuent ainsi à « élire » d'autres pages. 

Pour retrouver les pages qui correspondent au mieux à une requête, Google complète l'évaluation PageRank par des mécanismes évolués de correspondance de texte et examine différents aspects du contenu de cette page (et du contenu des pages liées à celle-ci) afin de déterminer si elle correspond à la requête. Ces méthodes complexes et automatiques utilisées par Google rendent impossible toute manipulation humaine des résultats.

Les sites pouvant être associés à une publicité sont indiqués « Sponsored Link ».

L'index de Google porte sur près de deux milliards d'adresses URL.

La recherche simple

Dans l'interface simplifiée de Google, saisissez dans le « champ de recherche » un ou plusieurs mots décrivant les informations recherchées et appuyez sur la touche « Entrée » du clavier ou cliquez sur le bouton « Recherche Google ». Google va afficher une liste de liens correspondant à cette requête.

Dans le cas ou vous avez plusieurs mots à saisir, séparez-les par une espace.

Le bouton « J'ai de la chance » va afficher directement et uniquement la page Web considérée par Google comme la plus pertinente pour votre requête.

Termes ignorés

Google ignore les caractères : le, la, les, du, avec, vous, etc. et aussi les mots tels que « http » et « .com » et les lettres ou les chiffres d'un seul caractère. Ils sont appelés « mots vides ».

Pour forcer l'inclusion d'un des ces mots dans une recherche, il suffit de le faire précéder d'un espace puis du signe plus +.

Exemple : « +nouvelles +technologies +de +la +communication ».

Google utilise les mots tels qu'ils sont entrés dans le champ de recherche. Il est donc inutile de saisir un astérisque (*) dans la recherche.

Google ne tient pas compte de la « casse » des lettres c'est-à-dire des majuscule ou des minuscules.

Google ne tient pas compte des accents ou autres signes diacritiques comme la cédille.

Exemple proposé par Google : les mots [FRANÇAIS] et [FRANCAIS] retrouvent les mêmes pages. Pour indiquer que ces deux termes ont une signification différente, utilisez un signe plus ( + ), soit les termes de recherche [+FRANÇAIS] et [+FRANCAIS].

Extrait du didacticiel de Google

Copie cachée
Google met en cache le texte de toutes les pages explorées (1,6 milliards de pages !) ; en cliquant sur ce lien, vous pouvez afficher le contenu textuel de ce résultat tel qu'il se présentait lors de la dernière exploration -- même si la page HTML est inaccessible pour une raison quelconque (serveur arrêté, problème de lien, etc.). Lorsque vous affichez la version cachée d'une page de résultat, Google contraste toutes les occurrences de vos termes de recherche dans des couleurs différentes.

Pages similaires
Lorsque vous cliquez sur ce lien, Google recherche les pages traitant de sujets semblables ou identiques.

Résultats affichés en retrait
Lorsque Google trouve plusieurs résultats sur le même site Web, le résultat le plus pertinent est affiché contre la marge gauche et les autres sont situés légèrement en retrait vers la droite.

Recherche avancée

En cliquant sur ce lien, Google affiche une page qui permet d'ajouter des fonctions de recherches pour ainsi de mieux la cibler. En spécifiant davantage de mots, les résultats deviennent un sous-ensemble des pages renvoyées par la requête originale.

Elle permet :

  • de limiter la recherche aux pages d'un site donné. 
  • d'exclure certaines pages d'un site donné. 
  • de limiter la recherche aux pages rédigées dans une langue donnée. 
  • de retrouver les pages liées à une page donnée. 
  • de retrouver les pages liées à la page affichée. 

Dans la requête de base, Google renvoie uniquement les pages Web qui contiennent tous les mots spécifiés. Il vaut mieux cibler la recherche et obtenir une liste de résultats à la fois plus courte et plus pertinente. Pour cela, il suffit d'ajouter d'autres termes de recherche à la requête.

Exclusion de mots

Pour exclure un mot de la recherche, placer un espace suivi du signe moins ( - ) devant ce mot.

Recherche d'expression

Pour rechercher une expression, il convient d'utiliser des guillemets. En plaçant plusieurs mots entre guillemets, Google les considère comme une seule expression et recherche uniquement les documents qui contiennent ces mots.

Cette règle ne s'applique pas aux « mots vides », qui exigent le signe plus ( + ) pour être pris en compte.

Les recherches portant sur plusieurs mots placés entre guillemets sont particulièrement utiles pour retrouver une citation, un proverbe, un titre de livre ou de film, un titre ou un vers de chanson, un lieu géographique, un personnage célèbre, etc. 

Certains caractères sont reconnus par Google comme connecteurs d'expression : tiret ( - ), barre oblique standard ( / ), point ( . ), signe égal ( = ). 

Opérateurs de ciblage 

Certaines chaînes de caractères, ou « opérateurs », modifient le comportement de Google. Par exemple, l'opérateur site:. Pour limiter la recherche à un site ou à un domaine spécifique, utiliser la syntaxe site:domaine.com dans le champ de recherche de Google. 

Pour consulter les articles parus dans la presse sur Google, entrez la requête suivante :

Interface Recherche par Répertoire

C'est ce que l'on retrouve dans les autres moteurs de recherche.

Ce répertoire directory.google.com permet de rechercher les sites Web les plus pertinents pour un sujet donné et dans un secteur donné.

En « descendant » ainsi dans différentes sous-catégories du répertoire, il est possible de réduire le nombre des pages intéressantes et d'augmenter la pertinence de la recherche. 

Aide de Google

oOo

Document Bernard Dimet
© PorTices
samedi 27 janvier 2007