Voici le texte d’un échange à peine édité avec un lecteur de Transnets [MaJ: Laurent Filippi] qui pense que Google n’a pas autant de réponses qu’il prétend avoir aux questions que nous lui posons. Je n’ai pas, pour ma part, de réponse à la question posée par ce lecteur. Mais peut-être qu’ensemble nous en trouverons une.

« Prenons l’exemple d’une requête ad hoc : je demande à Google les 3 mots : ornithorynque test google

« Google annonce « Résultats 1 à 100 sur un total d’environ 15 000 pour ornithorynque test google (0,21 secondes) « 

« J’affiche les résultats Google à 100 par page, mais si je descends en bas de la page 1, je vois qu’il y a seulement 7 pages de résultats (alors que je devrais en avoir 10 pour avoir les 1000 premiers résultats Google).

« En allant à la page 7, je lis: « Résultats 401 – 487 sur 487 » pour ornithorynque test google. (0,68 secondes)

« Bon, déjà, il faudrait savoir, c’est 15000 ou 487 ? 🙂

« Je veux bien admettre que ce soit 487 parce que pour limiter les résultats aux pages les plus pertinentes (total : 487), Google a ignoré certaines pages à contenu similaire.

« Google dit aussi: « Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées. »

« Je relance donc la requête en incluant les pages ignorées et j’arrive alors à : « Résultats 901 à 963 sur un total d’environ 15 000 pour ornithorynque test google. » (1,41 secondes)

« Il y a donc en tout et pour tout 963 résultats. Mais alors quid des 15.000 du départ ?

« Je comprends que Google donne une « estimation » avec les 15.000 résultats, mais entre 15000 et 960, la différence est quand même énorme.

« Est-ce que c’est un problème que vous avez déjà eu? Ou est-ce qu’il est peut être déjà bien connu que les chiffres sont faux ? »

Ce à quoi j’ai répondu du tac au tac (c’est à dire un peu vite):

Bonjour, le pb est connu: Google n’affiche que les mille premiers résultats.

J’ai aussi suggéré d’ajouter des mots et d’utiliser un autre moteur de recherche.

Ça ne suffit pas à ce lecteur qui me répond:

[Puisque Google me donne 900 réponses au lieu de 1000] « ce n’est pas la limitation à 1000 qui joue, c’est réellement qu’il annonce 15000 résultats et qu’il n’en a que 900.

« Donc il me semble que c’est l’estimation des 15.000 requêtes qui est fausse ? Et je trouve très étonnant que Google annonce 15000 fichiers quand il n’est pas capable de renvoyer plus de 900 requêtes ? »

Je trouve la conclusion un peu rapide mais je n’ai pas de réponse plus précise. Peut-être en avez-vous?

J’enquête, je suis et j’analyse les technologies de l’information et de la communication depuis la préhistoire (1994). Piqué par la curiosité et l’envie de comprendre ce que je sentais important,...