Accueil
Plan
Aide
>>>
>>>
>>>
LEXPRESS multimédia Net économie Cyberplanète Internet Cédéroms Jeux sur consoles
 Sommaire
Qu'est-ce qui fait vrombir Google ?
21/11/2002
E-mail gratuit
 Votre adresse
 @lexpress.net 
 Abonnez-vous
Offrir, gérer, payer en
ligne votre abonnement
 Les archives
Plus de 100 000 articles
en ligne
    Tous nos sites
  LEXPRESS Infos
  LEXPRESS Livres
  LEXPRESS Emploi
  LEXPRESS.tv
  Mail@lexpress.net
  LEXPRESS Multimédia  Net Economie  Google, moteur à chercher

  Imprimer  Envoyer à un ami

Google, moteur à chercher
L'Express du 21/11/2002
Qu'est-ce qui fait vrombir Google ?
par Guillaume Grallet
Pertinent, rapide: en quatre ans d'existence, le moteur de recherche est devenu le plus utilisé du Web - au point de laminer la concurrence. Comment? Voyage de l'autre côté de la page d'accueil
 
Loin derrière,
les autres moteurs
Quels moteurs de recherche utiliser en dehors de Google? La question se pose de plus en plus. Beaucoup de concurrents nés durant les années fastes d'Internet ont disparu. C'est le cas, du côté américain, de WebCrawler et d'Excite. En France, Ecila, Lokace ou Nomade, autrefois prometteurs, sont aujourd'hui moins novateurs. Il reste tout de même quelques bons sites grand public. Le plus ancien, AltaVista, toujours intéressant, s'est un peu essoufflé. AlltheWeb, le moteur de Fast, est assurément très performant: apparu sur le tard, il fait actuellement la course avec Google pour le nombre de pages indexées. Voila se distingue également. Avec plus de 60 millions de pages, c'est l'index francophone le plus riche. Sans compter qu'il dépend de Wanadoo, l'un des leaders de l'Internet européen, et devrait étendre encore sa couverture de sites italiens, espagnols ou allemands. Petit français, Exalead, créé par des ingénieurs de l'Ecole des mines, à Paris, dispose d'une technologie propre bien aiguisée. Utile pour les recherches très pointues, y compris sur des sujets scientifiques. Enfin plus ludique, Kartoo offre une présentation originale: chaque résultat est proposé à travers une carte de la galaxie d'où émergent, sous forme de planètes, les sites où le sujet recherché est le plus traité.
Drôle de surprise pour les 45 millions d'internautes chinois! Début octobre, quand ils ont tapé «google.com», une page blanche assortie d'un message d'erreur s'est affichée sur leur écran. L'accès au site avait tout simplement été bloqué par les autorités du pays. Au même titre que certaines éditions en ligne de quotidiens étrangers, comme le Herald Tribune, jugées «irrespectueuses». Subversif, Google, aux yeux du Parti communiste chinois? Difficile à dire. En tout cas, si le site est à ce point montré du doigt, c'est que ce moteur de recherche - sa mission est de trouver les adresses Web les plus pertinentes sur tout sujet, une béquille pour les internautes - est très efficace. Et qu'il a pris une ampleur planétaire. Voyage dans l'exception Google.

Google, ou la success story de l'une des pages Web les plus consultées au monde. Plus de 37 millions d'internautes y ont recours chaque mois, qui pour trouver des informations sur la botanique en Papouasie, qui pour consulter les meilleures recettes de cuisine cajun. Sa page de garde n'a pourtant rien de très sexy. Un grand bandeau y accueille l'internaute sur un fond dépouillé. Le nom lui-même - prononcez: «gougueul» - s'inspire d'un terme lancé par le neveu du mathématicien Edward Krasner pour désigner un 1 suivi de 100 zéros. Il n'empêche. Un peu plus de quatre ans à peine après son lancement, le moteur, rentable depuis dix-huit mois, totalise le quart des recherches sur le Web et est capable d'effectuer des requêtes dans 32 langues, dont l'islandais et le catalan - vous pouvez choisir en cliquant sur le bouton «Préférences» en haut de la page d'accueil. La firme, installée à Mountain View, en Californie, a des bureaux à Londres, à Tokyo, à Hambourg, à Toronto et, depuis avril dernier, à Paris.

Tout s'est passé très vite. En 1997, alors qu'Internet commence à réellement faire parler de lui - la mode est déjà aux start-up - deux étudiants, en doctorat à Stanford, mettent au point BackRub, une première technologie de recherche. L'un est new-yorkais, originaire de Russie, Sergey Brin. L'autre, Californien pur sucre, Larry Page. A cette époque, AltaVista existe depuis plus de cinq ans. Et, aux yeux de tous - Brin et Page les premiers, ce pionnier semble bien difficile à détrôner. Les deux compères cherchent donc à vendre leur technologie à un industriel. Personne n'est réellement intéressé, mais, en marge d'un rendez-vous, ils croisent Andy Bechtolsheim, cofondateur de Sun, aujourd'hui chez Cisco. Charmé, celui-ci les pousse à monter leur propre société et leur signe - un geste d'encouragement - un premier chèque de 100 000 dollars. Deux fonds de capital-risque suivront: Sequoia Capital et Kleiner, Perkins, Caufield & Byers, débloquent alors 25 millions de dollars en échange d'une prise de participation. L'acte de naissance de Google. Depuis, les deux compères ont passé la main à Eric Schmidt, un «senior», ex de Sun lui aussi.

Cet argent de départ, le site refuse de le dilapider en dépenses publicitaires. Quand Yahoo!, le portail généraliste de Palo Alto, s'offre de gigantesques affiches dans les aéroports ou des dos de taxi à Londres ou à Kuala Lumpur, Google, encore inconnu, préfère miser sur sa technologie.

«Notre valeur ajoutée, c'est l'analyse mathématique très complexe dont dispose notre outil»

Et elle est originale: la firme de Mountain View a mis au point un outil unique, PageRank, pour classer ses réponses. Là où la majorité des moteurs - l'américain HotBot, par exemple - s'en tient à la répétition du même terme dans les pages d'un site pour en déterminer la pertinence - c'est la règle du nombre des occurrences - Google, lui, utilise la «popularité» des mots recherchés. En clair: une adresse sera d'autant mieux référencée qu'elle sera conseillée par des sites eux-mêmes bien établis. Exemple: vous cherchez un restaurant à Lille, végétarien de surcroît. Sur le bandeau de la page d'accueil, vous inscrivez: «restaurant lille végétarien», la syntaxe en vigueur (sans les guillemets). S'affiche alors la liste des résultats - 103, cette fois-ci. Les premiers, N'Autre Monde, La Victoire suprême et Speakeasy, sont les tables les plus conseillées par l'ensemble des sites, guides en ligne compris.

Google a donc réussi une jolie prouesse: rendre compte de la pertinence d'un site de façon quasi scientifique. «Notre valeur ajoutée, c'est l'analyse mathématique très complexe dont dispose notre outil», martèle Sergey Brin. Un rien prétentieux, mais probant.

Toutefois, il ne suffit pas d'apporter les bonnes réponses; il faut également être rapide. Pour cela aussi Google a sa solution: établir une vaste copie privée du Web. Un logiciel robot (ici, Googlebot) scrute Internet, va de lien en lien et sauvegarde le contenu des pages qu'il trouve sur son chemin, de manière à constituer un «index», sa copie du Web. A la manière d'un Henri Langlois, l'un des fondateurs de la Cinémathèque française, qui, à partir de 1936, a retrouvé les copies de films des débuts du cinéma. Depuis décembre 2001, on peut ainsi dénicher sur Google certains messages échangés sur Usenet, l'ancêtre d'Internet, datant de... 1979.

Ce grenier virtuel, le site l'abrite dans la mémoire de plus de 15 000 ordinateurs, disposés aux Etats-Unis dans 6 centres; attention, leur emplacement est top secret! En Europe, une chose est sûre: un site devrait voir le jour d'ici peu en Suisse. «L'amoncellement de ces ordinateurs ressemble à un empilement géant de boîtes de pizza: ces machines n'ont même pas d'écran, et, dès qu'elles sont défectueuses, Google les jette sans même essayer de les réparer», se rappelle un visiteur. On y stocke, sur des disques durs de 80 gigabits (un petit ordinateur de bureau), près de 3 milliards de pages: des textes, des photos et des chansons. Résultat: à chaque requête, l'archiviste virtuel plonge dans sa base de données et affiche sa réponse en moins d'une seconde.

Mais, en attendant, comment diable ce super Quid - jusqu'ici gratuit - gagne-t-il de l'argent? Certainement pas en facturant le référencement: Google, pour l'instant, se l'interdit. Sage décision. Conforme à l'avis que vient de rendre la Federal Trade Commission, arbitre du monde des affaires aux Etats-Unis. Attention, toutefois, à ce que le moteur ne change pas de politique! «De plus en plus d'acteurs, comme AltaVista ou Inktomi, facturent aux entreprises cette inscription dans leur base de données», regrette Olivier Andrieu, éditeur d'Abondance.com, un site, très pertinent, dédié aux outils de recherche.

Non, jusqu'ici, la cash machine a eu recours à d'autres recettes… Il faut voir ses dirigeants, à peine installés en France, négocier avec les plus grandes centrales d'achats publicitaires, d'Euro RSCG à Carat Multimédia. «Nous avons enchaîné les rendez-vous cette semaine. C'est dingue!» lâche Franck Poisson, directeur aux allures de VRP. Car, aujourd'hui, il vient de vendre à Voyages SNCF un plan de promotion sur six mois. Et ça marche. La moitié de ses rentrées d'argent proviennent de la publicité.

Publicités vendues aux enchères
Les premium sponsorships, d'abord. Ces pubs de couleur pastel placées en tête des résultats sur un fin bandeau disposé sur toute la largeur de la page sont facturées, en gros, de 70 à 75 € pour 1 000 pages vues. Elles sont donc l'une des vaches à lait de Google. Voilà pour le haut du site.

Sur le côté à droite, Google a installé trois minuscules publicités, les adwords. Le thème de ces minipubs est en relation directe avec celui de la recherche. Du coup, la fréquentation est plus élevée que si la publicité était aléatoire: environ 3 internautes sur 100, aux Etats-Unis, et le double en France cliquent sur le lien promotionnel. Ces publicités sont vendues aux enchères - mise à prix: 5 centimes d'euro par clic. La meilleure position est celle du haut. A la mi-septembre, tous les internautes qui ont tapé «Harry Potter» ont vu, à côté des résultats de leur recherche, s'afficher des pubs pour la Fnac: Pinault-Printemps-Redoute, son propriétaire, avait été le plus offrant.

Mais Google n'aime pas parler d'argent. Dès que l'on pose des questions sur ses revenus, la firme se transforme en «grande muette». Pour sa défense, le site explique qu'il n'est pas coté en Bourse - «Vu les conditions du marché, ce n'est pas le moment», déclare, tranchant, un porte-parole de l'entreprise - et il n'a donc aucune obligation de communiquer. Pourtant, il vient d'embaucher un directeur financier de haut vol spécialisé dans les IPOs (introductions en Bourse, en anglais). A suivre, donc. Un indice, toutefois, sur les revenus de Google: son concurrent direct, Overture, affiche une santé florissante, avec 635 millions de ventes en 2002 et une rentabilité de plus de 10%. Il n'a d'ailleurs pas lésiné sur le lancement de sa filiale française, en septembre: l'événement a eu lieu à l'occasion du très chic MG Rover Classic Senior, dans la banlieue ouest de Paris, un jubilé de sport au cours duquel se sont affrontés plusieurs vétérans du tennis mondial.

Reste que la pub est extrêmement volatile. Google, pour diversifier ses revenus, s'est mis à vendre son bien le plus cher, sa technologie. A des portails, tout d'abord, comme AOL ou Yahoo!, pour lequel Google fait en sous-main toutes les recherches. En effet, les deux firmes ne sont pas concurrentes: Yahoo! est non un moteur, mais un annuaire. Les sites y sont «rangés», dans un classement non exhaustif, par des surfeurs professionnels. Enfin, très lucratif - le petit boîtier est loué de 20 000 à 50 000 dollars chaque mois - le Google Search Appliance effectue des recherches documentaires poussées parmi les données internes - chez Cisco, par exemple.

Le moteur, qui a su se faire si vite une place au soleil, reste pourtant fragile. En juin dernier, selon l'indicateur NetBooster-Weborama, Google a connu son premier véritable fléchissement d'audience. Tombant de 49,2 à 47% en moins d'un mois, alors que la part de marché d'acteurs mineurs demeurait stable. Certes, Google n'a plus grand-chose à craindre de moteurs établis. AltaVista, par exemple, lancé en 1995 par Compaq, s'est un peu endormi sur ses lauriers.

Défis d'avenir
Mais un moteur peut en cacher un autre (voir l'encadré ci-dessus). La plus grosse menace pourrait bien venir du nord. Avec un nom approprié: Fast Search and Transfer, fast signifiant «rapide», en anglais. Cette firme, fondée en 1997 en Norvège par une poignée d'étudiants de l'Université des sciences et technologies de Norvège, talonne Google. L'élève vient même de piquer à son maître quelques-uns de ses meilleurs clients, comme Lycos, Scandinavian Online et même IBM. «Sans compter Tiscali, depuis toujours affilié à Google!» triomphe Pascal Gaillard, de Fast France. Bref, pour que Google reste en tête, il va devoir relever de nombreux défis.

A commencer par sa couverture du Web. Même s'il est leader, le moteur n'a indexé que la moitié des 6 milliards de pages que compte la Toile. Sans compter les quelques dizaines d'autres milliards de pages qui en constituent la partie invisible. Composées d'archives de journaux, de tableaux Excel…, elles sont difficilement accessibles. Autre souci: la fraîcheur des résultats. Le Web est un ensemble vivant: des pages naissent, d'autres meurent (des dead pages, dans le jargon). Or, à en croire le site spécialisé Searchengineshowdown.com, 4,3% des pages trouvées par Google étaient périmées à la mi-2001. Contre 2,3% pour Fast et HotBot, et seulement 1,7% pour MSN, le moteur de Microsoft. C'est que Googlebot parcourt l'ensemble du Web tous les vingt-huit jours au mieux; il serait bien plus efficace si son passage - auquel cas le site devrait perfectionner son outil - devenait quotidien.

Une autre remarque - de fond, cette fois-ci - sur la classification même de Google: en ne sélectionnant que les sites déjà recommandés par d'autres, le moteur ne favorise pas l'émergence d'adresses nouvelles. «PageRank est une technologie efficace, mais qui agit un peu comme un miroir déformant, grossissant ce qui est déjà célèbre», se plaint un internaute.

Mais les 250 habitants du Googleplex, siège californien de la firme - où continue de régner l'esprit bon enfant des start-up qui font du profit, avec bonbons et peluches à profusion - ont un plus grand défi à relever. La quête de sens, intellectuellement passionnante, est encore balbutiante. Comment, notamment, saisir avec finesse la nature de la recherche de l'internaute? «Le terme “Saturne”, par exemple, peut, selon les cas, désigner une planète ou une voiture. Il est donc important d'anticiper la nature des informations que recherchent les internautes», détaille Jorg Soizik, l'un des cadres de la firme. En conséquence, un nombre croissant de sites de recherche font travailler des linguistes et des psychologues pour que les moteurs se rapprochent du langage naturel. Certains, comme Ask Jeeves, proposent carrément d'établir une relation entre les personnes qui posent des questions et d'autres qui y répondent. Auracom, de son côté, met en place des assistants de requête à destination des documentalistes quand ALogic vise les professionnels de la veille technologique.

Pris de court par tous ces progrès, le moteur s'est mis, lui aussi, à exposer les dernières avancées de sa cellule recherche et développement en ligne. Pour que le grand public puisse donner son avis. Principal chantier des Google Labs, laboratoires de recherche de la société: les programmes de reconnaissance vocale, à tester au cours d'un simple appel téléphonique. Intéressant, mais pas toujours convaincant. Quand, au bout du fil, on demande «Minneapolis», le moteur patine. Marque un temps d'arrêt. Puis délivre, au milieu de résultats pertinents, une sélection de pages consacrées aux… voitures.

Rechercher

Recherche avancée

Newsletter

Inscrivez-vous! OK



La météo dans votre ville
Charte Internet
Copyright L'Express
Groupe Express | 50 ans d'histoire | contacts | publicité | partenaires | abonnements