Portail leader de l'information sur les nouvelles technologies - Actualites et enquetes sur l'informatique et les NTIC (nouvelles technologies de l'information et la communication). Exemples de sujets : e-business, telecoms, CRM, VPN, 3G, DSL, fournisseurs d'acces, Linux, piratage, securite informatique, progiciel...
sécurité informatique, stratégies NTIC, piratage informatique, technologie DSL, solutions VPN, stratégies, outils CRM, logiciel Linux, fournisseur d'accès, progiciel, stockage de données, études solution informatique, NTIC, actualité technologie, étude matériel informatique, actualités des nouvelles technologies, enquêtes et trucs et astuces sur le matériel informatique, les logiciels, les fournisseurs d'accès..., emploi et formations informatiques : offres d'emploi informatique..., fiches, tests matériels et logiciels en informatique, 01 Informatique, Caractère, le site des professionnels de l'imprimé - communication imprimée, édition, emballage, encres, finition, flexographie, héliogravure, impression, imprimerie, imprimeur, industries graphiques, numérique, offset, papier, prépresse, presse, print, reprographie, sérigraphie, typographie, Decision Micro, 01 Réseaux.


chercher         



DOSSIER 
le sommaire

les outils
écrire à l'auteur
de l'article
imprimer
l'article
envoyer
par mail

nos services

lettres : gérez
ou découvrez

mobile

séminaires

acheter et
vendre à
moitié prix

produits :
comparez les
prix


sauvegarde
en ligne

traduction




Moteurs de recherche : l’offre hébergée séduit Frédéric Bordage SITES WEB
Moteurs de recherche : l'offre hébergée séduit

Frédéric Bordage
, Décision Micro, le 22/03/2004 à 16h00

Rendus indispensables par la multitude de documents mis sur les sites, les moteurs de recherche sont de plus en plus déployés en mode hébergé. Mais les logiciels traditionnels restent, dans certains cas, incontournables.

« Nous avons 2 000 articles en ligne, cela représente donc beaucoup d'informations avec de nombreux points d'entrée. Nous avons fait un effort particulier quant à l'ergonomie de notre site, mais il y a quand même de quoi s'y perdre », avoue Sébastien Leclere, responsable informatique de la Fédération française de motocyclisme. La Fédération a donc décidé de mettre en oeuvre un moteur de recherche. Une démarche que toutes les entreprises entreprennent un jour ou l'autre face à la croissance du volume d'informations publiées sur leur site institutionnel ou sur leur boutique en ligne.

Le moteur de recherche est alors l'outil idéal pour proposer un mode d'accès alternatif aux informations déjà publiées. Simple à utiliser et ne nécessitant aucun apprentissage, il augmente le confort et fidélise l'internaute. Un moteur de recherche fédère également des ressources hétérogènes et dispersées.

« La multiplication des sites éducatifs et la difficulté d'accès à leur contenu, différentes adresses et différents menus de navigation, nous ont poussés à créer Spinoo, le moteur de recherche du ministère de l'Éducation nationale », explique Erik Boucher, chef de la division du développement numérique au Centre national de documentation pédagogique (CNDP). De son côté, le site marchand Photo12.com possède plus de 180 000 photos numériques en ligne. Traitant de thèmes aussi divers que l'art au XVII e siècle ou le terrorisme, chacun de ces clichés peut prendre des significations multiples, ce qui rend impossible un classement dans une seule rubrique. Le moteur de recherche est alors l'outil privilégié pour accéder à un cliché en fonction de ses différentes dimensions.

Si l'usage et l'apport des moteurs de recherche sont clairement identifiés par les entreprises, la mauvaise qualité des outils d'indexation livrés avec les serveurs d'applications ou proposés par l'hébergeur les poussent à choisir des solutions commerciales. « Le petit moteur de recherche Microsoft Index Server, fourni par l'éditeur, ne nous donnait pas satisfaction », explique Pierre Petitgas, chargé de communication et webmestre de l'Agence de l'eau Seine-Normandie (AESN). Même constat pour la CFDT. « Nous ne pouvions pas intervenir sur le moteur de recherche fourni par notre hébergeur. Or, les résultats étaient décevants. Nous avons donc opté pour la solution en mode FAH [fourniture d'applications hébergées, NDLR] Synomia Search », explique Véronique Blanc, rédactrice en chef du site cfdt.fr.

L'utilisation : opter pour le mode FAH ou le logiciel serveur

Lorsqu'elles décident de recourir à des moteurs d'indexation professionnels, les entreprises doivent d'abord faire un choix d'architecture, dicté par des aspects techniques et économiques. Si le rôle de ces outils reste fondamentalement le même - construire des index de documents pour faciliter leur recherche - deux offres sont aujourd'hui disponibles : des logiciels installés sur le serveur Web de l'entreprise ou de l'hébergeur et des services hébergés par des prestataires externes (mode FAH).

Les outils en mode FAH sont adaptés aux PME possédant des documents relativement homogènes (pages HTML, PDF, etc.), un petit budget et une équipe informatique réduite. « La possibilité d'utiliser un service externe ne nécessitant aucune installation chez notre hébergeur et pas d'intervention de l'informatique interne, était un critère décisif. Qui plus est, notre moteur de recherche était opérationnel dès l'avant-vente de Synomia. Nous n'avions qu'à signer le contrat pour activer ce nouveau service sur notre site », se souvient Pierre Petitgas. Faciles à mettre en oeuvre, les services d'indexation proposent des fonctionnalités avancées : langage naturel, analyse linguistique, génération de sous-requêtes pour affiner les résultats, plan de classement dynamique, etc.

Les logiciels spécialisés sont souvent réservés à des besoins plus spécifiques - vocabulaire métier particulier requérant une analyse sémantique poussée, basée sur des dictionnaires spécialisés, très grosse volumétrie de documents à indexer, besoin de marier données structurées (bases de données) et non structurées (HTML, PDF...), etc. Ces solutions haut de gamme exigent alors un budget en licences, en paramétrage et en intégration bien supérieur. « Avec près de 2 millions de documents hétérogènes répartis sur différents sites et 600 000 requêtes par mois, nous recherchions un logiciel capable de traiter d'importants volumes de documents avec des temps d'indexation et de recherche réduits. C'est pourquoi nous avons retenu K2 de Verity », explique Erik Boucher du CNDP. C'est également la rapidité d'Aurweb qui a retenu l'attention de Photo12.com. Quant au Cridon Nord-Est, avec plus de 400 notaires abonnés accédant à 2 000 documents éminemment techniques, il a préféré le moteur Intuition de Sinequa pour ses capacités d'analyse linguistique, enrichies par des dictionnaires métier.

La mise en oeuvre : cinq minutes pour les moteurs FAH

La richesse de ces logiciels et la pertinence des résultats qu'ils fournissent, nécessitent un travail plus important d'intégration et de paramétrage que les offres FAH. Les éditeurs fournissent alors souvent eux-mêmes les prestations de conseil et d'intégration. « Nous avons réalisé toute la phase d'installation en étroite collaboration avec Sinequa », illustre David Boulanger, directeur du Cridon Nord-Est. L'approche a été la même chez Photo12.com. Le Centre d'information et de formation des élus locaux (Cidefe) a également fait appel à l'éditeur de son moteur, Auracom, car il ne possédait pas de logistique informatique importante en interne.

Généralement, c'est la création des dictionnaires métier plus que la technique elle-même qui demande le plus de temps. « Nous disposons d'une base d'équivalences, d'une base d'adjacences d'une base de mots vide ainsi que d'un certain nombre de dictionnaires [index, NDLR] par champ sémantique [finances, logement..., NDLR] q ui servent de filtres pour éviter le bruit d'une indexation en texte intégral et la lourdeur d'une indexation manuelle. A chaque fiche sont attribués un ou plusieurs dictionnaires que nous mettons à jour quand de nouveaux concepts apparaissent. Le ``revenu minimum d'activité'' a, par exemple, été intégré au dictionnaire social », explique Claire Riou, ingénieur documentaliste au Cidefe.

L'affinage des paramètres systèmes demande parfois une période de rodage. « L'outil de Verity fonctionne bien ``out of the box'', mais il faut un très bon niveau technique pour l'exploiter à la hauteur de ses possibilités et de son coût, car c'est un progiciel issu d'un kit de développement. Lors du déploiement, nous avons dû effectuer de nombreux essais pour ajuster tous les paramètres du système », confirme Erik Boucher.

Quelle que soit l'architecture retenue, l'intégration avec l'ergonomie du site (charte graphique, navigation, etc.) ne pose aucun problème. « J'ai envoyé par e-mail à Synomia le formulaire de recherche qui était présent sur notre site et, quelques heures plus tard,l'ensemble était disponible en ligne... Cette mise en place a été d'une rapidité et d'une simplicité déconcertantes », constate Pierre Petitgas.

Tous les utilisateurs de ces logiciels sont unanimes : le déploiement ne prend que quelques minutes, voire quelques heures dans le pire des cas. « Pour l'Agence, l'installation du moteur de recherche a consisté à signer un contrat d'utilisation d'un service déjà instantanément disponible en ligne », ajoute Pierre Petitgas. Même constat à la CFDT. « Synomia nous a fourni un lien que nous avons intégré dans notre page d'accueil et quelques instants plus tard, le moteur fonctionnait », relève Véronique Blanc.

Les ressources  : pas de compétence technique requise

L'ajout quotidien de nouvelles pages HTML ou de nouveaux documents est totalement transparent. « Nous avons créé une macro Word pour générer nos fichiers HTML. Un script les envoie automatiquement en FTP vers le serveur. Entièrement automatisée, l'indexation des documents s'effectue à une fréquence qu'il suffit de paramétrer », illustre David Boulanger, du Cridon Nord-Est. Une fois déployés, les moteurs d'indexation ne demandent plus d'intervention technique. Ils s'administrent au travers d'une interface Web ou éventuellement par une interface client-serveur pour certains moteurs d'indexation locaux. « L'indexation étant automatique, des compétences de documentaliste, ou une certaine connaissance des domaines concernés, sont nécessaires mais uniquement au moment de la création des index et éventuellement pour leur actualisation », confirme Claire Riou, du Cidefe.

L'interface d'administration fournit également des statistiques qui permettent d'améliorer les recherches en les orientant. « Nous surveillons le type de requêtes des utilisateurs et le nombre de résultats qu'ils obtiennent », illustre Erik Boucher, du CNDP. L'analyse des statistiques offre la possibilité alors de mettre en avant certains contenus ou de guider l'utilisateur lors de sa recherche. « Synomia Search permet d'insérer des résultats orientés pour envoyer les visiteurs vers certaines rubriques en priorité », explique Sébastien Leclere, de la FFMoto.

Les écueils  : bien préparer les documents

Le coût des licences des logiciels serveurs peut représenter un frein pour les petites structures. « Même si les performances sont à la hauteur, le coût de licence de Verity reste élevé et nous avons dû former les développeurs et les administrateurs », constate Erik Boucher, du CNDP. Pour mettre en oeuvre et administrer Aurweb, Photo12.com a également dû faire appel aux compétences d'un professionnel du langage SQL.

Mais finalement, c'est surtout la reprise de l'existant qui peut poser des problèmes. « La seule difficulté que nous avons rencontrée n'était pas liée au moteur de recherche mais plutôt à la structure de nos pages HTML. Nous avons donc profité de la mise en oeuvre de Synomia Search pour créer une charte d'écriture des "balises" [keywords, titles, etc., NDLR] et les avons entièrement passées en revue. Cela nous a permis de faire d'une pierre deux coups en améliorant considérablement notre référencement sur les outils de recherche », explique Véronique Blanc.

Les gains  : un meilleur service pour l'internaute

Au final, et quelle que soit l'architecture retenue, « le principal avantage est de pouvoir proposer un service supplémentaire à nos adhérents, accessible en permanence », résume David Boulanger du Cridon Nord-Est. L'équipe du site cfdt.fr apprécie également l'économie de temps procurée par un service en mode FAH. « Nous pouvons ainsi nous concentrer sur d'autres missions, comme la mise en ligne d'informations à partir des requêtes sans résultats des internautes », conclut Véronique Blanc.

En forte progression, cette architecture en mode FAH devrait connaître un succès croissant, car « il est bien plus facile, rapide et moins risqué d'apprécier, de juger et de mettre en place un service hébergé qu'un service équivalent à installer », constate Pierre Petitgas, de l'AESN.

Les principaux moteurs d'indexation pour sites Web

Albert www.albert.com

Sinequa www.sinequa.com

Synomia www.synomia.fr

Auracom www.auracom.fr

Verity verity.fr




pour approfondir :
Le fonctionnement
« Seul un outil client-serveur offrait la rapidité que nous attendions »
« Un moteur opérationnel dès le premier contact commercial »
« Le mode FAH permet un ROI plus rapide »
dans le même dossier : Moteurs de recherche : l’offre hébergée séduit (1 articles)


Tous droits réservés © 1999-2004 Groupe Tests, 01net. voir notice légale

charte de confiance nous écrire plan du site