Journal du Net   Développeurs   Emploi   Management
 
 Linternaute   Journal des femmes   Copainsdavant 
 
 Séminaires   Evenements   Etudes 
Abonnements
 
RECHERCHER
 ANNUAIRES  Sociétés  Prestataires Carnet  Encyclopédie Progiciels Formations Fonds VOTRE HIGH TECH  Guides  Livres Prix Téléchargement 
 MAGAZINE
Intranet-Extranet
DSI
Systèmes-Réseaux
Sécurité
Développement
Emploi, RH
CRM-Marketing
e-PME
 ACTUALITES
Acteurs
Télécoms-FAI
Mobile
Actu High Tech
Actu économique
Bref France
Bref International
CAC 40
-0.20%
CAC IT20
-0.45%
Nasdaq
-0.28%
Dow Jones
-0.44%
JDN Finance 
 TOUS NOS ARTICLES
Dossiers
Enquêtes
Interviews
Reportages
Cas d'entreprise
Analyses
Décryptages
Octobre 2005
Septembre
Août
Et avant
 RUBRIQUES

Nominations

A lire ailleurs
Revue des failles

Ils ont choisi

Versions

Nouveaux produits
Indicateurs
Agenda
Livres Blancs
 MANAGEMENT
Gestion RH
Création entreprise
Emploi cadre
Fiches pratiques
 ANNUAIRES
Sociétés
Prestataires
Logiciels pro
Carnet
Encyclopédie
Formations
Hotspots Wi-Fi
Haut débit
Fonds
Agences médias
Lobbies
Copains d'avant
Cartes de voeux
Journal des Femmes
Actualités
Fonds d'écran
Galerie photos
Vos livres
Internet Pratique
Photo numérique
Recettes de cuisine
Tous les dossiers
 VOTRE HIGH-TECH
Eligibilité
Test connexion
Guides d'achat
Comparateur Prix
Télécharger
Livres
 CONTACTS
Newsletters
Contacts
Publicité
SUR L'INTERNAUTE
Week-End
Restaurants
Ciné : box office
Concours
Insolite
Voyage
Mon PC
Automobile
Prénoms
Horoscope
Histoire
Comparer les prix

Webcam

Test QI
Télévision
Pages blanches
Pages jaunes
 
 GUIDE PRATIQUE 
Comprendre les moteurs de recherche
Questions-clés, définitions, liens utiles, acteurs : l'essentiel de ce qu'il faut savoir en un coup d'oeil.   (09/11/2005)
Définitions

 Moteur de recherche

 Booléen

 Gestion des connaissances

 Base de données
 

A consulter

Analyse
16 solutions de moteurs de recherche d'entreprise

Moteurs de recherche: quelques critères de choix

Dossier Numériser, gérer et publier ses contenus

 

Aller plus loin

Guide Comprendre la gestion de contenu

 
 
:: 5 questions-clés ::
 
Quels sont les grands domaines d'application des moteurs de recherche d'entreprise ?
Les solutions de moteur de recherche d'entreprise sont exploitées principalement dans deux cadres. En premier lieu, elles sont utilisées au sein des sites Web pour faciliter l'accès au contenu et la navigation. Cette approche est particulièrement pertinente pour les environnements de presse en ligne présentant des archives importantes, ou encore pour les espaces e-commerce afin de déployer des formulaires multicritères d'aide au choix et à la sélection de produits.

En second lieu, les outils de recherche sont typiquement mis en oeuvre au sein d'intranets ou de portails d'entreprise en vue de bénéficier de systèmes d'indexation permettant à un utilisateur interne de retrouver plus facilement un document publié quel que soit le format (Web, Word, PDF, Powerpoint, etc.).

Comment fonctionne un moteur de recherche ?
Un moteur de recherche s'articule autour d'un système d'indexation. Un dispositif logiciel qui a pour but de parcourir la ou les bases de documents ou de contenu ciblées afin d'en référencer les différents éléments, que ce soit les textes ou les meta-données associées. En sortie, il génère un ou plusieurs fichiers identifiant l'ensemble des mots repérés ainsi que leur position.

Permettant de faire le lien entre la requête de l'utilisateur et les sources disponibles (termes et expressions), ce processus de cartographie propre à l'informatique a été élaboré par les éditeurs, notamment ceux qui font la promotion de l'indexation dite "plein texte" (tel que Verity par exemple). Aujourd'hui, cette technique s'est généralisée sur le marché.

Certains acteurs s'appuyent également sur des méthodes issues de démarches plus traditionnelles, comme la tradition documentaliste qui promeut une indexation par mots clés - éventuellement basée sur des thésaurus (organisations de termes en familles et sous-familles) -, ou encore sur celles développées au sein des bibliothèques, comme les plans de classement (ou taxonomies).

Où se situe l'intelligence d'un moteur de recherche ?
L'ensemble des moteurs de recherche s'appuit sur des algorithmes statistiques. A partir d'une analyse des termes inclus dans une requête utilisateur, ils s'appliquent à l'index, en vue de trier les réponses possibles par ordre de pertinence. Certains moteurs intègrent jusqu'à 30 algorithmes. Ils se classent en deux groupes. Les premières comparent la répétition et l'espacement des termes contenus dans la requête avec ceux répertoriés par l'index, puis appliquent un taux de pertinence aux réponses correspondantes. Les seconds vont effectuer le classement en partant du principe que plus un objet textuel est rare, plus sa valeur informative est élevée.

Au-delà du traitement statistique, certains moteurs - dits sémantiques - intègrent également une batterie d'analyseurs et de dictionnaires permettant de prendre en compte des synonymes et autres termes et expressions connexes à la requête posée. La combinaison de différents analyseurs linguistiques (sémantiques, syntaxiques, etc.) permet d'aller assez loin. Selon certains experts, le processus pourrait permettre au final de faire comprendre au moteur que l'expression "président de la république" est plus proche de celle de "chef de l'état" que de celle de "chef du gouvernement" ou encore de saisir la différence entre la requête "la souris de mon PC" et le concept (extrait d'un texte) "le cerveau des souris peut être modélisé par un PC"

Quels sont les différents types de requête possibles ?
On distingue deux catégories de requête :
- Les requêtes booléennes
Adaptées à la recherche sur des mots-clés, elles s'appuient sur le langage élaboré par le mathématicien anglais Georges Bool. Un dialecte qui est aujourd'hui intégré à la plupart des solutions de recherche associées à des bases de données. Une requête 'booléenne' permet d'inclure des mots clés ou expressions en les combinant avec des conditions (sous forme d'opérateurs). Ainsi, une solution supportant cette technique peut accueillir la question suivante : "prestataires de service" AND "informatique d'entreprise". Pour répondre, le moteur recherche l'ensemble des documents incluant les deux groupes de mots. Beaucoup d'autres opérateurs existent, parmi lesquels "or", "near" et "not".

- La requêtes plein texte ou en texte intégral
Une recherche en texte intégral identifie et classe les réponses possibles par ordre de pertinence, en faisant appel éventuellement à des techniques issues de la linguistique, à la manière du processus décrit plus haut dans la 3e question. Comme la recherche booléenne, elle permet d'inclure des opérateurs.

Quelle approche adopter quand on souhaite déployer un moteur ?
Certaines sociétés préfèrent opter pour un moteur purement statistique. Cette logique permet de réduire le travail de maintenance nécessaire à l'exploitation du moteur. La solution, une fois paramétrée, peut fonctionner sans intervention. Elle peut présenter néanmoins certaines limitations en termes de pertinence, les réponses remontées pouvant être également très nombreuses selon la technologie utilisée.

Une autre politique consiste à déployer des indexes, thésaurus ou plans de classement. Une approche qui permet à l'entreprise de s'assurer de la pertinence de son moteur (sans faire simplement confiance à une boîte noire) tout en l'adaptant à ses problématiques métiers, en termes de domaines de spécialisation (par le biais d'un travail documentaire particulier). Ce procédé, souvent jugé peu souple en cas de modifications, implique aussi la présence d'un personnel compétent dans le domaine de la documentation.

 
:: Les acteurs en France ::
 
Editeurs de solutions de recherche
Acetic
Alogic
Antidot
Arisem
Atomz
Auracom
Autonomy (Verity)
Convera

Exalead
Fast
Go Albert
Hummingbird
Sinequa
Synomia
TripleHop

 
Antoine CROCHET-DAMAIS, JDN Solutions
 
Accueil | Haut de page
 
 

  Nouvelles offres d'emploi   sur Emploi Center
JupiterResearch | NC | CAR TELEMATICS sas | L'INFORMATIQUE COMMUNICANTE | Claude Jeanne Sélection

Solutions Voir un exemple
Journal du Net Voir un exemple
Emploi Voir un exemple
Développeurs Voir un exemple
Evénements et
Etudes Benchmark
Voir un exemple
Toutes nos newsletters
 
Qui sommes-nous ? Société | Contacts | Publicité | PA Emploi | Presse | Recrutement | Tous nos sites | Données personnelles
© Benchmark Group, 4 rue Diderot. 92156 Suresnes Cedex