|
Association DocForum
Organisateurs
et partenaires
les autres journées
07 juin 2001
20 septembre 2001
31 janvier 2002
28 mars 2002
28 mai 2002
les rendez-vous
25 septembre 2001
19 décembre 2001
Archives
nous contacter
retour accueil
|
|
Le web a connu ses dernières années un développement
extraordinaire aussi bien dans le grand public qu'en milieu professionnel.
Cependant la facilité de publication sur le web a son revers : il
est difficile de retrouver l'information pertinente vite et bien.
En effet le web est un espace vivant : de nouveaux documents sont
ajoutés régulièrement, d'autres, anciens, sont modifiés ou détruits.
L'organisation initiale en est souvent perturbée et la navigation
dans la structure du site devient vite peu efficace quand le nombre
de pages est trop important.
Ajouter un moteur de recherche interne apparaît ainsi comme la solution
miracle pour faciliter la recherche d'information, suppléer à la
gestion déficiente des liens internes et donner un aspect plus professionnel
au site.
Il existe de nombreuses solutions peu onéreuses et faciles à mettre
en œuvre mais pas toujours utilisées à bon escient par les utilisateurs.
Aussi avant de choisir hâtivement telle ou telle solution, il est
bon de réfléchir aux objectifs que l'on se donne, aux publics auxquels
on s'adresse et aussi pourquoi pas au design.
Cette journée a été conçue par : Jean-Pierre
Lardy, maître de conférence à l'Université de Lyon, Co-directeur
de l'URFIST de Lyon et membre de l'équipe de recherche RECODOC
programme (sous
réserve de confirmation)
Matinée
Problèmatiques et solutions
Nous présenterons le sujet en nous posant de nombreuses
questions :
Pourquoi indexer son site ? est-ce la meilleure solution ? Quelle
est la nature du corpus de documents à indexer ? Faut-il tout indexer
ou seulement une partie du site ? Tous les formats des documents
seront-ils reconnus ? (cas des pages html dynamiques) Avec quelle
périodicité mettre à jour l'indexation ? Comment présenter le(s)
formulaire(s) de recherche en fonction des visiteurs ? Comment présenter
les résultats ?
Il faudra aussi analyser les usages de ce moteur une fois installé.
Il existe de nombreuses solutions qui répondent plus au moins bien
à toutes ces questions :
· L'indexation en ligne soit par les
moteurs généralistes, soit par des moteurs spécialisés,
· L'indexation locale : les produits
sont très nombreux, des outils basiques aux solutions mettant en
œuvre des techniques d'analyse statistique ou linguistique.
Présentation du moteur SPINOO
et de la technologie Verity
Erik Boucher - CNDP
Le Ministère de l'Education Nationale a
voulu faciliter la recherche de documents pédagogiques
et d'informations administratives sur les différents sites
éducatifs institutionnels (MEN, CNDP, académies, CRDP, etc...).
C'est la solution Verity qui a été choisie pour ses nombreuses fonctionnalités.
Perspectives : les sites universitaires français.
Après-midi
AurWeb de la société AURACOM
Michel Martinez
Petite société française, Auracom se positionne
exclusivement sur le segment des moteurs de recherche d'intranets
ou de sites Web. Aurweb traite les données
structurées et le texte intégral. Nombreuses réalisations à tester.
Noematics et Diatopie
Daniel Verney - Sylvain Aubin
Le moteur NOEMATICS
est un logiciel de recherche d'informations :
· sur tout corpus textuel numérisé (texte pur, HTML, Word, SGML),
· présent sur un serveur ou sur diverses machines en réseau (Intranet,
Internet ou classique).
Il offre des capacités de recherche avancée (formes grammaticales,
exclusion de termes, recherche de phrases, proximité entre mots,
opérations booléennes), et traite la langue française et anglaise
de manière complète et fine grâce à une base linguistique étendue.
NeuroNav est un module de cartographie
sémantique de corpus textuels basé sur l'extraction de clusters
de mots.
Pro Index de la société Sinequa
Luc Manigot
Après Sinequa Free Index,
moteur de recherche gratuit pour les sites perso, la société (ex
Coral) présentera Intuition avec la version
Pro Index. Intuition, fruit d'une longue
recherche, utilise une technologie qui permet d'interroger, de classifier
et de comparer des documents automatiquement et quelle que soit
leur langue. Cette technologie s'appuie sur le traitement automatique
du langage naturel et sur une analyse sémantique pointue.
Discussion
La journée se terminera par une discussion.
S'inscrire : Word
| Pdf
|
|