enssib - bibliothèque - travaux - Navigation et interfaces

NAVIGATION ET INTERFACES : CARTES CONCEPTUELLES ET AUTRES OUTILS

Sommaire - Chapitre précédent - Suite

3. Navigation et recherche d'information

A côté du but d'apprentissage, il existe un autre objectif à l'activité de navigation : la recherche d'information. Dissocier ces deux aspects est certes bien arbitraire puisqu'ils constituent les deux temps de l'acquisition d'un contenu. Il existe cependant des différences dans les approches et les études réalisées, selon qu'elles privilégient l'un ou l'autre de ces deux aspects.

· les études qui s'intéressent plus particulièrement à la navigation comme moyen d'accès à l'information insèrent cette activité dans un grand volume de documents (même si on trouve encore des systèmes de petite taille, nous en verrons quelques exemples ci-dessous). Ainsi la base de données ERIC comporte des centaines de milliers de références et plus de dix mille descripteurs et lorsque l'information est à chercher sur le World Wide Web, il est difficile d'évaluer la taille du domaine à explorer ?

· une autre différence, conséquence de la première, est l'importance attribuée à la structure en couches et au rôle assigné à chacune d'elles :

- on navigue dans les documents d'apprentissage ; la couche supérieure, lorsqu'elle existe, sert non pas de navigateur mais d'aide à l'orientation ou à la structuration du contenu.

- lorsque l'accent est mis sur la recherche d'information, la navigation s'effectue principalement dans la couche située au dessus des documents ou des références, que cette couche corresponde à un thésaurus, une classification, un réseau sémantique ou encore à autre chose... La navigation de document en document, lorsqu'elle est possible, est un « plus », destiné à enrichir l'interrogation.

On présente ici :

- quelques exemples de bases de taille réduite mais où l'accent est mis sur l'activité des utilisateurs

- des systèmes « grandeur nature » où la couche navigationnelle est soit un thésaurus soit un réseau de concepts. Plusieurs de ces systèmes sont destinés à l'interrogation du World Wide Web.

Quelle que soit leur taille et leur mode de mise en oeuvre, ces systèmes ont comme point commun de proposer un accès à l'information basé sur la navigation et non sur l'élaboration a priori de requêtes.

3.1 Les petits systèmes centrés sur les usagers

McAlese et Duncan (1988) présentent deux thésaurus graphiques à des enfants d'école élémentaire. L'un est un thésaurus papier et comporte de nombreux types de relations définis à partir de propositions des enfants. Le second est informatisé et fait appel aux relations classiques TG, TS, TA6

. Il est présenté sous forme graphique avec deux niveaux possibles de grossissement.

Ce second système est très réduit puisque 29 noeuds sont accessibles ; d'autre part, les auteurs semblent avoir du rôle du thésaurus une conception assez voisine de celle de Novak pour les cartes conceptuelles, sorte d'« aide à penser » à la disposition de l'enseignant7

. Cependant les auteurs insistent sur les aspects `système d'information' de leur outil ; ils soulignent le sous-emploi des thésaurus par les usagers, qui n'y voient qu'une liste de mots clefs, et font l'hypothèse qu'un thésaurus présenté sous forme graphique facilite l'établissement ou la prise en compte de liens entre les concepts. Leur étude, déjà ancienne, est plus une démonstration de la faisabilité d'un tel outil qu'une validation expérimentale. On en retiendra l'attention portée aux liens établis entre les concepts par les utilisateurs et à la restructuration (forte/faible) du domaine effectuée par ceux-ci.

Catténat et Paul (1992)

Ils se placent dans un contexte d'interrogation de bases de données textuelles spécialisées (sur la paysannerie au Moyen-Age) par des usagers non spécialistes du domaine. La base est constituée de deux cents mini-documents ( les paragraphes de textes auxquels on a ajouté leurs références bibliographiques). Les sujets sont des étudiants en sciences de l'information qui ne possèdent encore aucune expérience de l'interrogation.

Les auteurs récusent le thésaurus comme outil d'accès au domaine, pour des novices de la documentation, en raison d'une part de la pauvreté des liens qu'il utilise, d'autre part en raison de la polysémie de ces liens. Ils proposent comme interface de navigation des réseaux sémantiques qui permettent, selon eux, une mise à la disposition des usagers de connaissances sur le domaine interrogé.

Ces réseaux sémantiques sont présentés graphiquement sur un support papier. Les auteurs observent que leur utilisation conduit à corriger certaines erreurs d'interrogation souvent signalées chez les usagers (pas d'emploi de synonymes, termes trop génériques). Ils notent cependant que les relations autres que les relations hiérarchiques sont peu utilisées et que même ces dernières ne sont pas employées aussi complètement qu'elles pourraient l'être. Ces remarques négatives sont à tempérer par l'existence d'un net facteur d'apprentissage : l'utilisation des réseaux ne commence réellement qu'après une première séance de formation de deux heures. Les différences individuelles sont importantes ; certains usagers n'évoluent pas au cours des trois séances que comporte l'expérimentation.

Les auteurs insistent sur le caractère synoptique que doivent présenter les réseaux sémantiques, ce qui pose le problème de leur adaptation à de larges ensembles documentaires. Ils soulignent également la nécessité d'une étude des caractéristique de ce type d'interface :

- nombre de termes du graphe,

- typographie à utiliser,

- nombre de relations présentées,

- tracé des liens (forme et/ou couleur), respect de l'univocité,

- nécessité d'une légende sur chaque graphe.

Les questions sont plus posées en terme de lisibilité qu'en termes de charge cognitive. La question d'une « masse critique » de termes et de relations, pour la construction du sens d'un concept n'est pas abordée.

Malgré leur caractère de modèle réduit, nous avons cité ces deux recherches pour la place qu'elles accordent aux utilisateurs et -surtout dans le cas de la seconde- l'intérêt porté à l'interface.

3.2 Navigation dans un thésaurus

Comme le note J. Savoye (1994), « a small hypertext does not reveal the problems generated by large text collections. » Mais les recherches qui s'attaquent à de telles collections grandeur nature sont essentiellement consacrées au développement de prototypes pour l'interrogation. La validation expérimentale de ces prototypes, l'appropriation qu'en réalisent les usagers, les démarches d'interrogation qu'ils induisent ne sont que très rarement abordées.

On présente, dans cette section, deux recherches qui visent à adjoindre à un thésaurus existant « classique » une interface graphique ; l'objectif de celle-ci est de permettre aux usagers de naviguer dans le thésaurus. Une troisième recherche, de conception différente, fait appel à plusieurs thésaurus.

McMath, Tamaru et Rada (1989)

Le système élaboré par ces auteurs permet l'affichage d'un thésaurus graphique et la construction de requête par `clic' de termes dans celui-ci. Les thésaurus utilisés sont d'abord celui de l'ACM « Computing Review Classification Structure », petit outil de 1termes et 5 niveaux, puis le MeSH, outil beaucoup plus volumineux (plus de 100termes au total et une profondeur beaucoup plus importante).

L'affichage s'effectue dans deux fenêtres (au moins pour le CRCS) : une grande dans laquelle s'affiche au centre le noeud courant, et tout autour ses noeuds-fils et leurs propres noeuds-fils ; une petite fenêtre dans laquelle figure le noeud-père du noeud courant. Quatre générations sont présentées à l'utilisateur mais les noms des descripteurs, pour la dernière génération, ne figurent pas. D'autre part, les noms (pour les autres générations) ne figurent pas toujours en entier et les auteurs signalent qu'ils n'affichent que les principaux noeuds issus du noeud courant. Les problèmes d'affichage, bien qu'ils ne soient pas explicitement mentionnés, semblent donc des problèmes difficiles à régler. Les requêtes sont construites avec les noeuds sélectionnés dans le thésaurus -les auteurs n'indiquent pas comment les termes sont alors reliés. On peut avoir plus d'une requête en cours à la fois.

Une petite expérimentation compare, chez des étudiants, les réactions à ce thésaurus graphique et à une utilisation classique du MeSH (présenté sous forme d'index alphabétique). Ces réactions semblent assez contrastées. Certains étudiants perçoivent le thésaurus comme une aide, aide pour construire des requêtes d'une part, pour comprendre la structure d'un thésaurus d'autre part. Cependant, sept des douze sujets disent préférer le MeSH et sa présentation classique.

Malgré cela, les auteurs élaborent une interface graphique pour le thésaurus MeSH. L'affichage comporte trois niveaux de descripteurs : le terme courant, ses parents, ses termes fils. Cliquer un terme fait apparaître une nouvelle fenêtre dans laquelle le terme cliqué, devenu terme courant, est placé en position centrale. Selon les auteurs, ce type de présentation pour une structure aussi profonde que le thésaurus MeSH provoque la désorientation des utilisateurs. D'autre part, le fait de ne pouvoir accéder directement à un terme est ressenti comme une gène.

On retiendra de cette expérience les points suivants :

- l'accès à un terme, lorsque le thésaurus est important, ne doit pas s'effectuer uniquement par navigation ; un accès direct doit être possible.

- la désorientation des usagers subsiste, même avec un affichage graphique ; un nombre important de niveaux hiérarchiques dans le thésaurus augmente ce risque. Des affichages locaux/globaux doivent être envisagés.

- les problèmes d'affichage (nombre de noeuds, longueur des noms, lisibilité), exprimés ici de façon assez allusive, sont des problèmes lourds.

- prendre en compte un ensemble de relations plus riches que les classiques TG, TS, TA est nécessaire, selon les auteurs, pour que le thésaurus puisse jouer un rôle explicatif sur les connaissances contenues dans un systèmes d'information.

Pollard (1993)

Selon cet auteur, l'hypertexte est particulièrement bien adapté aux thésaurus. Il cherche donc à mettre sous forme d'hypertexte le thésaurus de la base ERIC (10termes et 66relations environ). L'auteur décrit le processus de transformation, le couplage du thésaurus à la base de données documentaire et souligne les différents problèmes rencontrés :

- accès au thésaurus à partir d'un mot (un même mot peut apparaître dans de nombreux descripteurs),

- présence d'un même mot dans plusieurs descripteurs,

- grand nombre de documents correspondant à un même terme d'indexation.

L'auteur détaille ces divers points et, pour chacun, explicite les solutions retenues ; par contre, il ne propose que des affichages en listes (les affichages graphiques sont seulement envisagés). Il fait également observer que l'on sait bien peu de choses sur la manière dont sont effectivement utilisés les thésaurus classiques par les professionnels de la documentation et qu'un thésaurus papier se prête mal à l'expérimentation. C'est donc un outil d'expérimentation auprès des usagers qu'il propose ... et non des résultats d'expérience.

On retiendra de cette recherche un recensement des difficultés que l'on rencontre lorsque l'on veut mettre sous forme d'hypertexte le thésaurus réel d'une véritable base de données bibliographiques, mais aussi des propositions de solution. C'est pour ces deux raisons que nous l'avons fait figurer parmi les travaux analysés, bien qu'elle n'aborde pas véritablement les problèmes de navigation.

Arents et Bogaerts (1993)

Le système proposé par ces auteurs nous semble une transition entre les systèmes de navigation dans un thésaurus et les systèmes de navigation dans des réseaux conceptuels. La base documentaire proposée à l'interrogation est ici un cédérom hypermédia sur la corrosion. Les auteurs utilisent la structure particulière du domaine pour concevoir l'interface : un document renvoie toujours aux trois dimensions suivantes : un type de corrosion, un matériau, un environnement. Chaque dimension est prise en charge par un thésaurus spécifique dont les différents descripteurs sont placés sur trois axes orthogonaux formant ainsi le `cube of contents'. Un mécanisme de zoom permet de faire afficher des sous-espaces plus spécifiques. La navigation s'effectue dans le cube quoique des liens hypertextuels permettent également une navigation dans les documents. Dans une version ultérieure du système8

, les auteurs développent et précisent ce dernier mode de navigation, proposant des boutons à liens regroupés ; lorsque l'on clique sur un tel bouton, trois types de liens s'affichent qui correspondent à trois navigations différentes (plus générique, plus spécifique, autres termes de même niveau hiérarchique).

Ici encore, la validation expérimentale est plus suggérée qu'abordée. Les auteurs signalent cependant que les spécialistes du domaine, qui maîtrisent bien les hiérarchies proposées sur chacune des trois dimensions, apprécient d'avoir accès à l'espace global comme de pouvoir naviguer entre des noeuds reliés.

Disposer de deux niveaux de navigation, l'un dans la couche conceptuelle, l'autre dans les documents eux-mêmes semble donc une facilité intéressante pour les usagers.

3.3 Navigation dans des réseaux conceptuels

C'est plutôt ce type de travaux que l'on voit se développer actuellement, avec comme objectif à plus ou moins court terme la recherche d'information sur le World Wide Web. Dans les systèmes proposés, la navigation s'effectue non plus dans un thésaurus mais dans un réseau de concepts (dont les dénominations sont variables), établi manuellement ou automatiquement à partir des termes des documents. La liaison entre les deux couches, la couche conceptuelle et la couche documentaire, est réalisée non pas par l'indexation mais de façon automatique. Les recherches présentent -malheureusement- un autre point commun : l'absence de validation expérimentale des prototypes élaborés. L'importance accordée à l'interface utilisateur est plus ou moins grande selon les recherches.

Nous présentons d'abord deux recherches qui mettent l'accent, l'une sur l'architecture et les fonctionnalités d'un tel système, l'autre sur une interface graphique. Nous examinons ensuite rapidement trois autres recherches (nous n'avons aucune prétention à l'exhaustivité).

Simoni et Fluhr (1997)

Ces auteurs explicitent très fortement l'architecture en deux couches de leur système et les mécanismes de passage d'une couche à l'autre. L'ensemble est articulé autour du logiciel de recherche d'information (en langage naturel) SPIRIT.

L'élaboration de la couche conceptuelle comporte plusieurs étapes :

a- les termes sont extraits des documents puis structurés pour faire apparaître les relations hiérarchiques qu'ils entretiennent. Cette étape aboutit à la construction d'un arbre hiérarchique.

b- à chaque terme est associé l'ensemble des termes qui co-ocurrent avec lui dans un même paragraphe ; ceux-ci constituent une sorte de définition du terme appelée son `ensemble sémantique'. Les ensembles sémantiques forment les `documents' d'une base associée à la couche conceptuelle. Ils constituent également des points d'entrée dans le graphe de termes (cf. opération suivante), une sorte d'index.

c- les relations entre les termes sont établies algorithmiquement (les auteurs soulignent que ces relations sont globalement des relations d'inclusion sémantique) ; on obtient ainsi un graphe de termes. Celui-ci donne une vue globale du contenu de la couche documentaire et constitue l'interface de la base conceptuelle.

Le système comporte donc deux bases.

- elles sont toutes deux gérées par SPIRIT,

- on peut y accéder directement,

-et naviguer dans chacune,

- chacune permet d'accéder à l'autre.

La navigation comme le passage d'une couche à l'autre nécessitent l'existence de liens ; ceux-ci sont dynamiques, générés par la requête d'un usager (ou plus exactement par le traitement de cette requête), qu'il s'agisse d'une question, du choix d'un terme du graphe ou de la sélection d'un passage d'un document. Plusieurs types de navigation sont possibles, dans le graphe de termes ou dans la base de documents, à l'initiative de l'utilisateur ou à celle du système, par inférences à partir de la question ou par feed-back de pertinence.

Les auteurs explicitent assez longuement les mécanismes de montée et de descente mais n'abordent que très peu la présentation à l'utilisateur du graphe de termes (des cartes avec possibilité de zoom sont envisagées).

Le système est un prototype. Les auteurs ne précisent pas la taille de la base de documents avec laquelle il fonctionne ni le coût, en temps de calcul, des traitements effectués. Ils n'explicitent pas non plus les coûts de maintenance bien qu'une application à la recherche d'information sur le web soit envisagée. Ils soulèvent cependant la question de l'évaluation du système; celle-ci doit se faire au sein du programme TREC9

On retiendra de cette recherche son explicitation de l'architecture du système et des mécanismes de passage d'une couche à l'autre. Le soucis d'évaluation est également à souligner ; mais la fonction choisie est celle de remontée. Analyser la navigation des utilisateurs n'est encore qu'un projet ... et TREC est-il très approprié pour cela ?

Zizi (1995)

L'auteur situe son travail sur les cartes dynamiques interactives au confluent de trois courants : l'« Information Retrieval », la visualisation de l'information et l'interaction personne-ordinateur (HCI). Les cartes qu'il propose sont de deux types : cartes de domaines et cartes de documents. Chaque type possède un double statut, celui d'interface et celui de document. A ceux-ci correspondent diverses fonctionnalités.

Les cartes de domaines : elles sont une représentation graphique du thésaurus d'un domaine, thésaurus obtenu, comme chez Simoni et Fluhr, par traitement automatique d'une collection de documents. Les étapes en sont également l'extraction de termes (et, ici, d'expressions de 2 mots) puis le filtrage, le calcul d'un indice de similitude entre les paires de descripteurs et la clustérisation qui aboutit à la définition des classes du thésaurus. Chacune de ces classes comporte un ensemble de descripteurs. L'auteur ne donne pas d'indication sur la profondeur du thésaurus. Il souligne que sa construction est coûteuse en temps de calcul et qu'il faut trouver un optimum entre le nombre de classes et le `grain' de celles-ci (le grain est la similitude moyenne entre les éléments d'une classe). Les cartes sont construites automatiquement à partir des classes. Elles sont formées de régions qui correspondent chacune à une classe. La taille d'une région reflète son importance dans la collection (elle est fonction du nombre de documents indexés par les descripteurs de cette classe). Les régions sont, autant que possible, de forme carrée. Les descripteurs d'une classe sont les villes de la région correspondante. Le plus important (celui qui indexe le plus grand nombre de documents) est placé au centre ; les autres se distribuent du centre vers la périphérie selon leur importance. Les liens entre les descripteurs peuvent être affichés (la nature de ces liens n'est pas précisée). L'auteur fait observer que le coût de calcul des cartes est faible par rapport à celui de l'élaboration du thésaurus.

Les cartes de documents : elles représentent un ensemble de documents obtenus à partir d'une requête ou rassemblés manuellement. Les villes, sur ces cartes, ne sont plus des descripteurs mais des documents. Les routes entre les villes représentent les relations entre les documents (elles sont calculées en utilisant les mesures de similitude ou bien créées par l'utilisateur). Deux villes sont d'autant plus proches sur la carte que les documents qu'elles représentent sont plus semblables (l'algorithme qui met en eouvre cette règle est assez complexe). La taille de l'icône correspondant à un document varie selon la pertinence de celui-ci, pour une requête donnée, ou selon l'importance que lui attribue l'utilisateur.

Affichage et lisibilité : tout afficher conduit à l'illisible. Plusieurs mécnismes sont mis en jeu pour permettre la lisibilité des cartes :

- des seuils sont fixés (par l'utilisteur) pour limiter le nombre de descripteurs ou de documents affichés ; il en est de même pour les liens.

- dans les cartes de documents, on peut n'afficher que les liens autour du centre d'intérêt (focus) de l'utilisateur.

- des transformations géométriques sont possibles :

· changement d'échelle,

· vues panoramiques (fisheye view),

· zoom

Ces transformations, pour être efficaces, doivent être associées à des changements d'échelles sémantiques ; ce point est explicité dans le paragraphe suivant.

La navigation : L'auteur distingue deux types de navigation, le butinage (browsing) et l'élaboration de requêtes.

Le butinage : il s'effectue à divers niveaux, ce qui demande des changements d'échelle dans l'affichage des cartes. Pour l'auteur, ces changements ne sont intéressants que s'il s'y ajoute un changement d'échelle au niveau sémantique. Par exemple, dans une carte de documents, on affichera non plus seulement une icône et un nom, mais aussi le nom de l'auteur et une date puis, à une échelle encore plus petite, on fera figurer aussi les premières lignes du document. M.fait remarquer que la vue panoramique (fisheye view) sémantique est un type d'affichage particulièrement utile pour l'usager, en particulier lorsque les documents sont faiblement structurés comme c'est le cas ici. L'auteur pointe également les caractères complémentaires du zoom et de la vue panoramique sémantiques.

L'élaboration de requêtes : on sélectionne items et liens directement depuis les cartes -cartes de domaines ou cartes de documents ; une requête booléenne est alors élaborée, avec un opérateur OU si aucun lien n'est sélectionné, et avec un opérateur ET lorsqu'un lien est cliqué entre deux items choisis. Les cartes de domaines sont bien adaptées à l'expansion des requêtes ; deux stratégies d'expansion sont possibles : pour chaque descripteur de la requête, la sélection de tous les descripteurs qui appartiennent à sa classe ; ou bien pour chaque descripteur de la requête, la sélection de tous les descripteurs qui lui sont reliés.

On a décrit ici les fonctionnalités des cartes liées à leur statut d'interfaces. Mais les cartes sont aussi des documents. A ce second statut sont associées d'autres fonctionnalités qui permettent la personnalisation des cartes.

Personnalisation : les cartes peuvent être modifiées, annotées et sauvegardées. Ces diverses fonctionnalités donnent à un utilisateur la possibilité d'inscrire ses propres marques de repérage : il peut, par exemple, marquer un chemin, ajouter des post'it, marquer des items. Les cartes peuvent également être partagées. L'auteur s'étend peu sur cette fonctionnalité qui semble pourtant très intéressante d'un point de vue pédagogique ; en effet elle ouvre la voie au travail collaboratif et au tutorat. Ces fonctionnalités sont également proposées par GAINES et SHAW (1995, cf. 2-2-2); elles nous paraissent aussi prises en compte avec NESTOR de R. ZEILIGER, outil qui se greffe sur un navigateur, comme Netscape ou Explorer, et propose une carte interactive et une zone d'annnotation. Ces éléments peuvent être privés ou partageables ; ils permettent ainsi soit l'exploration guidée d'un domaine, soit la structuration de celui-ci par un ou plusieurs apprenants.

Evaluation :

Des indications sont données sur le nombre de documents et leur provenance (12041 documents du HCI Bibliography Project ; la taille moyenne de ceux-ci n'est pas précisée), sur le nombre de descripteurs extraits et sa réduction nécessaire et sur la qualité des classes obtenues par clusterisation. Par contre, l'interaction avec les utilisateurs est très rapidement évoquée et il faut se contenter d'affirmations sur l'aide aux utilisateurs apportée par les cartes.

Cette recherche nous semble particulièrement intéressante parce qu'elle aborde la question de la construction des cartes et qu'elle propose une solution de construction automatique, dynamique. Elle est intéressante également parce qu'elle n'élude pas les problèmes de lisibilité de ces cartes mais tente de les résoudre. Enfin, les possibilités de personnalisation et de partage des cartes ouvrent des perspectives pédagogiques à exploiter. On regrettera cependant que les préoccupations d'ergonomie cognitive et même de recherche d'information en paraissent absentes10.

Nous présentons maintenant succintement trois recherches qui relèvent de démarches comparables. Selon les cas, il s'agit de prototypes ou de systèmes « grandeur nature », faisant appel à des outils déjà existants ou élaborant des outils spécifiques, systèmes off line ou utilisant internet.

Wiesner et al. (1995)

Ces auteurs proposent d'ajouter à un système de gestion électronique de documents une navigation basée sur les connaissances. Le système de GED, déjà utilisé par plusieurs milliers de personnes, a pour but de faciliter aux universitaires l'archivage, la diffusion, la recherche et le prêt de la littérature grise et de divers documents électroniques.

Dans ce système, un document est constitué

- des champs bibliographiques classiques,

- de son texte intégral (obtenu par reconnaissance optique de caractères),

- de son image (bitmap) qui lui restitue sa forme initiale.

Mais l'une des critiques faites au système est l'absence de liens entre les documents. Pour y remédier, les auteurs proposent une architecture à trois couches :

- la couche des documents, en texte intégral, multimédia et multimodale, qui peut être interrogée directement. Cette couche est en constante évolution.

- la couche attributs des documents qui contient des métaconnaissances exprimées du point de vue de l'auteur (mots clefs, niveau de difficulté, type de média, par exemple) des champs spécifiques prennent en compte ce niveau. Cette couche varie au même rythme que la précédente.

- la couche sémantique : elle est formée de réseaux sémantiques. Indépendante des documents, et donc relativement stable, elle est élaborée par un groupe d'experts qui en assurent aussi la maintenance. D'après les auteurs, sa taille assez réduite d'une part, sa structuration par des experts d'autre part, font que le phénomène de désorientation ne s'y produit pas. La couche sémantique constitue un hypermédia formé de noeuds et de liens étiquetés (et éventuellement pondérés) ; noeuds et liens contiennent des attributs et du texte. Chaque noeud contient également un `query pattern' qui déclanche une requête. La couche sémantique est présentée à travers une interface graphique dans laquelle l'utilisateur peut naviguer ; elle est située sur un serveur de connaissances spécifique d'un domaine.

L'accès à la couche sémantique peut se faire à partir d'un document de la base. Celui-ci est apparié au réseau sémantique (le `query pattern' associé à chaque noeud est exécuté contre ce document. Certains noeuds sont ainsi sélectionnés et proposés avec leurs liens. Les `query patterns' fournissent donc le mécanisme de montée de la couche documentaire vers la couche sémantique comme celui de descente depuis cette couche vers la couche documentaire.

Les auteurs insistent beaucoup sur la facilité de mise à jour de leur système. Par contre, ni la conception de la couche sémantique, ni son utililation par des usagers ne sont abordées. De même, l'élaboration des `query patterns' n'est pas explicitée.

On retiendra de cette recherche la réflexion sur le rythme d'évolution de chacune des couches qui composent le système et un souci de la faisabilité et de la robustesse de l'ensemble, plus marqué que pour l'élaboration de prototypes.

Agosti, Crestani et Melucci (1996)

Le modèle proposé par ces auteurs (TACHIR) comporte également trois couches. Au dessus de la couche des documents, se trouve une couche formée des termes d'indexation de ces documents puis une couche conceptuelle. L'extraction des termes d'indexation, la construction de liens entre ces termes, celle de liens entre les documents reposent sur des méthodes statistiques. Les liens entre les termes d'indexation et les concepts de la couche supérieure sont établis également de façon automatique. La construction de la couche conceptuelle, par contre, est manuelle, qu'il s'agisse d'une structure spécifique, d'une classification ou d'un thésaurus prééxistants. Dans l'exemple qu'ils donnent, les auteurs utilisent une classification existante (celle de l'ACM) et l'hypertxtualisent. Ni l'interface utilisateur ni les problèmes d'accès ne sont évoqués.

Nauer et Lamirel (1997)

L'objectif des auteurs est de rendre plus efficace l'interrogation d'internet, du web en particulier. Ils proposent pour cela des graphes de navigation, interface entre l'usager et un un moteur de recherche. Les graphes sont construits automatiquement à partir des notices récupérées par l'interrogation (classique) de MEDLINE.

Les mots clefs issus des références sélectionnées sont clustérisés pour faire apparaître des thèmes. Une sélection des cooccurrences de termes selon leurs fréquences permet d'établir des thèmes généraux et des thèmes spécifiques. Pour les auteurs, les premiers sont destinés aux usagers novices du domaine et les seconds aux spécialistes.

L'interface proposée aux utilisateurs ne semble pas graphique : une liste de thèmes est proposée (thèmes généraux ou spécifiques) parmi lesquels l'usager fait son choix. Ce choix donne accès à une sous-liste. L'utilisateur peut alors soit explorer le fonds des notices qui ont permis de caractériser ce thème, soit faire appel à un moteur de recherche pour explorer le web.Le thème choisi est alors transformé (par le système) en une requête. Les documents récupérés sont enrichis dynamiquement de liens hypertextes inverses vers les thèmes représentés par les noeuds du graphes. Ceci permet à l'utilisateur d'effectuer des rattachements thématiques précis. L'étude de la conduite des usagers n'est qu'envisagée.

On retiendra de cette recherche l'utilisation d'une base de données bibliographiques classique comme un outil d'aide à la structuration d'un domaine d'une part, à l'interrogation du web d'autre part. On retiendra également la distinction entre thèmes généraux et pointus mais on aimerait connaitre les réactions des usagers à cette catégorisation.

3.4 Navigation dans des classifications

Classifications et thésaurus ne sont pas des modes d'organisation opposés et l'on peut considérer qu'à un thésaurus monohiérarchique correspond une classification. On sait cependant peu de choses sur la façon dont les non-professionnels de l'information abordent les classifications. Même lorsqu'elle s'appuie sur une classification, la cote ne semble pas utilisée comme un mode de recherche par thème, dans les OPACs11

et les usagers paraissent ne lui accorder qu'une fonction topographique. Certains auteurs ont cherché à rendre claire à l'usager l'organisation hiérarchique des connaissances qui soutend une classification décimale pour faire de celle-ci un outil de navigation.

Borgman, Hirsh, Walter et Callagher (1995) : ces auteurs élaborent, pour des enfants d'école élémentaire, des systèmes de recherche basés sur la métaphore de la bibliothèque : puisque les bibliothèques sont organisées selon une classification (la Dewey Decimal Classification), se déplacer d'un rayon à l'autre, c'est naviguer dans la classification. Les auteurs proposent donc une représentation, à l'écran, de la bibliothèque. L'enfant s'y déplace (avec la souris), clique sur le rayon qu'il veut explorer. Le rayon s'affiche alors avec ses étagères qui correspondent aux sous-catégories de la catégorie choisie. En cliquant sur telle étagère, la sous-catégorie se détaille en ses composants de plus bas niveau, jusqu'à ce que l'on parvienne aux livres qui relèvent d'un thème donné. Lorsque l'enfant a choisi un livre, un plan de la bibliothèque, avec l'emplacement du livre, s'affiche à l'écran. Selon la taille des bibliothèques où l'expérimentation est menée, quatre ou six niveaux hiérarchiques sont utilisés12

L'étude comporte une évaluation de l'utilisation du système, dans ses différentes versions, par les enfants. Des comparaisons sont faites avec des OPACs classiques, utilisés par les mêmes sujets pour les mêmes thèmes de recherche. Les résultats quantitatifs se montrent décevants et n'indiquent que très peu de différences entre les systèmes à navigation et les systèmes à requête : tous deux sont bien acceptés par les enfants, les taux de réussite sont les mêmes, les OPACs permettent des recherches un peu plus rapides, les systèmes à navigation conduisent à un peu moins d'abandons.

Mais les auteurs font remarquer la difficulté qu'il y a à appréhender une activité de navigation et, plus encore, à la comparer à une recherche classique. Même si les critères de comparaison choisis sont plus larges que la précision et le rappel, les tâches données aux sujets, avec leur exigence de réalisation possible sur les deux systèmes, rendent difficile une approche de l'activité de navigation, de son apport pour les enfants. Plus que les résultats quantitatifs, ce sont ainsi les remarques qualitatives des auteurs qui nous paraissent les plus intéressantes :

- la capacité des enfants à utiliser la hiérarchie;

- la perturbation qu'induit l'ajout de fonctionnalités de navigation non hiérarchiques (regarder l'étagère ou le secteur voisin) ; un phénomène de desorientation apparaît alors;

- les différences de difficultés des enfants selon les domaines choisis (sciences/technologie) et qui mettent en cause et la connaissance possédée sur le domaine, et la classification (mieux adaptée aux premières qu'à la seconde).

On retiendra de cette recherche le recours à la métaphore de la bibliothèque, la capacité des enfant à utiliser une organisation purement hiérarchique, et la nécessité de mettre au point des outils d'évaluation (avec des situations, des tâches pertinentes) de la recherche par navigation.

Cochrane et Johnson (1996) veulent également permettre la navigation dans les fonds généralistes de bibliothèques au moyen de la Dewey Decimal Classification. Ces auteurs présentent les difficultés techniques qu'ils ont rencontrées pour rendre lisible et navigable la classification, avec son organisation hiérarchique forte mais aussi ses renvois. Ils présentent également les solutions apportées mais n'évaluent pas l'utilisation de leur système par des usagers. On remarquera que la navigation proposée ne s'effectue pas à travers des représentations graphiques mais au moyen de menus.

3.5 En conclusion :

Nous n'avons présenté que quelques unes des recherches consacrées à la navigation pour la recherche d'information. Loin d'être exhaustive, cette présentation devrait, de plus, pour être plus représentative, prendre en compte les travaux qui considèrent la recherche d'information comme un travail collaboratif. Elle devrait également mentionner ceux qui cherchent à enrichir les interrogations par des navigations automatiques dans un thésaurus (JONES, GATFORD, ROBERTSON, HANCOCK-BEAULIEU, et SEKER, 1995 ; CHEN, LYNCH, BASU, DORBIN NG, 1993 ; BOYLE, 1990 ).

Nous avons pu remarquer, à travers les trois séries de travaux présentés, l'importance de la structuration en deux couches : couche conceptuelle et couche des documents. Notre focalisation sur la navigation dans la couche conceptuelle ne doit pas faire oublier qu'il existe un second niveau de navigation, celle qui s'effectue entre les documents. Notre intérêt initial pour les cartes conceptuelles ne doit pas non plus masquer la diversité croissante des interfaces envisagées : on semble s'écarter de l'« obligation » de l'interface graphique de type carte ou réseau sémantique.

A l'exception des travaux de BORGMAN, les recherches portent systématiquement sur le versant technique (le côté outil) de la démarche d'information et les problèmes cognitifs sont peu abordés. Les questions qu'elles soulèvent sont cependant nombreuses. Nous les reprenons dans la conclusion générale.