Classer, trier et taguer pour retrouver : les enjeux documentaires du Web (2.0)

Jusqu’à la période 2003-2004, les créateurs de contenu constituaient une frange assez marginale des utilisateurs du Web. Les utilisateurs étaient avant tout les consommateurs d’une information produite par quelques sources, et éventuellement reprises sur d’autres pages – les fameuses « pages personnelles » en tête. Avec l’avènement des blogs et de l’expression personnelle, la donne a peu à peu changé, pour finalement donner corps à un nouveau Web, un réseau de services au sein duquel l’internaute est autant créateur d’information qu’il en est consommateur.

Web 2.0 : de quoi parle-t-on ?


« Web 2.0 ». Le terme lui-même est à la fois adulé et décrié, porté aux nues puis piétiné. Il annonce un changement dans les habitudes bien établies du mode de consommation de l’information disponible sur Internet, sans pour autant en énoncer les nouvelles règles ou le fonctionnement. Du point de vue des experts techniques, la supercherie va même plus loin, parce que la sphère du Web 2.0 ne met en oeuvre aucune nouvelle technologie et ne fait appel à aucune innovation inconnue jusqu’alors. La nouveauté n’est donc pas d’ordre technologique ; elle réside dans les pratiques associées à l’emploi du Web. Plusieurs éléments permettent de les caractériser :

  • la conception graphique répond à des standards agréables et aisément identifiables.
  • les temps de compréhension et d’attente sont réduits ; la simplicité va de pair avec la fiabilité des outils proposés.
  • l’information, quels que soient sa nature et son support – écrits, photos, vidéos, sons, liens – s’organise autour de l’internaute, de façon à lui en donner un accès plus aisé et convivial.

Le « Web 2.0 », ce sont donc de nouveaux axiomes pour le Web, un nouvel ordre dans les envies, les pratiques et les habitudes des internautes. Il n’est plus question de contenus créés par des organismes de presse, diffusés à coup de grosses campagnes marketing, puis consommés par les utilisateurs du Web, mais bien plus de la promotion d’outils permettant de replacer l’internaute au coeur du processus de production et de gestion de l’information.

Tags contre catégories : quelle est la valeur ajoutée ?

L’utilisation des « tags » ((Un tag est un mot-clé que l’on peut associer à une ressource disponible en ligne en vue de la décrire. On peut, à loisir, associer un ou plusieurs tags à une même ressource.)) a été à la source de bouleversements rapides et phénoménaux dans les habitudes des utilisateurs avancés. Si on se concentre sur la classification de liens Internet ou de « bonnes adresses Web », le changement a été radical. Alors que les utilisateurs partageaient leurs recherches entre les favoris (ou marque-pages) enregistrés sur leur ordinateur, et des annuaires en ligne sur le contenu desquels ils n’avaient aucun contrôle, l’introduction de services de gestion communautaire des marque-pages par tags, tels del.icio.us ou blogmarks.net, a révolutionné le secteur. Les avantages pratiques sont de différentes natures.

Tout d’abord, les utilisateurs bénéficient d’une liberté sémantique dont ils ne disposaient pas avec les annuaires comme DMOZ : ce sont eux qui définissent l’organisation et l’architecture de leurs liens favoris. Ils sont les initiateurs de la classification, et sont libres d’employer leur vocabulaire pour trier leurs informations à leur image. Outre son aspect « égocentrique », ce mode de classification de données par tags fait également intervenir d’autres aspects ludiques qui incitent les utilisateurs à produire des marquages et à qualifier les contenus.

Ensuite, les tags sont adaptés au Web, ou en tout cas ils sont plus adaptés au Web 2.0, héritier des blogs, que ne peut l’être la classification de données par catégories. Depuis ses débuts, l’expansion du Web est constante dans son exponentiation, mais elle s’accompagne depuis peu d’une densification des idées véhiculées. Si, auparavant, un annuaire pouvait se contenter de lister les pages d’accueil de différents sites, cela a beaucoup moins de sens aujourd’hui. L’apparition des blogs à toutes les échelles de la société a inversé ces pratiques. Les blogs sont, par nature et par définition, les reflets des pensées de leurs auteurs, et traitent au sein d’un même espace de sujets divers et variés que l’on ne peut englober dans une catégorie unique. Le marquage par tags permet de contourner ces obstacles et permet d’indiquer l’hétérogénéité des pensées d’un auteur.

Le « tagging », des pratiques sociales pour des usages personnels

L’introduction des nouveaux outils du « Web 2.0 », motivée par la démocratisation de la production de contenus Web, a entrainé une certaine mutation des pratiques et usages jusqu’alors établis. Si l’internaute n’est plus seul dans sa recherche d’information, il est paradoxalement devenu le seul maître de son processus informationnel. Le procédé se résume en une formule : qualifier ensemble, pour choisir seul.

L’utilisation des tags est essentiellement sociale, dans la mesure où toute ressource taguée est visible aux autres utilisateurs effectuant une recherche sur ce tag. Et au delà de la simple consultation, ce sont tous les acteurs d’une plateforme sociale qui sont acteurs du marquage des données : si le créateur d’une ressource peut décider de la taguer, ses lecteurs peuvent faire de même. Ensemble, ils qualifient cette information.

Une fois l’information qualifiée, son emploi peut prendre des formes multiples. Les tags peuvent ainsi, à tour à tour, être employés en tant que mode de navigation et de découverte de nouvelles informations, terrains de partage des savoirs, mémoire thématique, marqueurs de centres d’intérêts communs, etc. En résumé : auparavant, nous cherchions ce que d’autres avaient catégorisé ; désormais, nous parcourons sans plus le perdre ce que nous participons à qualifier.

Et le Web Sémantique, dans tout ça ?

Le marquage de l’information par les tags ne constitue pas, cependant, la solution ultime pour exprimer des concepts en leur ôtant leur ambiguïté sémantique ((On parle d’« ambiguïté sémantique » lorsque plusieurs sens peuvent être associés à un même mot ou à une même expression.)). Il y a, principalement, deux raisons à cela : la synonymie et l’homographie.

Tout d’abord, les tags ne permettent pas d’exprimer fidèlement et de manière formelle une pensée. Si je tague un document avec le mot « roman », il est probable qu’un autre utilisateur, lui, préfèrera le terme « littérature ». Bornés à ce qu’ils sont actuellement, les systèmes de tags n’ont donc un intérêt pour la qualification des données que lorsqu’ils sont utilisés en masse : c’est là le seul moyen de conserver la flexibilité du système tout en gommant ses problèmes de synonymie.

Ensuite apparaissent les barrières de l’homographie, encore moins évidentes à contourner. Lorsque je tague une ressource avec le mot-clé « mousse », il peut s’agir indifféremment d’une mousse au chocolat, d’un apprenti marin ou de l’humus qui recouvre les arbres. Dans ce cas, seule l’association de plusieurs tags permet de lever l’ambiguïté. Bien que les homographies soient généralement assez rares au sein d’une même langue, le problème se pose lorsqu’on souhaite déployer un système de tags recouvrant des groupes de langues différentes. Par exemple, si un utilisateur francophone tague une ressource avec le mot « car », en pensant à un bus, un utilisateur anglophone comprendra que la ressource a été taguée avec le concept d’ « automobile ».

Plusieurs solutions sont à l’étude pour contourner ces problèmes et se rapprocher d’un Web Sémantique. L’expression de faits non ambigus au sujet de ressources données peut se faire par le biais d’ontologies ; depuis 2004, le W3C s’est doté d’un langage XML permettant de décrire des ontologies,OWL((Lire « Le Web Sémantique en entreprise : comment et à quels niveaux ? » pour plus d’informations.)). Ce qui manque, désormais, ce sont les outils adaptés pour peupler ces ontologies. Les wikis sémantiques((Pour résumer, les wikis sémantiques sont des applications Web semblables aux wikis traditionnels, auxquels elles ajoutent une couche sémantique permettant de décrire des objets et des relations. Les wikis sémantiques ont donc pour objectif de produire de l’information structurée au sens du Web Sémantique, et plus uniquement du texte et des liens entre pages, comme sur les wikis traditionnels. Lire à ce sujet le wiki sémantique se cherche, de Charles Népote.)) sont une tentative, mais leur emploi demeure encore souvent trop complexe pour obtenir du succès auprès du grand public. Une fois que ces outils seront en place, l’universalisation des informations disponibles sur le Web pourra à nouveau faire un pas en avant.