Retour | Page d'accueil |
4.1.1 - Normes de catalogage : ISBD, AFNOR, AACR2
Les normes de catalogage préexistent évidemment à l'informatique. Rappelons que les normes internationales (notamment les ISBD) transcendent les normes nationales qui les interprètent et les complètent (ou compliquent) : les normes AFNOR de la série Z44 pour la France, et les AACR2 (Anglo-american cataloguing rules) pour le monde anglo-saxon.
4.1.2 - Formats MARC
Les formats MARC (MAchine Readable Cataloguing), inventés aux États-Unis à la fin des années 60, se sont comme on le sait malheureusement fragmentées en MARC nationaux ou internationaux. Comme utilisateurs d'un logiciel canadien propriété d'une société américaine, nous vivons la difficulté d'expliquer qu'en France nous utilisons des variantes nationales d'un format universel, UNIMARC, tandis que de l'autre côté de l'Atlantique sont utilisés USMARC et CANMARC.
Mais il faut souligner qu'il existe des formats MARC :
La norme américaine ANSI Z39.50 (devenue norme internationale ISO 239.50) représente un pas de plus dans la normalisation, puisqu'elle porte sur la recherche documentaire elle-même. Cette norme permet de construire :
Z39.50 est défini et géré par le ZIG (Z39.50 Implementors Group) où sont représentés tant des bibliothèques que des fournisseurs de logiciels. Nous en sommes à la version 3 de la norme.
La norme Z39.50 comprend une grande partie de protocole, relativement illisible par un bibliothécaire, mais aussi une partie que nous pouvons facilement comprendre : elle attribue une valeur (représentée par un nombre) à des concepts qui nous sont familiers : Auteur (en, général), auteur personne physique, collectivité auteur, titre (en général), titre propre, titre clé..., sujet, mais aussi "any" (n'importe quoi) pour chercher un mot n'importe où dans une notice, ou bien dans une base texte non structurée.
L'avantage de la norme Z39.50 est de permettre une interrogation simultanée sur plusieurs bases, locales ou distantes (via Internet), sans tenir compte du logiciel de gestion de cette base. Mais il faut au préalable qu'un serveur Z39.50 ait été implémenté en aval de chaque base.
Dans le schéma ci-dessus, on a représenté les serveurs Z39.50 liés à trois bases hétérogènes. Ils sont tous différents puisque chacun reçoit les questions de n'importe quel client Z39.50, les traduit en langage compréhensible par la base, reçoit la réponse de celle-ci, la traduit e langage Z39.50 et l'envoie au client.
Le client, au contraire, doit être capable de dialoguer avec n'importe quel serveur Z39.50 : c'est un produit standard. Bien sûr, il a fallu le configurer pour lui indiquer les coordonnées de chacune des bases qu'on souhaite interroger, ainsi que les questions qu'on peut lui poser (on ne peut pas demander un auteur à une base non structurée, ou un sujet à une base qui n'en gère pas).
Il existe des clients Z39.50 implantables sur un micro-ordinateur. L'utilisateur a alors le libre choix des bases à interroger pourvu qu'il en connaisse les coordonnées. Il s'agit de clients très spécialisés, et relativement lourds.
Le schéma ci-dessus représente la solution évoquée plus haut : celle de la passerelle Web. Dans ce cas, le catalogue est interrogeable directement par notre "navigateur à tout faire". Mais on ne peut interroger qu'une base à la fois.
Un certain nombre de fournisseurs de logiciels de bibliothèque ont développé, développent ou vont développer une passerelle Web pour permettre l'accès par Internet/Intranet.
Ce troisième cas de figure est la combinaison des deux précédents. En rajoutant une couche Web en aval du dispositif Z39.50, on permet l'interrogation simultanée de bases hétérogènes à partir du navigateur, client universel : Le navigateur envoie la question, l'ensemble solidaire "client Z39.50-Serveur Web" la traduit en Z39.50 pour l'envoyer aux serveurs, reçoit la réponse Z39.50 et la reformate en HTML, le langage Web.
C'est une illustration de deux phénomènes que nous avons évoqués plus haut :
Mais dans ce schéma l'utilisateur final ne dispose guère de marge de manoeuvre. Il se connecte à un site serveur, sur lequel a été effectué un choix de bases à interroger. Il est donc prisonnier de ce choix et ne peut sélectionner que tout ou partie du bouquet ainsi proposé:
Qui détient le client Z39.50 détient le pouvoir de choisir les bases à interroger.
Un certain nombre de fournisseurs de logiciels de bibliothèque proposent diverses variantes de l'empilement logique représenté ci-dessus. Il existe également des projets collectifs de passerelles Web/Z39.503. En effet, ce produit peut être un produit standard
Il convient pour terminer d'évoquer WAIS (Wide Area Information Server), qui représente une nouvelle variante dans la problématique d'accès aux catalogues.
Au début, WAIS ne permettait qu'une interrogation non structurée (sur du plein texte). S'est maintenant répandu la variante freeWAIS-sf6, développée par l'université de Dortmund, qui permet une interrogation par champ.
En outre, après avoir vu se développer les serveurs WAIS qui obligeaient l'interrogateur à disposer d'un client WAIS, on a vu se développer les passerelles Web, exactement comme avec Z39.50.
En France, WAIS s'est répandu dans le monde universitaire mais pas dans la lecture publique. Le site du réseau documentaire de Grenoble offre un exemple de passerelle :
4.2 - Normes et formats de l'édition électronique
4.2.1 - Formats propriétaires
En matière de document électronique, on observe une profusion de formats propriétaires. Rien que pour le texte, ceux-ci sont nombreux. Mais on peut distinguer les formats de type traitement de texte (comme Word) et ceux qui sont explicitement prévus pour la diffusion sur Internet, comme PDF, de la société Adobe, qui permet de restituer la mise en page d'une édition sur papier tout en permettant des recherches sur les mots.
4.2.2 - SGML
SGML (Standard Generalized Mark-up Language : langage standard généralisé à balises) répond au besoin de gérer la structure logique d'un document (division en chapitres, parties, paragraphes, insertion d'illustrations, etc.) indépendamment de sa structure matérielle, afin notamment de procéder à plusieurs éditions : sur papier, sur CD-ROM, en ligne. Plus fondamentalement, SGML peut permettre de standardiser la structure de certains types de document.
La structure est assez simple. Une balise entrante indique que commence le chapitre un, une balise entrante indique que commence la partie 1, etc. Jusqu'à ce qu'une balise de fin indique la fin de la partie 1, et plus tard une autre balise de fin la fin du chapitre 1. Il s'agit donc d'une structure arborescente à l'infini.
SGML est un modèle général permettant de construire des structures précises pour tel type de document, en indiquant quels en sont les composant, s'ils sont obligatoires, répétables, etc. C'est ce qu'on appelle des DTD (Document Définition Type).
Il est prématuré de vouloir déceler quel sera l'influence de SGML dans les bibliothèques, mais on assiste déjà à plusieurs tentatives de traduire MARC en SGML, notamment de la part de la Bibliothèque du Congrès, qui a par ailleurs défini une DTD (le TEI : Text Encoding Initiative) pour son projet de numérisation d'un fonds patrimonial de textes sur l'Amérique, American Memory.
4.2.3 - HTML
HTML est une variante simplifiée de SGML qui permet de coder le texte des pages Web. Une page Web est un simple fichier texte. Les balises permettent la mise en forme (centrer, mettre en gras, augmenter le corps, créer des tableaux...) mais aussi deux types de liens : ceux qui appellent sur la page un fichier image, vidéo ou son, et ceux qui permettent un lien hypertexte vers une autre page ou déclenchant une requête vers une base de données4.
4.2.4 - Et le catalogage ? Et l'indexation ?
Outre les projets de traduction de MARC en SGML, d'autant plus aisés qu'ils s'agit d'une structure arborescente pouvant plus que MARC (champ/sous-champ), diverses tentatives sont expérimentées pour faire évoluer le catalogage dans un environnement ou l'information disponible en ligne se développe.
On peut les classer en deux familles :
4.3 - Standards Internet/Intranet
Outre HTML dont nous venons de parler, Internet/Intranet repose sur un certain nombre de standards gérés par des organismes internationaux. En voici quelques-uns.
4.3.1 - TCP/IP, HTTP
Il s'agit de protocoles de communication.
TCP/IP (Transmission Control Protocol / Internet Protocol) gère les communications entre machines sur un réseau. Très implanté dans le monde UNIX et dans les réseaux locaux Ethernet, il est devenu le protocole de base de l'Internet.
HTTP (HyperText Transfer Control Protocol) complète TCP/IP pour le World Wide Web. Il gères l'échange de requêtes et de réponses entre un navigateur et un serveur Web.
4.3.2 - Java
Créés par la société américaine Sun, les langages Java et Javascript permettent notamment d'insérer dans une page HTML un petit programme qui s'exécute sur la page affichée par un navigateur. Les premières applications ont été assez anecdotiques (images se déplaçant sur l'écran par exemple) mais il s'agit probablement d'un concept d'avenir.
Page d'accueil de Dominique Lahary | Plan | Page suivante |