table des 
matières  
précédente  
suivante  [CRDP]  [Info]  [Help]

STRATÉGIES DE DIFFUSION SUR L'INTERNET

Daniel POULIN
Centre de recherche en droit public
Faculté de droit, Université de Montréal

Introduction

Le Centre de recherche en droit public (CRDP) fut une des premières organisations à entreprendre la diffusion de documents juridiques sur l'Internet[1]. Fort de notre longue expérience - bientôt deux années complètes, nous tenterons de livrer dans les prochains paragraphes certaines des leçons accumulées. Ce faisant, nous espérons aider celles et ceux qui sont à aborder aujourd'hui l'Internet ou qui se préparent à utiliser demain les inforoutes qui s'annoncent.

Cela dit, le plus vert des néophytes aura compris, qu'en ce domaine, même les pionniers de vingt mois d'expérience sont encore, il faut bien l'admettre, en grande partie ignorants et perplexes quant à la forme définitive du cyberespace global de demain et des technologies qui y seront utilisées. Néanmoins, puisqu'au pays des aveugles les borgnes sont rois, nous allons partager immédiatement et sans complexes les premiers résultats de nos tâtonnements. Pour ce faire, nous adopterons le point de vue de celui ou celle qui se prépare à diffuser sur l'Internet.

Pour éclairer les choix de l'éventuel diffuseur, nous aborderons successivement l'établissement des objectifs; le choix du mode de la publication, à l'interne ou à l'externe; le matériel et l'environnement logiciel requis; les considérations à prendre en compte lors de l'élaboration du contenu; le travail de préparation du matériel diffusé et, finalement, le travail de gestion du serveur. Dans une seconde partie, nous décrirons une activité particulière de diffusion, celle des décisions récentes de la Cour suprême du Canada par le CRDP. Ce cas pratique, nous permettra de mettre en évidence certaines des leçons qui se dégagent de nos activités sur l'Internet. Et vous l'aurez deviné, une des plus importantes de celles-ci a trait à l'utilisation du SGML.

1. La diffusion sur l'Internet

L'élaboration d'objectifs clairs contribue aux chances de réussite de tout projet, aussi doit-on, lors de la mise en place d'un serveur World Wide Web, préciser dès le départ les résultats cherchés. Pour éclairer le choix des objectifs, nous considérerons les diverses utilisations auxquelles l'Internet a donner lieu jusqu'à présent.

a) Le choix des objectifs.

La raison d'être d'un serveur WWW sera en bonne partie déterminée par la mission fondamentale de l'organisme éditeur. Cependant, fréquemment, nos vocations autorisent, voire imposent, plusieurs fonctions complémentaires. Certaines de nos missions peuvent bénéficier énormément de la mise en place de ressources sur l'Internet, d'autres beaucoup moins. Pour un organisme public, ce sont les activités de diffusion visant à assurer la dissémination de l'information, comme l'information gouvernementale, qui semblent offrir le meilleur potentiel. La plupart des organismes publics assurent déjà un rôle d'information sur certaines des questions liées à leur mission. Pour ces organismes, l'Internet offre de belles opportunités et celles-ci s'amélioreront au fur et à mesure que se développeront les inforoutes.

L'Internet se prête également bien aux activités de promotion d'une entreprise ou d'une ressource publique. Pensons par exemple, à la promotion d'une destination touristique, à celle des conditions d'études dans une université ou aux conditions d'installation dans un important parc industriel. Certaines formes de publicité, disons "corporatives", peuvent être assimilées à ces promotions. Les descriptions de firmes d'avocats que l'on trouve sur l'Internet sont de ce type. Chaque professionnel y est présenté et l'expertise de la firme y est habilement proposée. Il ne faut pas croire que de telles publicités conduisent directement à de nouveaux mandats. Cependant, le message envoyé est clair : nous sommes là, notre firme est à l'affût des nouvelles technologies et elle sait les utiliser.

Plus incertaine est l'utilisation immédiate de l'Internet pour la conduite d'activités commerciales "grand public". Certaines des toutes premières expériences ont conduit à des déceptions. On ne vend pas facilement des "zirconia cubiques" sur l'Internet. On y trouve probablement plus d'acheteurs de modems, de logiciels, de livres, de CD-ROM que dans la société en général. Il semble donc, qu'à l'étape actuelle, l'Internet n'offre que des possibilités limités pour le petit commerce et celà en autant que l'on tienne compte du type de clientèle qui peut y être rejoint.

Dans ce bref paragraphe, nous n'avons mentionné que les utilisations les plus immédiatement intéressantes de l'Internet aujourd'hui. Cette liste n'est pas exhaustive, bien entendu; cependant, il est fort probable que ceux et celles intéressés par la gestion de la documentation gouvernementale trouveront au sein des objectifs énumérés ceux qu'il convient d'assigner à leur projet de diffusion sur l'Internet.

b) Développement interne ou impartition

Le développement d'un serveur WWW sur l'Internet exige une combinaison d'expertise qui n'est pas facile à rassembler à l'intérieur de nos organisations. En premier lieu, il faut un responsable des contenus informationnels, un éditeur. Par ailleurs, la mise en place du serveur exige la présence d'informaticiens maîtrisant les technologies liées à l'Internet et d'un concepteur graphique. La réunion de tels talents est le premier obstacle auquel se heurte celle ou celui qui souhaite entreprendre le développement d'un site WWW.

Un second problème, fort important pour certaines organisation est celui de la sécurité. En effet, de nombreux organismes doivent gérer sur leurs réseaux informatiques de nombreuses informations personnelles, confidentielles ou, tout simplement, "sensibles". Pour ces organisations, rendre public un de leur ordinateurs n'est pas une décision sans conséquences, et cela, même si les techniques pour gérer de façon sécuritaire des réseaux reliés à l'Internet sont de mieux en mieux connues.

Cependant, procéder à l'interne procure des avantages. L'acquisition et le développement de savoir-faire liés à l'exploitation des inforoutes est sans aucun doute le premier bénéfice qui vient à l'esprit. Car, si les inforoutes doivent prendre la place qu'on leur annonce, il faudra bien que nos organisations soient en mesure de les exploiter. Un second bénéfice du développement interne, c'est l'indépendance, l'autonomie. Lorsque le site WWW est chez soi, une mise à jour peut être faite plus simplement. On peut, sans avoir à transiger avec qui que ce soit, modifier le site WWW, sa structure et ses contenus. Cette prise directe sur les contenus diffusés est particulièrement importante parce que l'oeuvre produite n'a pas la stabilité de l'oeuvre papier. Tout au contraire, le contenu informationnel devra être constamment modifié, mis à jour. Ainsi tout développement à l'externe doit être vu dès le départ comme l'établissement d'une relation d'affaire continue.

Cependant, malgré les coûts qu'entraîne l'impartition d'activités à l'externe, nous ne craignons pas de confier à d'autres la préparation des documents papiers destinés à être diffusés largement. Les raisons qui justifient ces choix s'appliquent en bonne partie aux publications électroniques. Car, comme le dit l'adage : "chacun son métier et les vaches seront bien gardées". Ainsi, il est fort possible que les coûts impliqués dans la mise sur pied d'une équipe réunissant les compétences nécessaires à la diffusion du l'Internet soient difficilement justifiables si des entreprises peuvent produire le service de façon plus économique. Le recours à un agent externe solutionne du même coup les problèmes de sécurité de l'organisme.

Les inconvénients de l'impartition des services de diffusion sur l'Internet sont bien entendus les corollaires des avantages de le faire soi-même. Par exemple, le recours à une collaboration externe réduit l'acquisition d'expertise. Toutefois, la principale contrainte qu'amène cette délégation de la publication vient du caractère évolutif de l'ouvrage diffusé. L'expérience montre qu'on ajoute, modifie ou retire régulièrement des pages sur de tels serveurs. Dans ce contexte, les partenaires, l'organisme commanditaire et le diffuseur, doivent maintenir des relations étroites non seulement au moment de la conception du site mais tout au long de son existence.

Pour ceux qui envisagent de mettre en place de nouveaux services et qui s'apprêtent à confier ce mandat à une firme externe, un certain nombre de paramètres doivent être clarifiés au moment de la préparation du contrat. Mentionnons, à titre d'exemples : la procédure d'approbation du graphisme, la possibilité de récupérer les pages développées en fin de contrat, la conception de pages "transportables", la préparation régulière de rapports d'utilisation spécifiques, les délais qui seront nécessaire lors des mises à jour, l'adresse par laquelle le service sera connu sur l'Internet. Chacun de ces aspects peut contribuer à rendre plus intéressante une proposition plus coûteuse mais néanmoins beaucoup plus satisfaisante. Notons enfin, que généralement le coût des contrats de diffusion sur l'Internet sera fonction du nombre et de la difficulté des pages HTML développées et de la durée de leur diffusion.

c) Le choix du matériel informatique

Presque tout appareil capable d'être doté d'une adresse IP (Internet Protocol) et d'être relié au réseau Internet peut être utilisé comme serveur WWW. Des logiciels existent pour les Macintosh, les ordinateurs Intel avec Windows, Windows NT et Linux, tout comme pour les différentes stations de travail Unix et ordinateurs intermédiaires ou maxi. Un solution très satisfaisante est d'utiliser une station de travail Unix, comme les SparcStation de Sun Microsystems Inc. avec une bonne quantité de mémoire vive et d'espace-disque (quelques Gigaoctets). Un tel serveur sera en mesure de soutenir une charge considérable tout en demeurant disponible pour offrir des services plus traditionnels dans l'organisation. Au CRDP, ce type d'appareil gère plus de 15 000 transactions et diffuse jusqu'à 200 Mo d'information chaque jour.

Cependant des solutions plus économiques s'offrent. Un micro-ordinateur de quelques milliers de dollars doté du système d'exploitation Linux constitue une solution de départ raisonnable à un coût imbattable. C'est d'ailleurs ce qu'ont choisi de faire certaines organisations qui diffusent à travers le monde avec un équipement d'environ 2 000 dollars. Dans un tel scénario, le seul coût réel de diffusion provient des frais mensuels de rattachement à l'Internet.

Comme la diffusion sur l'Internet s'appuie de façon importante sur un foule d'outils développés dans des contextes non commerciaux et mis gracieusement à la disposition de la communauté des utilisateurs de l'Internet, il est souhaitable de retenir une solution informatique qui permettra de puiser à cette abondante source de logiciels publics. C'est le cas pour les versions les plus populaires du système d'exploitation Unix. C'est aussi le cas, mais dans une moindre mesure, pour les systèmes d'exploitation Windows et Macintosh.

d) Le choix des logiciels

L'ensemble des logiciels utilisés pour la mise en place d'un serveur WWW sont d'utilisation gratuite pour les individus et la plupart du temps leurs droits d'utilisation sont peu coûteux à acquérir pour les organisations[2]. Du côté serveur WWW, il nous faut un serveur HTTP, c'est-à-dire, un serveur capable de transiger avec des logiciels-clients parlant le langage HTTP (Hypertext Transfert Protocol) comme le Netscape Navigator ou le NCSA Mosaic. Des versions gratuites de ce logiciel sont disponibles du National Centre for Supercomputing Applications (NCSA) et du Centre Européen de recherche nucléaire (CERN)[3]. Par ailleurs, diverses entreprises commerciales offrent des serveurs HTTPd, et certains d'entre eux sont conçus pour permettre des transactions commerciales. Dès que votre serveur est installé, vous êtes en affaire, mais pour offrir sur votre serveur la variété des ressources auxquelles on en est venu à s'habituer sur le Web vous devrez compléter votre logiciel serveur d'un environnement de programmation, de mécanismes de repérage et de procédures de gestion des statistiques.

L'environnement minimal de programmation se compose du langage de manipulation de texte Perl et de scripts d'interface pour les programmes externes, habituellement appelés CGI scripts (Common Gateway Interface). Le Perl et les scripts CGI vous permettront de mettre en place des formulaires, des compteurs, de faire l'interface avec les éventuels mécanismes de repérage.

De ce côté, de nombreux logiciels gratuits, du moins pour les utilisations non commerciales sont également offerts[4]. Les principaux sont le vénérable WAIS, freeWAIS-sf et Glimpse. Le premier apparaît aujourd'hui fort limité. Par exemple, il ne supporte pas les caractères accentués et il ne permet pas la recherche par champs. Les deux autres sont beaucoup plus sophistiqués et pourront satisfaire la plupart des besoins. Au surplus, plusieurs des logiciels de gestion documentaire que nous connaissons dans les environnements PC font actuellement la migration vers l'Internet. C'est le cas notamment du mécanisme de repérage NQL au coeur du logiciel Naturel de la firme Ardilog.

Reste encore à trouver et installer un ou des logiciels servant à mesurer l'utilisation du site. Ces programmes permettent d'exploiter l'information qu'accumulent les serveurs HTTPd dans leurs fichiers journal. Sans eux, les milliers de pages d'information accumulées par le serveur sont presque inutilisables. Des listes de tels programmes sont également disponibles sur l'Internet[5].

e) L'élaboration du contenu

L'équipement et l'environnement logiciel choisi, reste à déterminer le corpus qui sera publié. Trois grandes catégories de contenus informationnels peuvent être considérées ici: les contenus que l'on diffusait avant, ceux que l'on ne diffusait pas pour des raisons économiques et ceux qui "se diffusent sur l'Internet". Voyons des exemples de chacune de ces catégories.

En analysant le contenu à diffuser sur un futur serveur, il ne sert à rien de tout réinventer. Au contraire, l'attitude la plus sage nous semble être d'étudier les publications passées de l'organisation. En effet, si un document à été publié, c'est sans doute que l'on avait identifié un besoin. Sous ce rapport, la conception du site WWW peut être vue comme une mise en valeur du capital-information d'un organisme. Dans tous les projets de diffusion auxquels le CRDP a été mêlé, nous avons trouvé des publications sur papier, généralement peu diffusées, souvent de très bonne qualité, qui ont permis de fournir l'ossature de la présentation de l'organisme et de sa raison d'être. Il en va de même des divers bulletins qui peuvent eux aussi donner lieu à une version électronique complète ou partielle.

La seconde catégorie regroupe ce que l'on n'a pu diffuser auparavant en raison du coût prohibitif de la publication sur papier. On trouve dans cette catégorie divers ouvrages ayant un public plus limité. Il s'agira, par exemple, du résultat d'une recherche bibliographique ou, dans le cas d'un tribunal, des décisions qui n'étaient pas jusqu'à présent retenues pour publication. Notons au passage, que l'économie de la publication électronique se réalisera d'autant mieux qu'il s'agira d'une information assimilable à une collection de documents semblables. Dans de tels cas, les procédures développées pour diffuser le premier de ces documents pourront ensuite être appliquées à tous les autres.

Notre troisième catégorie est celle des publications propres aux nouveaux environnements électroniques. On constate en effet que, en raison de l'exemple fourni par les américains, ou par vanité, on adopte plus facilement le style présidentiel sur l'Internet que dans les publications papiers de nos organismes. On étale ses notes biographiques, on les accompagne de sa photo, tout comme si on était secrétaire au commerce à Washington. Étonnant, mais peut-être néanmoins nécessaire dans un monde d'information virtuel. C'est un peu comme si nous tentions de donner à notre maison électronique tout le relief possible, de façon à ce que nos visiteurs aient quelque chose de tangible à lire, entendre et regarder.

Ces trois catégories nous fournissent amplement de matière pour monter notre serveur. Reste encore à discuter son organisation, sa structure. Notre expérience de concepteur de site et d'utilisateur de l'Internet nous amène à suggérer très fortement la conception de sites bien équilibrés. Il nous semble souhaitable que les diverses sections d'un lieu électronique soient à l'image des chapitres d'un livre bien rédigé, c'est-à-dire, de taille comparable. Sans cela, le visiteur explorera quelques courtes branches, se lassera et négligera de visiter le lien hypertexte qui l'aurait conduit au coeur des contenus diffusés.

f) La préparation de l'information diffusée

Dans quelques semaines, au pire dans quelques mois, toutes les revues informatiques grand public auront complété la publication d'articles du type "How to publish on the Internet". Dès lors, plusieurs auront l'impression que la publication de corpus d'information est un jeu d'enfant en autant qu'elle se fasse sur l'Internet. En fait, tous ces articles se concentrent sur l'encodage des documents en HTML et, nous l'apprennent nos magazines favoris, cela n'est pas très compliqué. En effet, le HTML (Hypertext Markup Langage), une DTD (Document Type Definition) simple, n'est pas très difficile à mettre en oeuvre. D'autant plus que certains filtres simples, disponibles sur l'Internet, peuvent faciliter ce travail[6]. Toutefois, on le comprendra aisément, la conception d'un site WWW implique beaucoup plus que l'accumulation de documents balisés en HTML. Il faut structurer des sections, permettre la navigation d'une à l'autre, d'un document à l'autre. De plus, les serveurs québécois sont fréquemment bilingues, il faut donc ajouter encore des liens dans les divers documents. Pour tout cela, les filtres ne suffisent pas.

Le pire problème - ou le plus amusant, c'est selon le point de vue - est la conception de l'apparence graphique du site. Quelque soit le plaisir que l'on éprouve à être impliqué dans la création d'oeuvre électroniques nouvelles, il faut bien reconnaître qu'il s'agit là d'une activité coûteuse en talent et en temps. Elle nous apparaît toutefois inévitable. Malheureusement, un site sur l'Internet dépourvu d'un graphisme un peu accrocheur peut fort bien passer inaperçu. Il est vrai que certains des meilleurs sites, comme celui du Legal Information Institute (LII), sont d'une grande sobriété. Toutefois, chaque site n'offre pas la richesse documentaire du LII. Disons pour conclure, que pour le meilleur ou pour le pire, du côté graphisme, la barre est actuellement assez haute et que cela n'est pas sans effet sur le coût de mise en place de nos serveurs. Il en va cependant ainsi de tous les médias, nous avons perdu l'habitude des émissions de télévisions toutes croches à la française, où l'on trébuche sur les chaises, comme nous avons perdu celle des magazines sérieux du type Pékin Information.

g) La gestion du site WWW

Il reste à aborder l'administration du site WWW. Plusieurs aspects ont déjà été mentionnés au passage, mais il y a plus. Un travail régulier sur le serveur WWW est imposé du fait qu'un tel site s'apparente davantage à un babillard qu'à un livre imprimé de façon définitive. Il faut donc prévoir des ajouts réguliers aux contenus. En fait, le travail n'est jamais complètement terminé. Une autre tâche nous est imposé par la production de rapports statistiques périodiques. À cela s'ajoute le travail de veille technologique pour s'assurer que, d'une part, nous utilisons les meilleurs versions disponibles de nos programmes et que, d'autre part, que nos ressources informatiques ne sont pas devenues subitement vulnérables suite au développement d'un nouveau programme par des étudiants d'Amsterdam.

2. Étude de cas - la diffusion des décisions de la CSC par le CRDP

Abordons maintenant l'exemple de la diffusion des décisions récentes de la Cour suprême du Canada par le Centre de recherche en droit public. La Cour suprême du Canada (CSC) rend environ 220 décisions par an. Ces arrêts sont de longueur variable, allant d'une à quelques centaines de pages. Ils sont, par ailleurs, relativement structurés et préparés de façon très minutieuse. Chaque décision connaît au moins deux versions. Les décisions sont d'abord diffusées au moment où elles sont rendues; puis, lors de la parution des Recueils de la Cour suprême, elles sont à nouveau publiées dans une version éventuellement améliorée. À l'occasion, elles font l'objet de corrections ultérieures. Chaque décision est publiée en anglais et en français. La publication des décisions sur l'Internet doit être faite rapidement, c'est-à-dire, dans l'heure ou, au pire, les heures qui suivent leur publication par la Cour. Le Centre de recherche en droit public ne recevant aucun financement direct pour mener à bien cette publication, la diffusion doit donc être réalisée à coût minimum.

a) La solution retenue

La solution que nous avons retenue comporte quatre éléments. Tout d'abord, nous avons choisi de rendre le corpus accessible à l'aide des trois types de serveurs couramment utilisé sur l'Internet : File Transfert Protocol (FTP), Gopher et World Wide Web (WWW). En deuxième lieu, nous avons aussi voulu rendre les décisions disponibles dans les formats les plus courants, c'est-à-dire, ASCII (American Standard Code for Information Interchange), WordPerfect #5.1 et Microsoft Word #5. Pour offrir les trois mêmes formats sur le serveur Gopher, nous avons dû préparer un quatrième fichier contenant la version Binhex du document Microsoft Word. Troisièmement, nous avons résolu de mettre en place un mécanisme simple de repérage, WAIS, pour que les usagers puissent faire des requêtes simples afin de dépister les décisions qui les intéressent. Le dernier élément de notre solution prenait appui sur le fait que les décisions constituaient globalement un corpus très standardisé et qu'il était possible d'en automatiser le traitement. Voyons donc comment se déroule la publication d'une décision sur l'Internet depuis son envoi des bureaux de la CSC à Ottawa le jeudi matin à son arrivée sur votre bureau via les serveurs du CRDP à Montréal.

La publication d'un groupe de décisions débute par l'envoi par modem des décisions depuis la CSC jusqu'à un serveur Sun du CRDP. Leur arrivée déclenche l'envoi d'un message électronique à l'éditeur des serveurs Internet du CRDP. Sur réception du message, l'éditeur lance sur son Macintosh la procédure de traitement automatique des décisions qui comporte elle-même cinq principales étapes[7].

En premier lieu, la procédure établit une connexion FTP pour transférer les fichiers reçus sur le Macintosh. Lorsque les fichiers ont été reçus, la deuxième étape, l'étape de conversion, s'enclenche. Les fichiers originaux de la CSC sont en format WordPerfect #5.1 et les diverses versions diffusées sur nos serveurs doivent être produites sur l'appareil Macintosh. Ces conversions ont été programmées à l'aide d'AppleScript et elles sont lancées par le script général de traitement.

En troisième lieu, lorsque les conversions sont terminées, l'ensemble des fichiers produits, Ms Word 5, ASCII et Ms Word/Binhex et le fichier d'origine WP 5.1, sont retournés vers le serveur Sun. À cette étape, diverses modifications peuvent être apportées au serveur. Par exemple, si l'envoi fait suite à la publication de décisions dans les recueils, le programme se chargera de retirer les anciennes versions des décisions et les remplacera par les nouvelles. De plus, s'il s'agit d'un nouveau volume du recueil, le répertoire approprié sera créé. Alors peut être abordé la quatrième étape, celle démarrant l'indexation sur le Sun avec le programme WAIS. Ce travail permettra de mettre à jour les fichiers de listes inversées nécessaires aux traitement des requêtes des usagers.

La cinquième et dernière étape comprend la génération d'un projet de message pour la liste d'envoi automatique Jurinet-L. Ce projet de message résulte de l'analyse de chacun des nouveaux fichiers afin d'y repérer le nom des arrêts, les termes d'index utilisés par le personnel de la Cour et d'autres informations utiles à la présentation des décisions. Ce projet de message est reçu par l'éditeur, qui, après avoir vérifier les nouveaux fichiers, envoie le message à la liste des abonnés à Jurinet-L. Ce type d'opération est répété à chaque publication de la Cour, soit environ quarante fois par année.

b) Les problèmes de format

La solution pour la diffusion du corpus de la CSC pose cependant des problèmes. Les deux plus importants nous amènent à nous diriger vers le SGML.

Lorsque le service de diffusion a été conçu au début de 1994, il nous apparaissait tout à fait raisonnable de retenir WP #5.1 comme format de diffusion. C'était le format même utilisé par la Cour et la norme de facto dans le monde juridique. Le Ms Word #5 pour Mac a été ajouté afin d'offrir aux utilisateurs de ce type d'appareil un accès automatique aux décisions[8]. Pour tous les autres, ceux qui n'utilisent pas de micro-ordinateurs ou qui auraient des difficultés avec les versions Word et WordPerfect, nous avions décidé d'offrir la version ASCII. Cependant, ce format ASCII, le plus bas commun dénominateur, ne pouvait en aucune façon suffire, ne serait-ce que parce qu'il ne permettait pas l'expression des caractères accentués. Toutefois, dans leur ensemble, ces formats complémentaires nous apparaissaient satisfaisants.

À peine un an plus tard, le personnel de la Cour nous a contacté pour nous prévenir qu'ils adopteraient très bientôt un nouveau logiciel de traitement de texte, Ms Word #6 pour Windows ou WordPerfect #6 pour Windows. Pour l'équipe du CRDP, l'adoption de ce nouveau format ajouterait une conversion de plus; rien là de catastrophique. Cependant, la tournure des évènements commencait à nous déplaire. Dorénavant, quelque soit le logiciel retenu par la Cour, la version originale ne serait plus disponible sur nos serveurs.

Mais il y avait pire. Quelque soit l'angle sous lequel on prenne le problème, tôt ou tard, l'ensemble de nos utilisateurs adopteraient les versions plus récentes des traitements de texte les plus populaires, rendant nos conversions vers les formats obsolètes tout à fait contre-productives. Il nous faudrait donc modifier tôt ou tard nos formats de diffusion pour adopter quelque chose comme : ASCII, WP #6 et MS Word #6. Mais alors, que faire des décisions passées? Les laisser dans leurs formats disparus? Les convertir vers les nouveaux formats à la mode? Une solution ou l'autre comportait des problèmes. Pire, même si nous adoptions la seconde hypothèse, avec les coûts qu'elle comporte, le problème ne serait réglé que jusqu'à la parution de nouvelles version des logiciels de traitement de texte. Microsoft a alors commencé à annoncé le Ms Word #7. Nous étions bel et bien empêtrés dans les formats "propriétaires".

C'est face à tout cela que nous avons choisi d'orienter nos investissements vers un format de fichier susceptible de durer. Un format qui ne dépende pas des impératifs de marketing d'une firme commerciale. Ce format existe, il est disponible, c'est le SGML. Nous nous sommes d'autant plus facilement convaincus de nous tourner vers le SGML que d'autres facteurs nous pressaient dans ce sens.

c) Les problèmes de repérage

Lors de sa conception, notre service de diffusion pour la Cour suprême du Canada n'offrait l'accès qu'à un nombre limité de décisions. Le mécanisme de repérage offert n'avait que peu d'importance. Au fil des ans toutefois la taille de la banque a augmenté et il nous est apparu nécessaire de recourir à un mécanisme de repérage plus puissant et plus précis. Nous souhaitons maintenant offrir à nos utilisateurs des mécanismes permettant les requêtes par champs. C'est-à-dire, de repérer, par exemple, les décisions de 1994, où Madame Claire L'Heureux-Dubé était sur le banc et où l'on trouvait un certain nombre de termes voisins dans les motifs. Un tel système de repérage solutionnera de façon très élégante le problème de dépistage des décisions. Sa mise en place exige toutefois que la structure de la décision soit balisée, identifiée, afin que le système de repérage puisse l'utiliser afin de l'exploiter.

Encore une fois, la solution à nos difficultés semblait passer par le SGML. En effet, c'est précisément un des avantages du SGML que de permettre l'expression de la structure des documents. Une fois la structure adéquatement balisé avec le SGML, il devient possible d'utiliser des mécanismes de repérage extrêmement précis, comme le NQL d'Ardilog.

Conclusion

Pour ces raisons et pour d'autres motifs sur lesquels nous aurons l'occasion d'élaborer dans les prochains mois, nous nous sommes donc tourné vers le SGML. De façon immédiate, la prochaine version de notre service de diffusion des décisions de la CSC en bénéficiera. Mais, plus important, il nous apparaît qu'un recours systématique à cette norme de balisage structuré nous permettra d'agir à plus faible coût sur l'inforoute. Or, pour notre Centre, comme pour l'ensemble des intervenants dans l'univers documentaire juridique, il y a là une question d'importance stratégique.


Envoyez vos questions et commentaires au CRDP
© CRDP
M.A.D. 8 juillet 1996