Manuel de transcription XML

des manuscrits de Stendhal

version 0.91

ATTENTION: Ce document se réfère à une ancienne version de Morphon - certaines parties sont donc en attente d'une mise à jour (qui sera faite très prochainement)

ce document ainsi que des informations complémentaires sont disponibles sur

http://stendhal.msh-alpes.prd.fr/XML

Thomas Lebarbé

Laboratoire LIDILEM,

Université Grenoble 3 - France

thomas.lebarbe à u-grenoble3.fr

25 avril 2007

Introduction à XML

Ce petit manuel a été rédigé à l'intention des membres de l'équipe Manuscrits de Stendhal afin de faciliter la transcription des pages...

XML en quelques mots

XML, pour eXtensible Mark-up Language, est une norme de stockage d'information ouverte, dans le sens où elle permet de décrire des contenus à l'aide de balises de délimitation.

Le principe fondamental à retenir est la notion d'encapsulation : on décrit une boîte, qui contient des boîtes, qui elles-mêmes contiennent des boîtes... et ainsi de suite.

Il faut donc concevoir la description des pages comme étant constitués de blocs (nous ne donnons ici qu'un petit aperçu, le détail est donné dans les pages qui suivent):

  • une page est un bloc qui contient :
    • un bloc texte qui contient
      • des blocs paragraphes
    • des marginales
    • des figures
    • des numérotations

Par ailleurs, XML ne doit pas être compris comme une simple extension de fichier (mon_fichier.xml). A un fichier XML sont généralement associés deux autres fichiers (que vous n'aurez pas à manipuler) :

  • une description de type de document (DTD - Document Type Description) qui indique aux outils informatiques conçus pour XML ce que le document peut contenir et comment les éléments de ce document doivent s'agencer.
  • une feuille de style (CSS - Cascading Style-Sheet) qui indique aux outils informatiques comment présenter le document XML.

Ces deux fichiers sont communs à tous les documents XML d'une même famille de documents XML (en l'occurrence toutes les transcriptions des manuscrits de Stendhal) et chaque document XML y fait référence de manière explicite.

Eléments, Attributs et Valeurs

Dans le jargon XML, les blocs sont nommés éléments. Un élément peut contenir d'autres éléments et/ou du texte. Ils se matérialisent dans le fichier sous forme d'une paire de balises qui délimitent le bloc. Les balises sont définies à l'aide des chevrons :

<nom_du_bloc>contenu du bloc</nom_du_bloc>

Il existe le cas particulier du bloc vide qui ne contient rien. Il s'agit en général d'un marqueur. Ce sera notamment notre cas pour les mots illisibles qu'il est important de noter mais qui n'ont pas de contenu textuel.

<nom_du_bloc_vide/>

Tout élément peut avoir une ou plusieurs propriétés telles l'auteur, la date, le mode d'identification... Chaque propriété, nommée attribut peut avoir une valeur par défaut, c'est à dire une valeur attribuée systématiquement à défaut d'une valeur donnée par le rédacteur. Un bloc peut être qualifié par un nombre quasi infini de propriétés.

@@<nom_du_bloc

    attribut1="valeur1"
    attribut2="valeur2" 
    attribut3="valeur3">
        contenu du bloc

</nom_du_bloc> @@

Notion d'héritage

Une représentation XML est une représentation arborescente dans la philosophie des arbres de Porphyre. Chaque genre subordonné (chaque bloc ou élément dans notre vocabulaire) a les mêmes propriétés que le genre auquel il est subordonné, mais a des propriétés qui le spécialisent par rapport à son subordonnant ainsi que des propriétés qui le distinguent des autres subordonnés.

Ainsi, dans la figure, "ETRE VIVANT" hérite de "CORPS" la propriété d'être "MATERIEL" mais se spécialise de "CORPS" par la propriété d'être "ANIMÉ", et se différencie de "MINÉRAL" par une valeur différente de la propriété d'être "ANIMÉ".

Ce principe d' héritage s'applique en XML. Ainsi, une propriété spécifiée pour une bloc (par exemple l'outil d'écriture) s'appliquera à tous les sous-blocs, sauf si stipulé autrement, il n'est donc pas nécessaire de définir l'outil d'écriture pour chaque bloc, mais seulement pour le bloc englobant (la page) et pour les blocs où l'outil varie (un ajout par exemple).

Outil(s)

XML étant normalisé, de nombreux outils ont été développés selon les différentes perspectives d'utilisation. Dans la lignée de la politique "Logiciels libres" de l'Université, nous ne proposerons que des logiciels libres et gratuits.

Pour la visualisation des documents XML, la plupart des navigateurs Internet récents la permettent. Toutefois, la visualisation du document dépend de la feuille de style CSS qui n'est pas toujours interpétée correctement (selon la norme définie par le World Wide Web Consortium - W3C). Il est donc conseillé d'utiliser un navigateur respectant les normes, tel Mozilla FireFox (http://www.mozilla.org). Dans tous les cas, éviter d'utiliser Microsoft Internet Explorer.

Pour la rédaction, les outils libres sont moins nombreux. Nous avons opté pour Morphon XML Editor (le site de l'éditeur du logiciel étant souvent en panne, nous avons mis l'outil à disposition sur http://stendhal.msh-alpes.prd.fr/XML). Ce logiciel présente les avantages suivants :

  • Il existe aussi bien pour Microsoft Windows que pour MacOSX et même Linux
  • Il est en français
  • Il est WYSIWYG (What You See Is What You Get)

Morphon a toutefois le défaut d'avoir une interprétation parfois hasardeuse des CSS. Ce que vous verrez à l'affichage sera "presque" le résultat attendu. Ainsi, même en précisant le positionnement des figures, marginales et paginations, celles-ci n'apparaîtront pas à la position attendue mais elles le feront quand la page sera visualisée avec Mozilla Firefox.

Que transcrire

La DTD (Document Type Definition), décrit ce que l'on peut transcrire. Nous la reprenons ici dans un langage plus accessible. Afin d'éviter toute surcharge d'écriture, nous indiquons en gras ce qui est obligatoire. Dans tous les cas, le logiciel Morphon XML Editor vous guidera et le cas échéant se fera un malin plaisir à vous indiquer vos erreurs.

Une forme de représentation de la description de ce que peut contenir un document est l'arbre. Nous ne l'avons pas représenté dans son intégralité afin de ne pas surcharger la présentation. Voici les éléments qui apparaissent à l'ouverture d'un nouveau document.

  • La "racine" du document est la page qui contient (peu importe l'ordre) :
    • un descriptif constitué
      • d'un fichier image (dont on donnera le nom de fichier - voir chapitre suivant)
      • d'un ou plusieurs transcripteurs (qui indiqueront leur nom et la date à laquelle ils effectuent la transcription)
      • d'un corpus principal auquel se rattache la page
      • d'un document principal auquel se rattache la page
      • d'une cote, d'un volume, d'un type de page (recto, verso, tranche\ldots) et d'un numéro éventuel de page
      • de propriétés physiques
      • d'une date de rédaction
      • d'un lieu de rédaction
      • d'un commentaire du transcripteur
        • constitué d'un ou plusieurs paragraphes
    • un contenu (ce qui est présent sur la page) constitué de
      • zéro, une ou plusieurs paginations qui contient une ligne où stipuler le numéro
      • zéro, une ou plusieurs figures dont on donne la description et qui peuvent contenir un ou plusieurs paragraphes
      • zéro, une ou plusieurs marginales décrites comme le texte (il n'y a pas de différence si ce n'est qu'il s'agit d'un bloc "marginale" qui sera traité différemment du texte suivant les besoins).
      • zéro, un ou plusieurs textes qui contiennent
        • zéro, un ou plusieurs titres décrits comme des paragraphes
        • zéro, un ou plusieurs paragraphes

Chaque paragraphe est constitué de lignes contenant de manière combinée et imbriqués les uns dans les autres :

  • du texte
  • du texte biffé
  • du texte "codé" (un mot ou une expression utilisé pour un autre)
  • du texte en exposant
  • du texte en indice
  • du texte en ajout (le texte en ajout se distingue de l'interligne dans le sens où il est inséré dans la ligne d'écriture)
  • du texte en interligne
  • des dates
  • des lieux
  • des retours à la ligne
  • du texte en italique
  • du texte en gras
  • du texte souligné
  • du texte illisible (on ne met que la balise qui sera remplacée par *...*
  • du texte douteux (le transcripteur n'est pas sûr de sa lecture)
  • du texte en surcharge
  • du texte à vérifier (le transcripteur souhaite que ses collègues puissent vérifier sa transcription à un endroit précis)
  • du texte surligné (le transcripteur souhaite que soit mis en évidence ce texte)

En plus de cette organisation des éléments, certains peuvent avoir des propriétés :

  • la page
    • l'outil d'écriture principal (encre noire, encre rouge, crayon)
    • le type d'écriture principal (Calligraphie, Script, Normal)
    • le scripteur principal du contenu
  • les figures
    • le scripteur de la figure s'il diffère du scripteur principal de la page
    • la position verticale (haut, milieu, bas) sur la page
    • la position horizontale (gauche, centre, droit) sur la page
    • l'outil d'écriture s'il diffère de l'outil d'écriture principal de la page
    • le corpus auquel se rattache la figure, s'il diffère du corpus principal de la page
  • les paginations
    • le scripteur de la pagination (obligatoire pour obliger les transcripteurs à bien distinguer les paginations bibliothèque des paginations des scripteurs)
    • la position verticale (haut, milieu, bas) sur la page
    • la position horizontale (gauche, centre, droit) sur la page
    • l'outil d'écriture s'il diffère de l'outil d'écriture principal de la page
  • le texte
    • le décalage horizontal (gauche, droite)
    • le décalage vertical (haut, bas)
    • le document s'il diffère du document principal de la page
    • le corpus s'il diffère du document principal de la page
    • l'outil d'écriture s'il diffère de l'outil principal d'écriture de la page
    • le type d'écriture (Calligraphie, Script, Normal) s'il diffère du type principal d'écriture de la page
  • le titre
    • l'outil d'écriture s'il diffère de l'outil d'écriture principal de la page
    • le type d'écriture s'il diffère du type d'écriture principal de la page.
  • le paragraphe
    • le scripteur s'il diffère s'il diffère du scripteur principal du texte ou de la page
    • le corpus s'il diffère...
    • l'outil d'écriture s'il diffère...
    • le type d'écriture (Calligraphie, Script, Normal) s'il diffère...
  • le texte biffé
    • le scripteur s'il diffère du scripteur du texte
    • l'outil d'écriture (de biffe) s'il diffère de l'outil d'écriture du texte (ex: un texte à l'encre noire biffée au crayon)
  • le texte souligné
    • le scripteur s'il diffère du scripteur du texte
    • l'outil d'écriture (de soulignement) s'il diffère de l'outil d'écriture du texte (ex: un texte à l'encre noire souligné au crayon)
  • le code
    • l' équivalent du mot ou groupe de mot transcrit (ex: gouvernement quand on a gvt.)
    • l' estimation de cet équivalent (estimé, atteste)
    • la personne qui a effectué cette estimation (peut ne pas être le transcripteur)
  • la surcharge
    • le texte écrit en surcharge
    • le fait que la surcharge soit illisible ou pas
    • l' estimation de la surcharge (ex: "Pense" pour "P")
    • la personne qui a effectué cette estimation (peut ne pas être le transcripteur)
  • l'ajout
    • le scripteur s'il diffère du scripteur du paragraphe, du texte...
    • l'outil d'écriture s'il diffère...
    • le type d'écriture s'il diffère...
  • l'interligne (on distinguera l'ajout de l'interligne dans le sens où l'ajout est ponctuel et de petite taille alors que l'interligne se positionne entre des lignes d'écriture. Par ailleurs, l'interligne devra être donné "positionnellement", c'est à dire à l'endroit où il apparaît, donc avant la ligne qu'il corrige éventuellement.)
    • le scripteur s'il diffère du scripteur du paragraphe, du texte...
    • l'outil d'écriture s'il diffère...
    • le type d'écriture s'il diffère...
  • la date
    • l' équivalent lisible de la date (au format "jj-mm-aaaa")
    • l' estimation de la date (estimé, attesté)
    • la personne ayant estimé cette date
  • le lieu
    • l' équivalent du lieu ("Milan" pour "1000 ans")
    • l' estimation du lieu (estimé, attesté)
    • la personne ayant estimé le lieu
  • la marginale
    • le corpus auquel se rattache la marginale s'il diffère du corpu auquel se rattache la page
    • la date de rédaction de la marginale si elle diffère...
    • le lieu de rédaction de la marginale s'il diffère...
    • l'outil d'écriture de la marginale s'il diffère...
    • le type d'écriture de la marginale (Calligraphie, Script, Normal) s'il diffère...
    • la position verticale (haut, milieu, bas) de la marginale sur la page
    • la position horizontale (gauche, centre, droit) de la marginale sur la page

Comment transcrire

Installer l'outil Morphon XML Editor

J'ai un Mac

Télécharger le fichier suivant :

Le décompresser si votre système ne le fait pas automatiquement.

Pour lancer le logiciel, double cliquer sur "Morphon XML Editor" (icone verte) (Attention, ne pas utiliser l'icone similaire mais orange).

J'ai un PC sous Windows

Télécharger le fichier suivant :

Le décompresser si votre système ne le fait pas automatiquement.

Pour lancer le logiciel, double cliquer sur "Morphon XML Editor" (icone verte).

(Attention, ne pas utiliser l'icone similaire mais orange).

Les fichiers nécessaires

Télécharger la description de type de document :

Télécharger la feuille de style :

Placer ces deux fichiers dans un répertoire attribués uniquement à cet usage (soit sur votre bureau, soit dans vos documents).

ATTENTION : Ces fichiers sont importants, ils permettent de vous guider dans la transcription et de donner la bonne apparence du résultat. Ils seront régulièrement mis à jour (ils vous parviendront alors par mail) afin de tenir compte des besoins qui évolueront.

Ma première transcription

Lorsque vous lancez Morphon, vous obtenez l'écran suivant :

Créer un nouveau document XML

Cliquer sur le logo (en haut à gauche) représentant une page blanche ornée d'une croix jaune.

Le dialogue suivant apparaît :

Lors de la première utilisation, Morphon ne connaît pas encore la DTD (que Morphon appelle "Grammaire") ni la CSS (que Morphon appelle "Style"). Il faut donc les lui indiquer pour chacun :

  • sélectionner "Fichier" en face de "méthode"
  • cliquer sur "Explorer"
  • sélectionner le fichier "transcription.dtd" (pour la Grammaire) ou le fichier "transcription.css" (pour le style) puis cliquer sur OK.

Morphon se souviendra de la DTD et de la CSS pour les prochaines utilisations. Les deux apparaîtront dans la partie droite de la fenêtre de dialogue et il suffira de cliquer dessus pour les sélectionner (cf figure suivante).

Cliquer sur "Nouveau" pour créer le nouveau document XML.

Un dernier dialogue apparaît demandant de spécifier la "racine" du document.

Cliquer sur "Ordre de la grammaire" puis sur "page" puis sur OK.

Le but de cette opération est de dire à Morphon quelle partie de la structure vous allez décrire.

L'interface

L'interface de travail de Morphon se divise en 4 sections majeures (décrites et expliquées ci-après). Suivant la taille de votre écran et le confort de travail qui vous convient le mieux, vous pouvez choisir une présentation ou une autre.

Vous disposez d'un menu "Affichage" qui permet de basculer d'un mode de présentation à l'autre. Afin d'accéder à toutes les informations, les deux premiers modes sont à proscrire. Vous pouvez en revanche choisir librement entre la troisième et la quatrième.

J'ai personnellement opté pour la quatrième qui permet de voir l'intégralité de la page transcrite et mise en forme et qui facilite la lecture de l'arborescence.

L'arborescence du document

Le documet étant constitué selon l'idée qu'il est constitué de boîtes contenant des boîtes..., il peut être représenté sous la forme d'un arbre, à la manières des arborescences de répertoires d'un disque dur (comme avec l'explorateur de fichiers des systèmes d'exploitation).

Dans l'exemple ci-dessous, il s'agit de l'arbre de votre page lorsque vous n'avez pas encore enregistré de données.

Cet arbre est informatif de ce qui a été fait et de ce qui doit être fait :

  • Il s'agit d'une page (la pochette bleue qui contient les autres pochettes)
  • qui contient un descriptif
  • le fichier image qui fait partie du descriptif de la page n'a pas été défini (A en jaune)
  • de même pour le transcripteur (note : il peut y avoir plusieurs transcripteurs successifs, on pourra donc les ajouter)
  • de même pour le corpus (principal) auquel se rattache la page
  • de même pour le document (principal) auquel se rattache la page
  • la côte et le volume n'ont pas non plus été définis et un A rouge apparaît. La différence avec un A jaune est qu'une des propriétés (au moins) est un choix multiple et qu'aucun choix n'a été fait.
  • les propriétés physiques de la page n'ont pas été décrites.
  • les informations relatives à la date, au lieu de rédaction ainsi qu'aux commentaires sur la page apparaissent en revanche en bleu car ces champs sont facultatifs.

Définition des attributs (propriétés)

Les attributs (ou propriétés) sont définis par la grammaire (DTD) comme spécifiants certains éléments (blocs), de manière optionnelle ou obligatoire. En cliquant sur un élément (dossier bleu, A rouge ou A jaune) de l'arborescence, les attributs sont affichés dans la partie de l'écran qui leur est propre (en haut à droite en affichage vertial, en bas à gauche en affichage horizontal).

  • un attribut facultatif apparaîtra sur fond blanc
  • un attribut obligatoire qui n'a pas de valeur préféfinie apparaît en jaune
  • un attribut obligatoire qui correspond à une liste prédéfinie apparaît en rouge.

Si des attributs ne sont pas définis alors qu'ils devraient l'être, le document est considéré comme non-valide et ne pourra pas être affiché (ni interprété) correctement par un logiciel XML (excepté bien entendu un logiciel d'aide à la rédaction comme Morphon).

En cliquant sur "fichier_image" dans l'arbre, le nom de l'élément est encadré en bleu dans l'arbre et dans la partie "attributs", le(s) attribut(s) apparaissent comme une liste. Il suffit alors de cliquer en face du nom de chaque attribut (colonne "valeur").

Ajouter, insérer...

Morphon donne aussi l'information sur ce qu'il est possible de faire à un moment donné. Dans le coin en bas à droite de l'écran (quelque soit le mode d'affichage choisi).

Selon là où le curseur se trouve (un élément sélectionné, au sein d'un élément, un mot ou groupe de mots sélectionné dans un élément), il est possible :

  • d'insérer un élément : la liste est donnée. Attention : }ne JAMAIS choisir ce qui est proposé entre crochets ([Commentaire], [Entité], [Processing~Instruction], [basculter~TEXT/CDATA])!!!
  • selon le choix du mode d'insertion (avant, dans, après ou remplacer) la liste des possibles peut varier.
  • selon la position dans l'arbre et le mode la position à laquelle insérer.

La transcription en soi

La transcription apparaît au centre (dans l'affichage vertical) ou en haut à droite (dans l'affichage horizontal).

C'est là que le transcripteur tape le texte (ou le copier-colle).

La mise en forme se fait automatiquement grâce à la feuille de style. Seul le positionnement des images, paginations et marginales n'apparaît pas.

Dans la figure suivante, aucune donnée de transcription n'a été donnée. La partie haute (encadrée avec un trait fin) rappele les données de description de la page. La partie basse (encadrée avec un trait large) montre la transcription.

Transcription simple

Pour cette première transcription, nous avons pris la page R5896, vol 7 f°253 recto.

Première étape : créer un nouveau document

... et le sauvegarder immédiatement (même vide) avec comme nom de fichier le nom de l'image mais en finissant le nom de fichier par ".XML". Dans notre cas, le fichier sera nommé "5896-07-507.xml" (peu importe que xml soit en majuscules ou en minuscules).

Deuxième étape : remplir les informations relatives au document

  • le nom du fichier image correspondant en attribut de fichier image (5896-07-507.JPG)
  • le transcripteur et la date de transcription (respecter la norme "JJ MM AAAA") en attribut de transcripteur
  • le nom du corpus en attribut de corpus
  • le nom du document en attribut de document
  • la cote, le volume, le type de page (recto, verso, tranche haute...) et le numéro éventuel de page en attributs de cote volume
  • la hauteur, la largeur et le type de papier de la page en attributs de propriétés physiques
  • la date éventuelle de rédaction (date indiquée, critère et équivalent "JJ MM AAAA")
  • le lieu éventuel de rédaction (lieu indiqué, critère et équivalent)
  • le commentaire

Seul le commentaire n'est pas défini par des attributs, mais consiste en du texte (qui a les mêmes propriétés que du texte de transcription et qui peut donc être biffé, souligné...). Vous rédigerez le texte du commentaire directement dans la zone d'affichage. Le retour à la ligne se fait automatiquemet en tapant sur la touche "retour chariot".

Il est aussi possible d'ajouter des paragraphes afin de mieux présenter le commentaire : lorsque vous souhaitez passer au paragraphe suivant, cliquer sur "Après" dans le "mode", puis sur "paragraphe" dans "position", puis sur "paragraphe dans "éléments" et enfin sur le bouton "insérer". Cliquer sur le début du paragraphe et commencer à taper le contenu de ce paragraphe.

Troisième étape : taper le texte au kilomètre

... en ne faisant que les retours à la ligne (touche entrer / retour chariot) et en indiquant les changements de paragraphes (lorsque vous souhaitez passer au paragraphe suivant, cliquer sur "Après" dans le "mode", puis sur "paragraphe" dans "position", puis sur "paragraphe dans "éléments" et enfin sur le bouton "insérer". Cliquer sur le début du paragraphe et commencer à taper le contenu de ce paragraphe).

NB: si le texte transcrit existe déjà (sous Word par exemple), il est possible d'en faire du copier-coller. Toutefois, la mise en forme (retours à la ligne, paragraphes, biffé, gras\ldots) ne sera pas préservée.

Quatrième étape : mettre en forme

Pour ce faire, sélectionner le(s) mot(s) concerné(s) par la mise en forme et double-cliquer sur la mise en forme correspondante dans "éléments".

  • ajout vous permet facultativement de spécifier le scripteur, l'outil d'écriture et le type d'écriture (en attributs)
  • averifier vous permet d'indiquer à vos collègues que vous souhaitez faire vérifier ce point de transcripton. La personne qui vérifiera la transcription pourra alors changer la valeur de l'attrbut "verifie" à oui.
  • biffe vous permet facultativement de spécifier l'outil de biffe et le scripteur
  • code vous impose de spécifier l'équivalent, s'il s'agit d'une estimation ou d'une valeur attestée et de préciser qui est l'auteur de cette estimation. code est à utiliser uniquement pour les utilisations exceptionnelles ou ambiguës de codes. S'il est prévu d'insérer le mot codé dans le dictionnaire, ne pas le noter dans la transcription. Exemple "Milan" peut faire référence à la ville ou à Napoléon. Aucune analyse automatique ne saura faire ce type d'interprétation. Il est donc nécessaire d'indiquer que Milan est un code lorsqu'il s'agit de Napoléon, d'un lieu lorsqu'il s'agit de la ville.
  • date vous impose d'indiquer l'équivalent (format "JJ MM AAAA"), s'il s'agit d'une estimation ou si la valeur est attestée ainsi que la personne qui effectue cette estimation.
  • douteux marquera des chevrons (en rouge pour les rendre bien visibles et bien distincts du texte) autour du mot ou du groupe de mots
  • exposant met uniquement en forme
  • gras idem
  • illisible ne s'applique pas à un mot ou groupe de mot, mais est un marqueur indiquant qu'un mot ou groupe de mot est illisible. L'attribut "long" est à faux par défaut (illisible est remplacé par $*...*$) mais peut être changé en "vrai" (illisible sera alors replacé par $*......*$).
  • indice met uniquement en forme
  • interligne permet facultativement de spécifier l'outil d'écriture, le type d'écriture et le scripteur. Attention, l'interligne doit être spécifiée positionnellement, c'est à dire là où elle apparaît.
  • lieu impose d'indiquer l'équivalent (ex: "Milan" pour "1000 ans"), s'il s'agit d'une estimation ou si la valeur est attestée ainsi que la personne qui effectue cette estimation
  • souligne permet facultativement de spécifier l'outil d'écriture et le scripteur
  • surcharge impose d'indiquer le texte écrit en surcharge (attribut "ecrit"), l'estimation de l'intention du scripteur (attribut "estimation") et si cette surcharge est illisible ou pas (attribut "illisible")
  • surligne met en forme uniquement. Il va de soi que Stendhal et ses contemporains ne disposaient pas de marqueurs fluorescents. Cet outil a été mis en place pour les besoins des transcripteurs. Son usage devrait se limiter au surlignage des commentaires.

Tous les éléments disposent d'un attribut facultatif de commentaire. Ces commentaires peuvent être d'ordre littéraire, génétique ou un moyen de transmettre une information au comité de validation. A vous d'en faire bon usage.

Cinquième étape : ajouter les paginations

  • Cliquer dans l'arbre sur "contenu"
  • Cliquer dans "mode" sur "dans"
  • Cliquer dans "positions" sur la position qui convient le mieux (en début de contenu apparaîtra en haut de la transcription)
  • Cliquer dans "éléments" sur "pagination"

La marginale est constituée d'un élément ligne ce qui permet de biffer éventuellement la pagination, la mettre en gras...

Des attributs doivent être renseignés, notamment la position verticale (haut, milieu, bas) et horizontale (gauche, centre, droite) de la pagination. Attention, cette position ne se matérialise pas à l'affichage, Morphon ne gérant pas ce type d'information, mais ces informations seront utilisées ultérieurement pour la mise en ligne des transcriptions.

L'attribut scripteur de la pagination doit être renseigné, l'attribut outil d'écriture est facultatif.

Sixième étape : ajouter les figures

Même principe que pour les paginations :

  • Cliquer dans l'arbre sur "contenu"
  • Cliquer dans "mode" sur "dans"
  • Cliquer dans "positions" sur la position qui convient le mieux (en début de contenu apparaîtra en haut de la transcription)
  • Cliquer dans "éléments" sur figure

La figure est constituée d'un ou plusieurs éléments paragraphe, ce qui permet de transcrire pseudo-diplomatiquement le texte contenu éventuellement dans la figure.

Des attributs doivent être renseignés, notamment la position verticale (haut, milieu, bas) et horizontale (gauche, centre, droite) de la figure. Attention, cette position ne se matérialise pas à l'affichage, Morphon ne gérant pas ce type d'information, mais ces informations seront utilisées ultérieurement pour la mise en ligne des transcriptions.

L'attribut scripteur de la figure et l'attribut outil d'écriture sont facultatifs.

Septième étape : ajouter les marginales

Même principe que pour les paginations et les figures :

  • Cliquer dans l'arbre sur "contenu"
  • Cliquer dans "mode" sur "dans"
  • Cliquer dans "positions" sur la position qui convient le mieux (en début de contenu apparaîtra en haut de la transcription)
  • Cliquer dans "éléments" sur "marginale"

La marginale est constituée d'un ou plusieurs éléments paragraphe.

Des attributs doivent être renseignés, notamment la position verticale (haut, milieu, bas) et horizontale (gauche, centre, droite) de la marginale. Attention, cette position ne se matérialise pas à l'affichage, Morphon ne gérant pas ce type d'information, mais ces informations seront utilisées ultérieurement pour la mise en ligne des transcriptions.

L'attribut scripteur de la marginale et l'attribut outil d'écriture sont facultatifs.

Foire aux questions

Les "blancs" dans le manuscrit

Lorsque vous vous trouvez face à un "blanc" dans les manuscrits, il est impossible de le transcrire par une suite d'espaces, XML ne le permettant pas. Il faut donc transcrire ce "blanc" avec une suite de tirets-bas ("_", touche 8 sur le haut du clavier des PC, touche "-" sur le haut des clavier des Macs).

La séquence de "_" sera remplacée à l'affichage en ligne par un blanc de taille équivalente dans la version finale sur le Web.

Les grands interlignes

Il arrive que le scripteur laisse un espace important entre deux paragraphes. La solution la plus pratique dans la transcription est d'insérer plusieurs paragraphes vides.

Fichier DTD renommé par Micro$oft Windows

Lorsque vous téléchargez le fichier DTD depuis un ordinateur sous Micro$oft Windows, il arrive que le système d'exploitation reomme le fichier avec une extension ".txt", ce qui risque de gêner Morphon.

  • Double cliquez sur poste de travail et accédez au répertoire où vous avez enregistré le fichier DTD.
  • dans le menu "outils" sélectionnez "option des dossiers"
  • sélectionnez l'onglet "affiage"
  • dans la partie "paramètres avancés", assurez-vous que "Masquer les extensions des fichiers dontle type est connu" n'est PAS COCHE.
  • cliquez sur OK
  • dans la fenêtre du poste de travail, faites un clic droit sur le fichier mal nommé "transcription.dtd.txt" et sélectionnez "renommer" dans le menu déroulant
  • enlevez le ".txt" en trop puis enfoncez la touche "entrer" (retour chariot, retour à la ligne)
  • un message vous dira "Si vous modfiez l'extension d'un fichier, le fichier risque d'être inutilisable. Vouloez-vous vraiment modifier l'extension" : cliquez sur "oui".
  • Le tour est joué.

Windows demande ActivX

Il semblerait que certaines versions de Micro\$oft Windows exige l'installation d'ActivX pour installer Java.

Je n'ai pour l'instant pas de solution à proposer, ActivX n'ayant aucun rapport avec Java.

Attention à bien choisir d'installer Java Runtime Environment (JRE) et non Java Development Kit (JDK).

Comment nommer mes fichiers XML

Les fichiers XML doivent être nommés précisemment pour pouvoir être traités plus facilement par la base de données.

Le nom doit correspondre au motif suivant : cote-volume-nom_du_fichier_jpg.xml

Ainsi, pour l'image 001.jpg du volume 7 de cote 5896, le fichier XML sera nommé 5896-7-001.xml

Je veux renommer mon fichier

Option 1 :

Le document est déjà ouvert avec Morphon. Menu "fichier" puis "sauvegarder sous" et donner le nouveau nom.

Inconvénient : l'ancien fichier existe encore et il est aussi présent dans les signets de Morphon (la liste des fichiers proposés quand vous faites "ouvrir").

Option 2 :

Avec le poste de travail Windows, retrouvez le fichier XML mal nommé, click-droit sur le nom du fichier, sélectionner "renommer" et donner le nouveau nom puis taper la touche "entrer".

Inconvénient : Morphon n'a pas le nouveau nom de fichier dans ses signets et a en revanche gardé l'ancien nom.

NB : pour effacer un signet de Morphon, il suffit de faire un click-droit sur le signet puis sélectionner "supprimer le signet".

Copier-Coller le descriptif pour ne pas le remplir à nouveau

Pré-requis : vous avez déjà fait une fiche.

  1. ouvrez la fiche existante
  2. dans l'arbre, sélectionnez le noeud (ce qui ressemble à un dossier) "descriptif"
  3. faites ensuite un clic droit dessus puis cliquez sur "copier"
  4. créez un nouveau document (en choisissant bien la DTD et la CSS, bien entendu)
  5. dans l'arbre du nouveau document cliquez sur "descriptif"
  6. faites un clic droit dessus puis cliquez sur "supprimer"
  7. dans l'arbre du nouveau document cliquez sur "page"
  8. faites un clic droit sur "page" puis cliquez sur "copier dans"

et le tour est joué.

il ne reste qu'à modifier certains détails du descriptif.

Même si ce descriptif paraît un peu long, après l'avoir fait deux ou trois fois, vous le ferez en 5 secondes.

Les commentaires

Les commentaires sont possibles à plusieurs niveaux dans la transcription.

Les commentaires du transcripteur dans le "descriptif" seront isibles de tous lors de la mise en ligne.

Les commentaires appliqués aux mots, lignes, paragraphes\ldots sont uniquement à destination de l'équipe des Manuscrits.


Page last modified on April 27, 2008, at 09:06 PM EST

CrawlTrack: free crawlers and spiders tracking script for webmaster- SEO script -script gratuit de dŽtection des robots pour webmaster