Code Monkey home page Code Monkey logo

Comments (8)

kat-kel avatar kat-kel commented on July 19, 2024 1

Le format ALTO ne permet pas de rajouter des balises au texte, parce que le texte est encodé comme le valeur d'un attribut d'un élément. Dans le format PAGE, par contre, le texte est balisé d'un élément, spécifiquement l'élément <Unicode>.

Si on choisissait le format ALTO, on n'aurait pas besoin de rajouter des balises pour l'italique, etc. puisque on n'aurait pu. De plus, je crois que le format ALTO est préféré parce qu'il permet de mieux aligner l'encodage avec l'image, ce qu'on ne va pas faire dans le cadre de ce projet mais qui est généralement souhaité.

(D'ailleurs je viens de pusher les xml PAGE et ALTO vers ma branche.)

from tnah-2021-expositions_universelles.

paulhectork avatar paulhectork commented on July 19, 2024

moi j'ai pris PAGE mais on dirait que la préférence est pour ALTO ? si c'est le cas je peux tout reexporter dans l'autre format

from tnah-2021-expositions_universelles.

paulhectork avatar paulhectork commented on July 19, 2024

en format PAGE, si on met une balise dans l'élément <Unicode/>, on reçoit un message d'erreur :

L'élément Unicode est un type simple, il ne doit donc pas avoir d'article d'informations d'éléments [children]

donc, si on traduit : impossible de mettre de l'italique ou des balises de style, ni dans PAGE, ni dans ALTO. ce qui nous ramène à la graaande question : quel format utilise-t-on ?

from tnah-2021-expositions_universelles.

baudbaudy avatar baudbaudy commented on July 19, 2024

Kelly avait dit que monsieur Clérice préférait le format Alto

from tnah-2021-expositions_universelles.

baudbaudy avatar baudbaudy commented on July 19, 2024

Par ailleurs, que pensez-vous de rajouter, en plus des transcriptions xml de nos textes, les fichiers png que l'on peut avoir de ces derniers avec l'option "include image" de escriptorium?

from tnah-2021-expositions_universelles.

paulhectork avatar paulhectork commented on July 19, 2024

de mon côté c'est fait ; j'ai aussi fait correspondre les noms des fichiers png avec les noms des documents XML produits ; si on renomme les png, alors il faut aussi modifier le XML l'élément <sourceImageInformation/> pour qu'il colle avec le nom du png ; par exemple, dans mon cas:

<sourceImageInformation>
   <fileName>PAUL_Des-differences_p274.png</fileName>
</sourceImageInformation>

(oui c'est une petite complexité supplémentaire fort amusante)

from tnah-2021-expositions_universelles.

Oeconomo avatar Oeconomo commented on July 19, 2024

Bonjour à tous ! Je retiens donc de faire mon export en Alto.

from tnah-2021-expositions_universelles.

anahihaedo avatar anahihaedo commented on July 19, 2024

Bonjour, oui, le fichier Alto avec les images.

from tnah-2021-expositions_universelles.

Related Issues (13)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.