Comments (8)
Le format ALTO ne permet pas de rajouter des balises au texte, parce que le texte est encodé comme le valeur d'un attribut d'un élément. Dans le format PAGE, par contre, le texte est balisé d'un élément, spécifiquement l'élément <Unicode>
.
Si on choisissait le format ALTO, on n'aurait pas besoin de rajouter des balises pour l'italique, etc. puisque on n'aurait pu. De plus, je crois que le format ALTO est préféré parce qu'il permet de mieux aligner l'encodage avec l'image, ce qu'on ne va pas faire dans le cadre de ce projet mais qui est généralement souhaité.
(D'ailleurs je viens de pusher les xml PAGE et ALTO vers ma branche.)
from tnah-2021-expositions_universelles.
moi j'ai pris PAGE mais on dirait que la préférence est pour ALTO ? si c'est le cas je peux tout reexporter dans l'autre format
from tnah-2021-expositions_universelles.
en format PAGE, si on met une balise dans l'élément <Unicode/>
, on reçoit un message d'erreur :
L'élément Unicode est un type simple, il ne doit donc pas avoir d'article d'informations d'éléments [children]
donc, si on traduit : impossible de mettre de l'italique ou des balises de style, ni dans PAGE, ni dans ALTO. ce qui nous ramène à la graaande question : quel format utilise-t-on ?
from tnah-2021-expositions_universelles.
Kelly avait dit que monsieur Clérice préférait le format Alto
from tnah-2021-expositions_universelles.
Par ailleurs, que pensez-vous de rajouter, en plus des transcriptions xml de nos textes, les fichiers png que l'on peut avoir de ces derniers avec l'option "include image" de escriptorium?
from tnah-2021-expositions_universelles.
de mon côté c'est fait ; j'ai aussi fait correspondre les noms des fichiers png avec les noms des documents XML produits ; si on renomme les png, alors il faut aussi modifier le XML l'élément <sourceImageInformation/>
pour qu'il colle avec le nom du png ; par exemple, dans mon cas:
<sourceImageInformation>
<fileName>PAUL_Des-differences_p274.png</fileName>
</sourceImageInformation>
(oui c'est une petite complexité supplémentaire fort amusante)
from tnah-2021-expositions_universelles.
Bonjour à tous ! Je retiens donc de faire mon export en Alto.
from tnah-2021-expositions_universelles.
Bonjour, oui, le fichier Alto avec les images.
from tnah-2021-expositions_universelles.
Related Issues (13)
- Sélectionner ton extrait du document
- Caractères étrangères HOT 8
- Bibliographie HOT 8
- readme / latex / rendu HOT 11
- structuration de la branche `main` et du rendu HOT 7
- Structure du répositoire / dynamique de travail HOT 3
- Issue Labels HOT 2
- eScriptorium main script non latin HOT 2
- Textes à transcrire HOT 5
- Numéro de page HOT 9
- Fusionner les retranscriptions d'un même article HOT 5
- Définitions des caractères des texte HOT 7
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from tnah-2021-expositions_universelles.