Comments (15)
le nommage des fichiers est un peu ambiguë car nous ne savons pas si "transcription" fait référence à la transcription d'eScriptorium non corrigée ou bien à celle corrigée par nos propres soins selon les normes de transcription qu'on aura définies.
from tnah-2021-projet-correspondance-berlioz.
D'accord avec toi pour les fichiers de transcription brute, j'avais en effet oublié de l'indiquer.
Le format de date me semble bien (nous nous adressons avant tout à des francophones). Je propose du coup d'incorporer les tirets du bas (et de supprimer l'espace entre Lettre et l'ID, si cela vous va ?) mais de peut-être garder les tirets du milieu à l'intérieur des dates.
Ce qui donnerait par exemple : LettreID_JJ-MM-AAAA_transcriptionBrute_numéroDImage
from tnah-2021-projet-correspondance-berlioz.
il faudrait également ajouter le numéro des images dans le nommage des fichiers afin de savoir laquelle image on a transcrit.
Lettre-ID-date-transcription-numéro d'image
from tnah-2021-projet-correspondance-berlioz.
Après réflexion, peut-être vaut-il mieux faire des exports en format texte brut pour le moment, afin de faciliter la relecture et l'entraide sur les transcriptions. Je ne pense pas que le format XML ALTO soit nécessairement utile à ce stade, même s'il serait bon de l'inclure en fin de projet (étant donné qu'il conserve le lien entre le texte et l'image).
from tnah-2021-projet-correspondance-berlioz.
En effet ! De manière plus globale, je propose que nous adoptions des conventions / une même organisation pour les dossiers également, afin de mieux nous y retrouver. Je propose cette organisation :
- Pour chaque lettre, un dossier nommé : “Lettre ID - date”.
- Dans ce dossier, les transcriptions terminées au format .txt nommée : “Lettre ID-date-transcription-numéro d'image”.
- Les images de la lettre, réunies dans un fichier unique nommé : “Lettre ID - date”.
- Un sous dossier nommé “Transcriptions brutes” avec dedans les transcriptions brutes d’eScriptorium (afin de rendre compte du travail de transcription réalisé, ainsi que de l’efficacité initiale du modèle utilisé).
Et, une fois la transcription définitivement terminée et corrigée :
- Les transcriptions au format ALTO nommées “Lettre ID - date - ALTO - numéro d'image”.
Qu'en pensez-vous ?
from tnah-2021-projet-correspondance-berlioz.
Cela est parfait pour moi Cécile. Juste, en ce qui concerne les fichiers de transcription brute d'eScriptorium, comment on les nomme ? Est-ce que cela irait : "Lettre-ID-date-transcriptionBrute-numéro d'image" ?
Aussi, je pense que nous devrions utiliser les underscore plutôt que les tirets, cela serait plus clair. Qu'en pensez-vous ?
from tnah-2021-projet-correspondance-berlioz.
J'approuve ta proposition.
from tnah-2021-projet-correspondance-berlioz.
D'accord, cela me semble bien !
from tnah-2021-projet-correspondance-berlioz.
Oui effectivement c'est mieux. On fait comme cela alors.
from tnah-2021-projet-correspondance-berlioz.
Je suis d'accord pour les conventions de nommage.
Toutefois, il faudrait préciser davantage la manière d'écrire la date.
Par exemple pour nommer le fichier contenant les images de la lettre datant du 4 novembre 1823, on pourrait faire la chose suivante: Lettre-1-04-11-1823
from tnah-2021-projet-correspondance-berlioz.
Ok ça me va Lien pour la convention des dates.
from tnah-2021-projet-correspondance-berlioz.
oui je suis d'accord avec toi Fanny
from tnah-2021-projet-correspondance-berlioz.
oui c'est mieux. Cela permet de différencier l'ID de la lettre et sa date.
from tnah-2021-projet-correspondance-berlioz.
Parfait pour moi !
from tnah-2021-projet-correspondance-berlioz.
Très bien, nous allons pouvoir formaliser tout cela dans un compte-rendu !
from tnah-2021-projet-correspondance-berlioz.
Related Issues (19)
- Renommer le titre du projet HOT 11
- proposition d'organisation de l'équipe pour la résolution des problèmes de transcription HOT 4
- Création d'un tableau de gestion HOT 3
- réflexion normes de transcription HOT 36
- Problèmes sur eScriptorium HOT 11
- Problèmes git et github HOT 14
- Doutes transcription lettre 3 HOT 7
- Remplir le README pour une meilleure documentation HOT 7
- Citation de la source des images (conditions d'utilisation Gallica) HOT 7
- doutes transcription lettre 1 HOT 9
- doutes transcription lettre 2 HOT 6
- Intégration continue : relecture des transcriptions HOT 4
- Lettre5_05-02-1942 : doutes sur la transcription HOT 9
- Doutes transcription lettre 4 HOT 9
- rédaction du rapport HOT 11
- Doutes transcription lettre 6 HOT 2
- Gestion finale des branches HOT 3
- Que vont devenir les liens du Readme après le transfert de propriété du dépôt ? HOT 3
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from tnah-2021-projet-correspondance-berlioz.