Code Monkey home page Code Monkey logo

Comments (15)

Lienceard avatar Lienceard commented on July 2, 2024 2

le nommage des fichiers est un peu ambiguë car nous ne savons pas si "transcription" fait référence à la transcription d'eScriptorium non corrigée ou bien à celle corrigée par nos propres soins selon les normes de transcription qu'on aura définies.

from tnah-2021-projet-correspondance-berlioz.

SjdkC avatar SjdkC commented on July 2, 2024 2

D'accord avec toi pour les fichiers de transcription brute, j'avais en effet oublié de l'indiquer.

Le format de date me semble bien (nous nous adressons avant tout à des francophones). Je propose du coup d'incorporer les tirets du bas (et de supprimer l'espace entre Lettre et l'ID, si cela vous va ?) mais de peut-être garder les tirets du milieu à l'intérieur des dates.

Ce qui donnerait par exemple : LettreID_JJ-MM-AAAA_transcriptionBrute_numéroDImage

from tnah-2021-projet-correspondance-berlioz.

Lienceard avatar Lienceard commented on July 2, 2024 1

il faudrait également ajouter le numéro des images dans le nommage des fichiers afin de savoir laquelle image on a transcrit.
Lettre-ID-date-transcription-numéro d'image

from tnah-2021-projet-correspondance-berlioz.

SjdkC avatar SjdkC commented on July 2, 2024 1

Après réflexion, peut-être vaut-il mieux faire des exports en format texte brut pour le moment, afin de faciliter la relecture et l'entraide sur les transcriptions. Je ne pense pas que le format XML ALTO soit nécessairement utile à ce stade, même s'il serait bon de l'inclure en fin de projet (étant donné qu'il conserve le lien entre le texte et l'image).

from tnah-2021-projet-correspondance-berlioz.

SjdkC avatar SjdkC commented on July 2, 2024 1

En effet ! De manière plus globale, je propose que nous adoptions des conventions / une même organisation pour les dossiers également, afin de mieux nous y retrouver. Je propose cette organisation :

  • Pour chaque lettre, un dossier nommé : “Lettre ID - date”.
  • Dans ce dossier, les transcriptions terminées au format .txt nommée : “Lettre ID-date-transcription-numéro d'image”.
  • Les images de la lettre, réunies dans un fichier unique nommé : “Lettre ID - date”.
  • Un sous dossier nommé “Transcriptions brutes” avec dedans les transcriptions brutes d’eScriptorium (afin de rendre compte du travail de transcription réalisé, ainsi que de l’efficacité initiale du modèle utilisé).

Et, une fois la transcription définitivement terminée et corrigée :

  • Les transcriptions au format ALTO nommées “Lettre ID - date - ALTO - numéro d'image”.

Qu'en pensez-vous ?

from tnah-2021-projet-correspondance-berlioz.

FannyLbr avatar FannyLbr commented on July 2, 2024 1

Cela est parfait pour moi Cécile. Juste, en ce qui concerne les fichiers de transcription brute d'eScriptorium, comment on les nomme ? Est-ce que cela irait : "Lettre-ID-date-transcriptionBrute-numéro d'image" ?
Aussi, je pense que nous devrions utiliser les underscore plutôt que les tirets, cela serait plus clair. Qu'en pensez-vous ?

from tnah-2021-projet-correspondance-berlioz.

Lienceard avatar Lienceard commented on July 2, 2024

J'approuve ta proposition.

from tnah-2021-projet-correspondance-berlioz.

SjdkC avatar SjdkC commented on July 2, 2024

D'accord, cela me semble bien !

from tnah-2021-projet-correspondance-berlioz.

FannyLbr avatar FannyLbr commented on July 2, 2024

Oui effectivement c'est mieux. On fait comme cela alors.

from tnah-2021-projet-correspondance-berlioz.

Lienceard avatar Lienceard commented on July 2, 2024

Je suis d'accord pour les conventions de nommage.
Toutefois, il faudrait préciser davantage la manière d'écrire la date.
Par exemple pour nommer le fichier contenant les images de la lettre datant du 4 novembre 1823, on pourrait faire la chose suivante: Lettre-1-04-11-1823

from tnah-2021-projet-correspondance-berlioz.

FannyLbr avatar FannyLbr commented on July 2, 2024

Ok ça me va Lien pour la convention des dates.

from tnah-2021-projet-correspondance-berlioz.

Lienceard avatar Lienceard commented on July 2, 2024

oui je suis d'accord avec toi Fanny

from tnah-2021-projet-correspondance-berlioz.

Lienceard avatar Lienceard commented on July 2, 2024

oui c'est mieux. Cela permet de différencier l'ID de la lettre et sa date.

from tnah-2021-projet-correspondance-berlioz.

FannyLbr avatar FannyLbr commented on July 2, 2024

Parfait pour moi !

from tnah-2021-projet-correspondance-berlioz.

SjdkC avatar SjdkC commented on July 2, 2024

Très bien, nous allons pouvoir formaliser tout cela dans un compte-rendu !

from tnah-2021-projet-correspondance-berlioz.

Related Issues (19)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.