Code Monkey home page Code Monkey logo

tnah-2021-projet-correspondance-berlioz's People

Contributors

fannylbr avatar lienceard avatar ponteineptique avatar sjdkc avatar

Watchers

 avatar

Forkers

fannylbr sjdkc

tnah-2021-projet-correspondance-berlioz's Issues

Lettre5_05-02-1942 : doutes sur la transcription

Bonjour à toutes,

Je sollicite votre aide concernant quelques doutes que j'ai vis-à-vis de la transcription de la lettre 5. J'ai joint des images, mais n'hésitez pas à vous reporter à la version Gallica ou aux transcriptions sur ma branche.

  1. Image 1, ligne 2 (et oui, déjà !)
    Capture d’écran du 2021-12-30 23-58-51
    J'ai un doute sur les deux derniers mots : petit-opéra ou petite opéra. Je penche plutôt pour la première hypothèse, mais dites moi ce que vous en pensez.

  2. Image 1, ligne 5
    image
    pour les modistes ou pour les modestes ? Là aussi, je penche plutôt pour la première hypothèse, puisque Berlioz parle de marchandes de modes un peu plus haut...

  3. Image 1, ligne 22
    image
    Mon doute porte sur les signes qui suivent C'est un enfer !. Pour le contexte, il s'agit d'une citation. J'ai donc tendance à lire "-. Cependant la citation ne s'ouvre pas avec des guillemets, ce qui me fait douter de mon interprétation.

  4. Image 2, ligne 5
    image
    Le mot du milieu me pose problème. Je lis l'ours, mais cela n'a pas beaucoup de sens.

  5. Image 3, ligne 32 (première ligne verticale)
    image
    Ma question porte ici sur le premier mot. Je lis scribe mais, là encore, cela ne semble pas coller au contexte.

Je vous remercie par avance pour vos retours !

doutes transcription lettre 1

Bonjour,

J'aurais aimé être aidée dans la transcription de ma lettre 1. J'ai des doutes sur la transcription de certains passages.

image 1:

  • ligne 14:

J'ai lu "persister dans ma resolution et d'esor du temps qui m'a été". Mais je ne suis pas sûre qu' "esor" soit le bon mot.

esor du temps

image 2:

  • ligne 11:

J'ai lu "d'imnactite de, toutes ses commissions sont faites depuis". Mais je ne pense pas qu"imnactite" soit le bon mot. le "de" situé juste après, va peut-être avec le mot précédent ?

inactide

-ligne 15:

J'ai lu "Adele m'avoit promis de m'ecrire je". Les "a" et les "o" se ressemblent beaucoup. Si bien que je me demande si c'est "avait" ou "avoit".

avoit

Si les captures d'écran sont de trop petites tailles et qu'un complément contextuel est nécessaire à la compréhension de ces passages, vous pouvez vous référer aux images en pdf contenues dans le dossier "Lettre1_04-11-1823 sur la branche "Lien".

Qu'en pensez-vous?

Je vous remercie d'avance pour votre aide apportée.

proposition d'organisation de l'équipe pour la résolution des problèmes de transcription

Bonjour à toutes,

Nous allons rencontrer très prochainement des problèmes de transcription avec les lettres de la correspondance d'Hector Berlioz.
C'est pourquoi je pensais à des pistes d'évolution de notre dépôt actuel.
On pourrait créer une branche de travail commune sur laquelle on déposerait un dossier contenant l'ensemble des lettres en format pdf et issues de Gallica. Ainsi chacune pourrait s'y référer quand l'une d'entre nous aurait un problème de transcription et demanderait de l'aide au groupe.
On pourrait également créer une issue pour chacune des lettres avec laquelle nous rencontrerions des difficultés. Cela permettrait de ne pas démultiplier les issues à chaque problème de transcription rencontré.

Merci par avance pour vos retours

Que vont devenir les liens du Readme après le transfert de propriété du dépôt ?

Bonjour à toutes !

Le projet touche à sa fin et nous allons bientôt devoir en transférer la propriété à l'organisation PSL-Chartes-HTR-Students. Je pense que ce transfert risque de poser problème concernant les liens internes que nous avons formalisé dans le Readme, de même que dans le fichier du tableau de gestion. En effet, le transfert de propriété devrait changer l'url du dépôt, ce qui cassera sans doute les liens internes.

Il nous serait peut-être possible de changer les liens fautifs une fois le transfert de propriété effectué, mais je ne sais pas si cela est très correct, étant donné que le transfert de propriété équivaut à une remise pour évaluation (il est alors peut-être malvenu de modifier notre travail après cette remise). De plus, le problème se poserait à nouveau si le dépôt est à nouveau transféré à l'avenir, pour une raison ou une autre.

Pour ces raisons, je propose la suppression de ces liens internes. Cela ne me semble pas nécessairement dommageable, puisque par ailleurs nous expliquons bien l'architecture de notre dépôt.

Qu'en pensez-vous ?

Doutes transcription lettre 4

Bonjour,

Je vous fais part, ici, de mes incertitudes de transcription concernant la lettre 4.

Image 2 :

  • Ligne 6 : le dernier mot de la ligne est-il bien "tache" ?
    Capture d’écran de 2021-12-28 11-25-36

  • Lignes 26-27 : le début de ces deux lignes manque (partie déchirée) et m'empêche de comprendre le sens du passage. Cela m'embête, car je n'arrive pas à déchiffrer la fin de la ligne 26. Je lis : "une pension qu... trente". Mais avec l'absence des mots précédant et succédant ce passage, c'est compliqué de déchiffrer.
    Capture d’écran de 2021-12-28 11-32-59

Si mes captures d'écran ne sont pas suffisantes, je vous laisse vous référer au pdf présent dans le dossier de cette lettre sur ma branche.

Je vous remercie par avance pour votre aide !

Citation de la source des images (conditions d'utilisation Gallica)

Bonsoir,

Après consultation des conditions d'utilisation des contenus de Gallica, il semblerait qu'il n'y a pas de problème à inclure les images des lettres dans notre dépôt. En revanche, les conditions d'utilisation imposent un modèle pour citer la source des documents :

La réutilisation non commerciale de ces contenus est libre et gratuite dans le respect de la législation en vigueur et notamment du maintien de la mention de source des contenus telle que précisée ci-après : « Source gallica.bnf.fr / Bibliothèque nationale de France » ou « Source gallica.bnf.fr / BnF ».

Lorsque nous téléchargeons le pdf de nos lettres depuis Gallica, deux pages sont inclues avant le document en lui-même : une page comportant le titre du document et la fameuse mention de source, et une deuxième comprenant des informations légales.
Je me demande donc si nous ne devrions pas garder ces deux pages lorsque nous ajoutons les pdf dans nos dossiers respectifs.

Si nous ne voulons pas que ces deux pages apparaissent pour chaque lettre, une autre solution pourrait être d'inscrire la mention de source dans le README, accompagnée d'un renvoi vers les conditions générales de Gallica. Cependant, il me semble peut-être préférable de ne pas toucher au pdf d'origine, par soucis de facilité et de transparence.

Qu'en pensez-vous ?
Merci par avance pour vos réponses !

Remplir le README pour une meilleure documentation

Bonjour à toutes,

J'ouvre cette issue pour discuter du contenu du README, qui devrait servir de présentation au projet. En effet, puisque nous devons partir du principe que de nouveaux participants pourraient rejoindre le projet à tout moment, il me semble important de le remplir dès maintenant, sans attendre la fin du projet.

Je propose donc d'inscrire dans le README :

  1. Un paragraphe de présentation du projet :

    • Contexte : rappeler que ce projet a été créé dans le cadre du module Git dispensé par Thibault Clérice pour le M2 TNAH de l'ENC.
    • Objectifs : rappel de la consigne du devoir.
    • Corpus : lien vers le recueil Gallica des lettres de Berlioz à sa soeur, et éventuellement rappel (sommaire) de celles que nous avons pour le moment retenues.
    • Projet : faire le lien avec les problématiques d'HTR, l'intérêt du corpus.
  2. Une description de l'architecture du dépôt, avec un renvoi vers les fichiers organisationnels importants, notamment le tableau de bord et le fichier sur les conventions de nommage et les choix d'exports (et par la suite, vers celui qui concernera les normes de transcription).

  3. Une liste des collaborateurs actuels, avec leurs rôles (même si nous partageons toutes les mêmes rôles, dans les faits) et éventuellement l'équivalence noms/pseudos Github.

  4. Un point sur l'état du projet : dire que le projet est actuellement en cours.

Que pensez-vous de tout cela ? N'hésitez pas également à me dire si vous avez pensé à d'autres points importants à inclure.

Une fois que nous nous serons mises d'accord, je veux bien me charger de remplir le README si cela vous va.

Choix export et nommage des fichiers de transcription

Il faudrait que nous nous mettions d'accord sur deux points :

  • le format d'export des fichiers d'eScriptorium : je vous proprose d'exporter les fichiers à la fois en format text et en format alto. Comme nous ne savons pas quelle utilité nous en aurons après, il est préférable de l'avoir sous deux formats différents. Nous pourrons affiner cela par la suite en fonction de nos besoins.

  • le nommage de ces fichiers: je vous propose de nommer nos fichiers de transcription de façon uniforme. Que pensez-vous de : "Lettre ID - date - transcription" ?

réflexion normes de transcription

Bonjour à toutes,

J'ai commencé à corriger les transcriptions obtenues avec eScriptorium.
Je vous propose de mettre en majuscule la première lettre des prénoms et noms de personnes, des noms de villes et du premier mot commençant les phrases.
Je vous propose également de conserver l'accentuation et la ponctuation de l'auteur même si les phrases sont assez longues.

Intégration continue : relecture des transcriptions

Bonjour à toutes,

Nous sommes sur le point de terminer les premières transcriptions de nos lettres et de formaliser les normes de transcription. Il faudrait peut-être réfléchir, à ce stade de notre projet, à l'intégration continue de nos transcriptions. C'est à dire aux relectures des transcriptions.

Je souhaitais vous proposer l'organisation suivante.

Si je me souviens bien avec Fanny et peut-être Cécile, nous avions rapidement discuté ensemble du système suivant. Fanny relirait mes transcriptions. Cécile relirait celles de Fanny. Je relirais celles de Cécile. Je pense qu'il est bien. Il permet d'éviter à chacune de relire toutes les transcriptions à chaque phase de relecture. On aura discuter des problèmes de transcription et de normalisation dans des issues.

Dans un premier temps, il faudrait peut-être effectuer une première relecture de type "orthographique". Mais elle n'est peut-être pas nécesaire puisqu'à chaque fois qu'on a eu un doute sur l'orthographe d'un mot, on a créé une issue pour recevoir l'aide des autres membres du groupe.

Ensuite, je pensais qu'on laisserait le temps à chacune d'appliquer les normes qui auront été formalisées à ses propres transcriptions.
Des relectures pourraient être faites afin de vérifier l'application de ces normes.
L'auteur des transcriptions et le relecteur auront peut-être à soumettre des propositions de nouvelles normes.
C'est pourquoi cela donnera peut-être à de nouvelles relectures et le cycle se répéterait jusqu'à ce qu'on ait régler l'ensemble des problèmes de normalisation.

Enfin, les relectures seraient une bonne occasion d'utiliser les pull requests afin de laisser aux auteurs des transcriptions le soin de valider les propositions faites par les relecteurs.

Qu'en pensez-vous ?

doutes transcription lettre 2

Bonjour

J'aurais aimé être aidée dans la transcription de ma lettre 1. J'ai des doutes sur la transcription de certains passages.

image 1:

  • ligne 6:

Je doute de l'orthographe du dernier mot. Je me demande si on lit "gracieux" ou "gracieus". Les "s" et les "x" à la fin des mots se ressemblent beaucoup. Je vais retrouver cette même graphie dans plusieurs mots qui me pose quelques soucis. C'est pourquoi je ne mets que l'exemple d'un cas rencontré.

gracieux

  • ligne 8:

J'ai lu "de le prendre si je veux le tenter, je commence par reflechir". Mais je doute que cela soit "tenter".

tendre

Si les captures d'écran sont de trop petites tailles et qu'un complément contextuel est nécessaire à la compréhension de ces passages, vous pouvez vous référer aux images en pdf contenues dans le dossier "Lettre2_04-06-1827 sur la branche "Lien".

Qu'en pensez-vous?

Je vous remercie d'avance pour votre aide apportée.

Gestion finale des branches

Bonjour les filles,

J'ouvre cette issue, car avant de rendre notre projet, je pense qu'il faudrait faire du tri dans les branches créées.

Nous avons mis l'ensemble des fichiers sur la branche main. Gardons-nous aussi les branches Cecile, Lien, et Fanny ? Je pense que cela ne serait pas dérangeant de les laisser. Mais si nous les gardons, nos documents ne sont pas nommés de la même façon que sur la branche main (ajout du 0 devant l'ID), il faudra peut-être renommer ces documents pour que toutes les branches soient homogènes avec main.

Pour ce qui concerne la branche dev, j'imagine que nous allons la supprimer, car elle nous a servi seulement d'étape pour merger sur main. Êtes-vous ok ?

J'ajoute aussi également qu'il ne faudra pas oublier de supprimer toutes les branches créées lors des PR lorsque celles-ci seront fermées (je pense à la branche readme, relecture_exports_conventions_nommage, relecture_normes, relecture_readme).

Problèmes git et github

Bonjour les filles,

Je crée cette issue portant sur les problèmes liés à git et github.

Je me suis aperçue, après quelques manipulations et en consultant l'historique, que je m'étais trompée plusieurs fois dans mes commits. Cela concerne 2 fichiers : "choix_exports_et_conventions_de_nommage.md" et "tableau_de_gestion.md". Pour rappel, ces deux fichiers ont été créés directement sur github, c'est pourquoi, pour les modifier, j'ai réalisé des commits directement sur github sans passer par git (edit this file -> modification sur le document -> puis commit changes).

Après avoir vu l'historique, je me suis rendu compte qu'au lieu de mettre un message de commit dans "commit changes", j'avais soit mis le nom du fichier, soit je n'avais rien mis. Puis lorsque j'ai compris mon erreur, j'ai créé un nouveau commit avec un message, mais je ne suis pas satisfaite de celui-ci. Cela apparaît dans l'historique malheureusement...

J'ai cherché dans la documentation de github une solution pour essayer de modifier le nom de ces commits, mais je n'ai pour l'instant rien trouvé. Modifier/ corriger un commit avec git, je connais les méthodes, mais lorsque ce sont des commits directement réalisés sur github, je ne vois pas comment faire.

Si jamais vous aviez une solution à m'apporter, n'hésitez pas à m'en faire part. De toute façon, les fautes ne sont pas extrêmement graves, et je ne reproduirai plus ces erreurs. Mais je pense que cela pourrait être intéressant et utile de savoir corriger ces erreurs sur github aussi. Pour info (et pour que vous évitiez de faire les mêmes erreurs que moi), je vous mets ci-joint le lien vers la documentation github concernant la gestion de fichiers sur github : https://docs.github.com/en/repositories/working-with-files/managing-files/creating-new-files.

Je vous remercie par avance pour votre aide !

Renommer le titre du projet

Je pense qu'il faudrait renommer le nom du projet car il a plusieurs défauts. Il paraît long et les conventions de nommage ne sont pas harmonisées (Berlioz = nom, Nanci = prénom).
Je propose donc : "Projet_Correspondance_Berlioz". Qu'en pensez-vous ?

Problèmes sur eScriptorium

Bonsoir les filles,

J'ouvre une nouvelle issue pour évoquer les problèmes rencontrés sur eScriptorium (segmentation/transcription automatique).

Je rencontre quelques problèmes lorsqu'il faut segmenter puis transcrire des lignes verticales. J'ai trouvé les fonctionnalités adaptées à la segmentation de ces dernières (segmentation --> text direction : Vertical l2r), mais cela ne fonctionne pas. Aucune de mes lignes n'est prise en compte par la segmentation. Je ne sais pas si cela est dû à la qualité du manuscrit ou pas. De plus, lorsque je fais la segmentation à la main sur ces lignes verticales puis que je lance la transcription automatique, cela ne fonctionne pas non plus (aucun mot n'est transcrit). Est-ce que vous rencontrez ces problèmes ?

Je vous mets ci-dessous les deux types de cas problématiques :

  • Lorsqu'il s'agit des feuillets avec destinataire et adresse, je corrige à chaque fois la segmentation entièrement à la main. Mais dès que je lance la transcription, cela ne fonctionne pas. Est-ce que vous avez ce problème ?

Capture d’écran de 2021-12-23 20-13-53

  • Pour le cas ci-dessous, j'ai à la fois des lignes horizontales et des lignes verticales sur le même feuillet. Je ne sais pas comment traiter cette difficulté. Je pense que si je réalise les lignes verticales manuellement, elles ne seront pas forcément transcrites par la suite. Il faudra que je transcrive moi-même. Si jamais vous rencontrez ce problème et/ou si vous avez une solution, n'hésitez pas à m'en faire part.

Capture d’écran de 2021-12-23 20-14-25

Je vous remercie par avance !

Doutes transcription lettre 3

Bonjour,

Je vous fais part, ici, de mes incertitudes de transcription concernant la lettre 3.

Image 1 :

  • Ligne 4 : je lis "avec du tems". Est-ce bien un "s" à la fin de "tem" ? Ou est-ce un "p" ?
    Capture d’écran de 2021-12-28 11-00-15

  • Ligne 11 : je lis "un", est-ce bien cela ? C'est un peu étrange puisque "intrigue" est féminin normalement.
    Capture d’écran de 2021-12-28 11-01-32

Image 2 :

  • Ligne 5 : j'ai un doute sur la ponctuation, est-ce bien "?.." ?
    Capture d’écran de 2021-12-28 11-05-11

Si mes captures d'écran ne vous suffisent pas, je vous laisse vous référer au pdf présent dans le dossier de cette lettre sur ma branche.

Merci pour votre aide !

Doutes transcription lettre 6

Bonjour,

N'ayant pas eu de doutes de transcription sur la lettre 6 jusqu'à présent, j'ouvre cette issue maintenant pour garder une trace des doutes suite aux normes établies et pour faciliter la relecture de cette dernière.

Cécile, je t'informe, d'une part, que cette lettre est prête à être relue.

D'autre part, tout comme pour les lettres 3 et 4, je te précise quelques éléments qui me résistent et auxquels il faudra faire attention :

  • Img 1 :
    • l.7 : "coté" ou "côté" ? Je n'arrive pas à déterminer s'il y a bien un accent circonflexe ou non...
      Capture d’écran de 2022-01-06 16-28-57
    • l.10 : "mais" ou "Mais" ? J'ai mis pour l'instant "mais", mais après réflexion, il fait souvent ses "M" majuscules avec ce type de graphie. Pour ce cas-ci, le "m" n'est pas très grand, mais comme il est après un point, je doute.
      Capture d’écran de 2022-01-06 16-29-15

Je te remercie pour ton aide !

rédaction du rapport

Bonjour à toutes,

Je vous souhaite mes meilleurs voeux pour l'année qui arrive!

La date de rendu de devoir approche, il faudrait que nous commencions la rédaction du rapport final à rendre au format ODT.
Il faudrait peut-être réfléchir à la ou les personnes en charge de rédiger le rapport et la manière dont on va organiser le dépôt sur Git Hub.

On pourrait faire un plan détaillé du rapport en reprenant le README et les discussions que nous avons eu dans les issues. Ce ne serait qu'une version de départ qu'il faudrait enrichir des nouvelles discussions que nous aurions eues...
il faudrait faire ensuite une pull request de ce plan détaillé afin que les membres du groupe puissent soumettre leurs corrections.
Toutefois j'ai peur que dans une issue - comme nous l'avions fait pour le plan README - qu'il n'y ait pas assez de place pour mettre le plan détaillé. Cela risque également de ne pas être trop commode pour la lecture....

C'est pourquoi je me demandais s'il ne fallait pas créer une branche "Rapport" sur laquelle on mettrait le plan détaillé, une version au format TEXT du rapport, une autre version (mise en forme) en format odt.

De la même manière, je pensais qu'on pourrait utiliser les pull requests pour la version TEXT
Après la validation du plan du rapport, je pense qu'il serait préférable d'avoir une version TEXT. Cela me paraît plus pratique pour faire les modifications et les soumettre via des pull requests qu'un format ODT. Par ailleurs, il y aura des parties communes et des parties individuelles à rédiger.

Cette version TEXT finalisée serait ensuite reprise dans un fichier ODT par la personne qui se chargera de mettre en forme le rapport et de le mettre sur la branche main.

Si cela peu vous soulager dans vos travaux respectifs, je me propose pour la rédaction d'un plan plus au moins détaillé que vous pourrez par la suite modifier. En fonction du plan, je pense qu'on verrait mieux pour se répartir après la rédaction des différentes parties.

Qu'en pensez-vous?

Création d'un tableau de gestion

Bonjour à toutes,

Afin de faciliter la répartition du travail et de garder trace de nos avancées, je propose de créer un tableau de gestion. Les outils intégrés de Github ne me semblent pas les plus adaptés à nos besoins, donc je propose la création d'un fichier markdown. Ce fichier aurait l'avantage d'être aisément modifiable depuis Github, ce qui faciliterait le travail pour toutes.

Il me semblerait pertinent d'inclure dans le tableau :

  • Un identifiant pour chaque lettre ;
  • La date de la lettre ;
  • Son lien sur Gallica ;
  • Son identifiant ark (pour faciliter l'import des images sur eScriptorium, par exemple) ;
  • La personne en charge de la lettre ;
  • Le nombre estimé de lignes de la lettre (afin de s'assurer que chacune transcrit environ 100 lignes, selon les consignes du devoir) ;
  • Le nombre d'images (images, et non pages ou feuillets, pour mieux coller à la logique d'eScriptorium qui permet de travailler image par image) ;
  • Des colonnes segmentation, transcription, relecture, validation, afin de savoir où chacune en est dans l'avancement de ses travaux. Pour que ce soit plus simple, je propose d'inscrire par exemple "1 2" dans le colonne segmentation si les images 1 et 2 ont été segmentées.

Si cela vous convient, je propose de créer le tableau depuis un générateur de tableaux en Markdown afin de gagner en efficacité, puis de créer le fichier sur Github.

Merci par avance pour vos retours !

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.