Code Monkey home page Code Monkey logo

tnah-2021-projet-notre-dame's Introduction

Projet Notre-Dame

DOI

Le Projet Notre-Dame consiste en une transcription des journaux quotidiens de l'année 1860 des travaux de restauration effectués de 1844 à 1865 à la cathédrale Notre-Dame de Paris sous la direction d'Eugène Viollet-le-Duc et Jean-Baptiste Lassus. Celle-ci a été effectuée sur eScriptorium à partir de la numérisation des journaux des travaux réalisée par la Médiathèque de l'architecture et du patrimoine.

Le projet a été réalisé dans le cadre du cours GIT du master 2 TNAH de l'École nationale des chartes. Ses données sont disponibles dans le dossier data.

Membres du projet :

Le projet Notre-Dame a été réalisé par Soline Doat, Elsa Falcoz, Margaux Faure, Anaïs Mazoué et Ariane Menu. Si nécessaire, nous vous prions de vous référer au fichier CITATION.cff pour citer le projet.

Règles de transcription suivies :

  • respect des majuscules et minuscules
  • respect des ligatures (par exemple, transcrire "chœur")
  • mot qui est barré : 难 (une seule fois par mot) mais seulement s'ils sont totalement/à moitié illisibles. Les restranscrire entre accolades {} s'ils sont lisibles.
  • Pour mettre en exergue les doutes de transcription :
    • mot incertain: [incertain]
    • mot que l'on ne parvient pas à transcrire : [??]

Répartition de la transcription et relectures :

  • Anaïs : pages 1 à 3 (relues par Ariane)
  • Soline : pages 4 et 5 (relues par Anaïs)
  • Ariane : pages 6 et 7 (relues par Soline)
  • Elsa : pages 8 et 9 (relues par Margaux)
  • Margaux : pages 10 à 12 (relues par Elsa)

Utilisation d'eScriptorium :

Versions utilisées et considérations techniques :

  • eScriptorium : Version Wed Dec 8 10:53:11 CET 2021 - a64ba80255ddab851728cbdc2427f701902901c7
  • Kraken : Version 3.0.5
  • Modèle de transcription utilisé : Kraken: Modèle Manuscrit 19e Lectaurep
  • Format d'export des transcriptions : ALTO (XML) et Text

Application des zones :

  • une zone principale qui constitue le corps du texte : "main"
  • une zone marge : "marge"
  • une zone pour encadrer les illustrations : "illustrations"
  • une zone pour délimiter le numéro de folio : "folio"
  • une zone pour délimiter les tableaux : "table"

Aides possibles :

  • Un lexique regroupant le vocabulaire architectural, une capture du mot et sa définition est disponible dans le repository.
  • Un tutoriel pour la bonne numérotation des lignes est disponible ici.

Bonnes pratiques :

  • une branche par personne
  • Un dossier par page, nommé comme suit pour la page 1 : "NDP_page01". Il comprend un fichier xml, un fichier txt et une image png.
  • les fichiers xml doivent se nommer comme suit : NDP_page01.xml
  • les fichiers txt doivent se nommer comme suit : NDP_page01.txt
  • les images png doivent se nommer comme suit : NDP_page01.png
  • pour toute demande d'aide en transcription (mots incertains, illisibles...) : créer une issue pour chaque page pour y répertorier les difficultés
  • ne pas oublier d'ajouter dans le lexique (lexique_architectural.md) les mots spécifiques au domaine de l'architecture qui ont posé des problèmes de transcription.

tnah-2021-projet-notre-dame's People

Contributors

a-menu avatar anaismazoue avatar dtsoline avatar elsavk avatar margauxfre avatar ponteineptique avatar

Stargazers

 avatar  avatar  avatar  avatar

tnah-2021-projet-notre-dame's Issues

Ajouts possibles au projet

Salut !

Je me demandais s'il ne serait pas utile d'ajouter les fichiers en texte brut afin d'avoir une version plus facilement lisible après les relectures.
En outre, le "dictionnaire" pourrait peut-être se trouver dans un dossier markdown regroupant l'image du mot et sa définition ?

Qu'en pensez-vous ?

Difficultés - Page 4

Bonjour à toutes !

A mon tour de demander de l'aide pour des mots quelque peu récalcitrants :

1- On échafaude le deuxième bas coté de la nef nord pour le [reprirees]
l27

2- On poursuit le [?age] des pénétrations et des noues du grand comble
l37

3- On [] les deux figures dans les niches des contreforts [p?] de chaque
l40

4- Suite des travaux de reprise des tympans au dessus des [??] [??] des deux
l46

Si vous avez une idée !

Difficultés de transcription - page 12

Je vous soumets également un mot que je n'arrive pas à lire sur la page 12 :

  1. les caves de la sacristie étant [??] par les eaux de la Seine, les charpentiers pratiquent un passage"
    Capture d’écran 2022-01-06 à 12 48 31

Edit : Le mot va certainement dans le sens d'"inondées"...

Merci !

nom du dépôt

Hello Soline,

Avant de rendre le projet, il faudrait penser à nommer le dépôt selon la norme fournie dans la consigne. Comme tu en es la propriétaire, pourrais-tu t'en charger, s'il-te-plait ?

Merci :)

Difficultés de transcription - page 7

Rebonjour à toutes,

Après celles de la page 6, voici les difficultés de la page 7 :

  1. Le problème porte ici sur le premier mot entre crochets (le second étant traité en 1. de l'issue concernant la page 6)

1

  1. Cette phrase commence par "on continue a déposer l'ancienne charpente de la nef dans la première" et se poursuit ainsi :

2

3

4

5

  1. Et pour terminer, quelques difficultés rencontrées dans une même phrase :

6

6 bis

Merci d'avance !

Numérotation des lignes

Nous en étions au débat du découpage des lignes. Mais j'ai une question toute bête: à quoi cela nous sert exactement d'avoir toutes les mêmes lignes numérotées, du style le folio en n°1, la date en n°2 etc...

Des normes, des normes partout

Salut les filles :)
Il faudrait créer des normes de transcription pour notre projet. Notamment pour représenter:

  • les mots que l'on ne réussit pas à transcrire
  • les mots qu'on a transcrit à moitié
  • les mots que l'on a transcrit mais dont on n'est pas sûre de la justesse de transcription
  • les mots barrés, lisibles ou illisibles
  • les dessins en marge
  • question du rétablissement des majuscules ou non
  • améliorer la lisibilité du rendu (ajout d'espaces entre le jour et la ligne, de tirets...)

Voilà, n'hésitez pas si vous pensez à d'autres points à éclairer :)
Elsa

Transcription des ligatures

Bonjour,

Il faudrait peut-être que l'on se mette d'accord sur la façon de transcrire les ligatures. Selon vous, faudrait-il les transcrire ligaturées, ou bien en caractères séparés ?

Je pense en particulier au mot "chœur", qui est assez récurrent dans le texte. Faut-il donc le transcrire en tant que "chœur" (avec la ligature) ou bien "choeur" (sans) ?

Cordialement,

Relecture des transcriptions

Hello,

Je pense que ça serait intéressant que les transcriptions soient relues par un oeil différent de celui du transcripteur.
On pourrait partir directement de l'état des fichiers sur eScriptorium (puisque l'on a toutes accès à l'ensemble du fichier).
Chacune pourrait relire les pages transcrites par une autre personne. Qu'en pensez-vous ?

Nom des fichiers

Bonjour à toutes,

Il faudrait probablement qu'on se mette d'accord sur la manière de nommer les fichiers xml qui correspondent aux différentes pages. Je vous propose NDP_page01, qu'en pensez-vous ?

Difficultés de transcription - page 6

Bonjour à toutes (et bonnes fêtes de fin d'année),

Je viens à mon tour demander de l'aide pour quelques mots récalcitrants :

  1. Ce mot est régulièrement retrouvé sur mes deux pages mais son épellation m'échappe. Au vu du contexte je pense à un mot similaire à "côté", mais cela ne correspond pas.

1

1 bis

1 qu

1 ter

  1. Deuxième mot :

2

  1. Plusieurs difficultés sur une même phrase :

Capture d’écran 2021-12-26 140718

3 bis

3 ter

  1. Il semblerait que ce soit le même mot, mais j'ignore lequel (ravalement ? renouvellement ?)

4

6

  1. "Entretien" peut-être ?

5

  1. Enfin, encore plusieurs difficultés sur une même phrase :

7

7 bis

  1. Enfin, j'ai du mal à deviner le numéro utilisé en deuxième ligne ici. Je lis "Juin 2 / ?? / 9 / 11"

page 6

Navrée pour ces nombreuses questions et merci d'avance !

Difficultés de transcription - page 10

Salut,

Je me permets de vous demander un peu d'aide pour sur quelques mots de la page 10 :

  1. "la pose du [un mot illisible] du chéneau". Le mot est propre mais rien ne me vient à l'esprit...
    Capture d’écran 2021-12-05 à 17 00 27

  2. "la pose des verrières en grisailles [dans?] les cinq travées"
    Capture d’écran 2021-12-05 à 17 05 41

  3. "pour garantir les [un mot illisible] des voutes laissés à découvert"
    Capture d’écran 2021-12-05 à 17 11 07

Si jamais ces petits extraits vous inspirent...
Merci ! :)

Un problème de tableau

Bonjour à toutes,

On en avait parlé au commencement du projet sans en poser une réelle réponse, j'ai une interrogation quant au traitement des tableaux dans le document même si je crois qu'il y en a qu'un pour 1860.
Comment on en définit les zones ?
Pour le moment j'ai créée une zone "texte" différente pour le séparer du reste du texte mais cela me semble un peu artificiel, sinon peut-être l'intégré sans distinction au corps du texte ? Ou alors définir une zone spécifique pour les tableaux ?

Qu'en pensez-vous ?

Difficultés de transcription - page 5

Bonjour à toutes !

Quoi de mieux que de retrouver eScriptorium pour un bon début d'année ? J'aurai besoin d'aide pour les lignes suivantes :

l30
l48
l49
l5
l6
l17
l21
l29

Si vous avez idée, je suis preneuse !

Merci à toutes

Difficultés de transcription - page 8

Bonjour à toutes :)

Je m'excuse par avance pour le nombre de mots qui m'ont posé des difficultés... En revanche, j'espère beaucoup que vous pourrez m'éclairer sur ces points !

  1. "echafaudages légers [??] [??] du grand comble pour la plomberie des"
    Capture d’écran de 2021-12-06 22-04-01

  2. "quatre grandes contrefiches de la flèche formant [gradins] 难 destinés à recevoir"
    Capture d’écran de 2021-12-06 22-06-13

"de la flèche formant [gradins] dans les [revues] des combles. pose des verrières"
Capture d’écran de 2021-12-06 22-09-58

  1. (Celui-ci je le retrouve plein de fois dans le texte) "les travaux de charpente et de [??] se poursuivent sur le grand comble"
    Capture d’écran de 2021-12-06 22-06-41

"le [??] sur la travée de charpente au dessus de la nef. 难 les plombiers"
Capture d’écran de 2021-12-06 22-07-45

"le [??] de la travée de charpente au dessus de la 1ere travée du choeur est terminé"
Capture d’écran de 2021-12-06 22-07-36

  1. "on a [apres] [??] [??] les [parties] de tapisserie au dessus des [??]"
    Capture d’écran de 2021-12-06 22-07-08

  2. "on a terminé la pose de la verrière de Mr Maréchal a l[a] [??] haute de la"
    Capture d’écran de 2021-12-06 22-08-03

6)"on poursuit la [??] de la facade du transept Sud ansi que de la charpente"
Capture d’écran de 2021-12-06 22-08-31

7)"la depose des [??] qui flanquent le [pignon] et la corniche formant passage"
Capture d’écran de 2021-12-06 22-08-52

Merci encore, j'ai hâte de savoir ce vous arrivez à lire (mes yeux de médiéviste ne me servent malheureusement guère...)

découpage des zones (et début de la problématique de numérotation des lignes)

Bonjour à toutes,

Suite à notre réunion, nous avons décidé de découper chaque page en 4 zones :

  • la zone principale qui constitue le corps du texte (à nommer main sur eScriptorium)
  • une zone marge (marge)
  • une zone pour encadrer les illustrations (Illustrations)
  • une zone pour délimiter le numéro de folio (folio)

Voici un exemple de ce que cela donnerait sur une de mes pages. Est-ce que vous arrivez à quelque chose de similaire ? Le découpage vous parait cohérent ?

Capture d’écran 2021-11-24 à 16 22 31

Organisation des branches

Bonjour les filles,

Je ne sais pas si vous trouverez mon issue nécessaire mais je me demandais comment on pourrait organiser nos branches de manière à ce que leur contenu soit présenté de manière identique d'une branche à l'autre.
On a déjà décidé une façon de nommer les fichiers mais chaque branche est organisée différemment : soit les fichiers sont envoyés directement sur la branche, soit ils sont inclus dans un dossier.
On s'y retrouve bien sûr mais peut-être que l'on pourrait faire quelque chose de plus harmonieux ?

Deux propositions :

  • on crée un dossier par page afin d'y glisser à la fois le fichier .xml qui contient la transcription et le fichier image .png (qui se télécharge depuis eScriptorium quand on choisit de récupérer l'image à l'export).
  • on met directement les fichiers sur la branche en .xml et .png

A voir aussi pour la suite : il faudrait penser à la question des relectures que l'on déposera sur nos branches. Dans ce cas, peut-être faudrait-il créer un dossier pour les transcriptions et un dossier pour les relectures ?

J'espère que c'est clair, dites-moi !

Difficultés de transcription - page 11

Salut les filles,

J'ai besoin de vos lumières pour un mot de la page 11 :

"On commence à poser le massif en pierres et briques qui doit supporter les [??] à l’entrée du chœur."
Capture d’écran 2022-01-06 à 12 43 47

Des idées ?

Partage des relectures

Coucou les filles,

Où en êtes-vous dans vos transcriptions ? Je me demandais si on pouvait passer aux relectures. On pourrait se répartir les pages à relire : on avait parlé du fait qu’une personne relise le travail d’une autre personne.

en tout cas, mes transcriptions sont prêtes à la relecture si quelqu’un veut se lancer :)

On pourra par la suite mettre la répartition dans le readme, non ?

Difficultés de transcription - page 3

Bonjour les filles,

à mon tour de vous demander de l'aide pour quelques difficultés de transcription :

  1. continuation des travaux de charpente (pose des []

Capture d’écran 2021-12-08 à 16 10 16

  1. on [] le grattage des premieres travées de voutes du triforium

Capture d’écran 2021-12-08 à 16 11 19

  1. des [enduits] en pierre pour les [] du caveau des archevëques on

Capture d’écran 2021-12-08 à 16 12 47

  1. morceaux de pierre formant [] dans les [] au dessus des [au] ogives

Capture d’écran 2021-12-08 à 16 15 36

Merci à toutes :)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.