Code Monkey home page Code Monkey logo

hn2021-ocr-poesie-corse's People

Contributors

adrienescoda avatar ponteineptique avatar the0phil3 avatar vincentsarbachpulicani avatar viosaiag avatar

Stargazers

 avatar

Forkers

gabays

hn2021-ocr-poesie-corse's Issues

Description et images

Une issue mineure, mais je me propose pour alimenter les descriptions, fichiers README et toute la personnalisation de l'organisation et du repository afin que tout cela soit plus propre?
Je m'y auto-assigne mais si quelqu'un veut prendre cette partie en charge, n'hésitez pas à me le dire !

Avancée transcription eScriptorium

Bonjour à tous ! Je suis en train d'avancer sur la transcription eScriptorium, j'ai fait cinq pages (p.10 à p.14) pour l'instant. Je vois que vous avez tous de gros devoirs à rendre en cette fin de semestre, je vous propose donc de me charger de transcrire toutes les pages ? J'ai déjà fini mes travaux de fin de semestre, et la transcription est très chronophage, autant que vous finissiez les devoirs que vous avez à rendre la semaine prochaine en priorité. Je travaille pour le moment sur le corpus d'entraînement, est-ce que je crée un dossier ou est-ce que vous voulez vérifier mon travail avant de le mettre dans le dossier final ? Merci, bon courage !

Retranscription du premier corpus

Bonjour à tous,
J'ai à nouveau transcrit entièrement le premier corpus avec le modèle récemment trouvé par Vincent.
En effet, le texte tel que nous l'avions laissé n'était pas homogène car il avait été transcrit par de nombreux modèles différents et beaucoup moins performants que celui-ci car ce corpus était à l'origine le corpus d'entraînement sur lequel nous effectuions tous nos essais.
Je pense que ce sera bien plus pratique ainsi !

Problème d'export des pages transcrites

Bonsoir,

Je ne parviens pas à télécharger les pages transcrites depuis e-scriptorium.

Pour être plus précis, les exports sont bien effectués (comme vous pouvez le voir sur l'image ci-jointe en haut à droite ("Export done !"), mais je ne parviens pas ensuite à télécharger les fichiers, ni sur Linux, ni même sur Windows, que ce soit en cliquant sur le "Download" en dessous du "Export done!", ou bien sur le lien envoyé sur ma boîte mail.

Avez-vous une solution à ce problème ?

pb_escriptorium

Rajout du pdf iiif

Adri pourrais-tu rajouter le pdf du document Catechismu en iiif s'il te plait?

Etat des lieux des pull request à effectuer

Bonsoir à tous,

Je vous propose que nous établissions d'ici peu une liste des documents à push afin de pouvoir se répartir les pull request à effectuer.

J'en ai profité pour créer un nouveau label "suggestion", qui est il me semble plus adapter pour décrire cette issue que les labels qui étaient disponibles.

Organisation du dépôt ?

L'idée est d'ouvrir ici le débat sur l'organisation du dépôt.

  • Je propose de créer un dossier qui contient le recueil (PDF ou/et IIIF) afin d'avoir accès à la source directement.
  • On devra également créer un dossier qui contiendra notre transcription finale
    Pour la suite, je vous laisse proposer des suggestions.
    Si cela vous va, je me chargerai de mettre à jour le fichier README.md du repository qui décrira son organisation.
    De même, n'oubliez pas de bien nommer vos commit et d'ajouter des README.txt dans les dossier que vous ajouterez.

J'ai vu que @the0phil3 a ajouté des labels, pourrais tu éventuellement créer une issue pour expliquer les changements apportés à ce sujet ? Ce sera une tâche à laquelle nous pourrons t'assigner.

Suppression du dossier "traduction"

Chers camarades,
Sachant que nous avons abandonné l'idée de faire des traductions du texte corse, souhaitez-vous que je supprime le dossier ?

Rajout de ressources

Pour le dossier ressources, @the0phil3 nous a ajouter le fichier PDF du recueil.
Ce serait bien que tu nous trouves d'autres variations du recueil afin d'avoir différentes versions (IIIF ?).
Je t'assigne dessus !

Suppression d'un document sur github

Chers camarades,
J'ai fait un git push avec un document test.txt car j'avais constaté un bug, et je ne parviens pas à supprimer ledit document maintenant que mon problème est réglé. Il se trouve dans le dossier Corpus d'entraînement du dossier Transcriptions, où j'ai également ajouté les transcriptions du corpus d'entraînement.
L'un d'entre vous pourrait-il s'il vous plaît m'indiquer comment faire ? Merci !

Point sur la transcription

Je propose de réunir dans une seule issue notre avancement sur sur la transcription des textes.
Je me propose d'avancer sur la transcription du nouveau texte dans la mesure où j'ai trouvé un nouveau modèle et, quant à vous, vous pouvez vous occuper de corriger les quelques erreurs que j'ai trouvé précédemment dans l'issue #6.
Qu'en pensez-vous ?

Ô rage, ô désespoir, eScriptorium me refuse 2%

Chers camarades,
J'ai transcrit entièrement la page 14 du corpus d'entraînement, mais le site m'affiche "98%". Je ne sais pas où sont passés les 2% manquants, mais après plusieurs minutes passées à m'arracher les cheveux je préfère faire appel à votre expertise avant de nuire fortement à la rentabilité de mon shampoing. Un œil de lynx pour m'aider à repérer le problème ?
Merci beaucoup par avance !

Transcription d'un nouveau document ?

Bonsoir à tous,

J'ai déjà envoyé un mail à M. Clérice à ce sujet mais pensez-vous qu'il est nécessaire de transcrire un autre document afin de ne pas rendre quelque chose de trop court ?

Si ça vous va, je m'occupe de trouver quelque chose, je suis plus à l'aise sur le corpus de sources à ce sujet et sur les endroits où trouver ces ressources.

Nouveau document à transcrire - "A nostra Santa Fede - Catechismu corsu"

Bonjour à tous,
Je me suis permis de réorganiser le dossier de travail sur eScriptorium.
J'ai renommé le document "Corpus d'entraînement" en "Pontenicu", supprimé l'ancien document qui portait ce nom afin de rajouter dans un nouveau document le deuxième texte à transcrire.

Le nouveau document fait 52 pages (nous ne sommes pas obligés de le transcrire entièrement, mais je peux m'en occuper si vous voulez).
Il s'agit de l'ouvrage "A nostra santa Fede : Catechismu corsu" publié en 1926 aux "stamparie di A Muvra"et qui se veut être un manifeste politico-religieux sur l'autonomisme corse. Il a été écrit par Ageniu Grimaldi, dit Saveriu Malaspina.

J'espère que cela vous voncient.

New Label

Bonjour les amis,
Le nouveau label que j'ai créé s'appelle 'bonne idée' et on peut l'utiliser pour désigner nos propres idées et les idées des autres que nous apprécions.

Theo

Vérification des pages en Corse

Chers camarades,
J'ai fini de transcrire toutes les pages, sauf les p.21-25 dont Adrien se charge.
Serait-il possible d'avoir l'aide de @vincentsarbachpulicani pour la relecture de la transcription du Corse ? Je sais que tu connais bien la langue, tu sauras sûrement mieux que moi détecter les fautes potentielles. J'ai eu quelques doutes lors de la transcription, notamment sur des espaces qui n'en étaient peut-être pas, mais il est difficile de discerner le vrai du faux sans savoir quels mots je suis censée reconnaître.
Je te remercie par avance !

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.