Code Monkey home page Code Monkey logo

avila-analysis's Introduction

Avila-Analysis

Probleme

Le dataset

Le dataset représente des caractéristiques sur les pages, colonnes et lignes de la bible Avila provenant d’images. Chaque ligne du dataset représente les caractéristiques d’une ligne écrite, de la colonne qui la contient, et de la page qui la contient.

But du projet

Le but de la prédiction sur ces données, est de pouvoir prédire quel copiste a écrit une ligne donnée, en fonction des différents patterns de ce texte. La Bible ayant été écrite par 12 copistes, assimilés à des lettres, le dataset dispose de 12 classes de cible. Il s’agit bien ici d’appliquer un algorithme de classification, pour associer des patterns d'écritures à un des copistes ayant écrit la bible.

Forme du projet

Un travail de prédiction a donc été effectué pour fournir la prédiction, au travers de différents tests, de différents modèles et leur configuration.

Le modèle de prediction retenu a été sauvegardé, et implémenter dans un rendu sous forme d'api Flask.

Usage

Installation

Pour démarrer l'api Flask et être en mesure de l'utiliser pour performer des predictions avec le modèle, il suffit de suivre les étapes suivantes:

D'abord, il faut clone le repository:

git clone https://github.com/medartus/Avila-Analysis

Ensuite, dans le dossier du projet, installer les dependances python en executant cette commande :

pip install -r requirements.txt

Enfin, toujours dans le dossier du projet, lancer l'API avec la commande suivante:

python api/api.py

Utilisation

Une fois l'API demarrée, pour l'utiliser il suffit de faire une requête GET à l'endpoint /predict, en y passant en paramètres les variables de votre prediction selon le schéma suivant:

Paramètre dans la requête Variable de prédiction associée
F0 intercolumnar distance
F1 upper margin
F2 lower margin
F3 exploitation
F4 row number
F5 modular ratio
F6 interlinear spacing
F7 weight
F8 peak number
F9 modular ratio/ interlinear spacing

Par exemple : http://localhost:5000/predict?F0=0.364825&F1=-0.189174&F2=0.502357&F3=0.223290&F4=-1.168333&F5=-3.837595&F6=0.069175&F7=0.534971&F8=-2.149801&F9=-3.417834

Conclusions

Expérience

Ce projet est une application intéressante de machine learning. Car bien qu'il soit difficile à l'oeil humain de différencier les auteurs d'une certaine habitude d'écriture et calligraphie, le machine learning y arrive particulièrement bien, du moins avec le dataset Avila.

Apprentissage

L'exploration des données, leur visualisation et leur compréhension à été une étape importante dans l'élaboration du modèle. Cela nous a permis de comprendre en profondeur chaque variable de façon concrète, et par la suite de créer de l'information utile pour le modèle.

Résultat

En plus de ce feature engineering, il nous a suffit de tester plusieurs modèles, d'effectuer des recherches d'hyper-paramètres optimaux, et le résultat retenu est d'une précision très satisfaisante.

Appendix (Résultats et performances)

Resultats Performances (ROC)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.