Code Monkey home page Code Monkey logo

mos5.5-dataviz-tp-1's Introduction

MOS5.5-DataViz-TP-1

Dot Plots

I - Principe

Aussi appelés "Dot Charts", les Dot Plots sont des graphiques qui consistent en des points représentant des valeurs discrètes d'un problème.Ces représentations sont donc adaptées aux informations dont les valeurs possibles sont prédéfinies ou facilement distingables les unes des autres.
On retrouve ces graphiques dans deux grands domaines : Les Statistiques et la BioInformatique. Dans le domaine des statistiques, ces DotPlots sont une bonne alternative aux histogrammes.

II - Exemples Statistiques

1) Le Dot Plot du gouvernement Américain [1]

Dot Plot des perspectives de croissance par le gouvernement Américain

Ce DotPlot est compréhensible grâce au codage du nombre de votant par la taille des points. Ces points apportent ainsi un bon rendu visuel des opinions exprimées. De plus la différentiation avec les points non coloriés permet de se rendre compte d'un changement dans les données et donc peuvent interpeller, faire apparaître une information omise.

2) Population par catégorie [2]

Dot Plot : Type of food for snacks

Les DotPlots Statistiques peuvent également être utilisés pour classer des individus ou groupes d'individus selon des criètres là encore discrets.
Ce graphique en particulier très simple d'interprétation et très intuitif. Bien qu'aucune information ne soit donnée sur la signification de chaque point ; il est facile de comprendre le sens du graphique à savoir qu'au plus il y a de point dans chaque colonne, au plus chaque trait de caractère est représenté.

3) Visualisation d'une répartition

Penn-State University : Sampling distribution of the mean [3]

La visualisation d'un DotPlot apporte également une information de répartition très important. Ici il apparraît clairement, grâce à la simplicité de ces graphiques, que les deux échantillions donnés ont des moyennes proches mais sont répartis de façons différentes. On peut encore le constater sur l'image ci-dessous :

Illustrative Mathematics : margin of error for estimating a population mean [4]

III - Exemples BioInformatique [5]

Les DotPlots utilisés dans le domaine de la BioInformatique renseignent dans la plupart des cas sur une similarité entre deux variables. Leur particularité est que les axes sont déterminés par des vecteurs connus.

1) Ressemblances entre séquences zinguées [6]

A DNA dotplot of a human zinc finger transcription factor

Ce diagramme a pour point positif de facilement montrer des tendances de similarités, c'est à dire des régions qui se ressemblent beaucoup, mais il n'est pas facile de distinguer des différences locales si les vecteurs sont grands.

2) Similarité d'un signal [7]

El Nino oscillations : similarities over time

Ici on observe par le biais d'un dotplot la récurrence d'un phénomène métérologique - un courant marrin déterminant pour la météo à l'échelle mondiale- au fil du temps.Ce diagramme est intéressant car il met en valeur les années pour lesquelles les phénomènes observés se rapprochent de phénomènes déjà observés. En d'autres termes, on peut déduire l'impact de El Nino une certaine année en récupérant l'historique de ses effets les années similaires à celle-ci ; et c'est ce diagramme qui nous indique quelles années regarder.

3) Interprétation de pattern [8]

Distance between two sequences

On peut également utiliser des graphiques de ce type pour déterminer une distance élastique entre deux séquences de nombre, de vecteurs, de lettres,... Il suffit pour cela de représenter une distance classique à chaque intersection et alors des zones telles que repérées 1, 2.b et 2.c apparaîssent. Ces zones sont caractéristiques d'une égalité (1) entre les séquences, d'une insertion (2.b) de caractères ou encore d'une destruction (2.c) de caractères.Ce type de matrice est utilisé par exemple en reconnaissance de parole (comme vu lors du MOD 5.3 : Traitement et Analyse de données visuelles et sonores). N.B : Sur cette image il ne s'agit pas de distance élastique, ici c'est surtout les zones d'intérêt mises en exergues que l'on étudie.

IV - Tracer des DotPlots

Il existe de nombreux outils pour obtenir des DotPlots, ils offrent tous des niveaux différents de personnalisation. Pour les DotPlots Statistiques, on peut utiliser des outils très généraux tels que Excel tout comme on peut utiliser des outils plus complets et compliqués comme Tableau.

Pour ce qui est des dotplots liés à la bioinformatique, il existe de nombreux software qui permettent de les tracer, là encore avec des niveaux de détails différents. La palette de solutions disponibles vont du script html au logiciel spécialisé.

DotPlot de similarités entre : EXEMPLESEQUENCE et SEQUENCEEXEMPLE[9]

Interface du software Seriolis specialisé dans les dotplots bioinformatiques[10]

V - Sources

mos5.5-dataviz-tp-1's People

Contributors

ctuauden avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.