Code Monkey home page Code Monkey logo

pi03-analytics's Introduction

PROYECTO INDIVIDUAL Nº2

Accidentes aéreos

¡Bienvenidos al último proyecto individual de la etapa de labs! En esta ocasión, deberán hacer un trabajo situándose en el rol de un Data Analyst.

Contexto

Los accidentes aéreos son eventos inesperados e indeseados que involucran aeronaves y se producen daños físicos a personas o a la propia aeronave. Un accidente aéreo puede involucrar cualquier tipo de aeronave, incluyendo aviones comerciales, aviones privados, helicópteros, planeadores y globos aerostáticos.

Los accidentes aéreos pueden ser causados por diversos factores, como errores humanos, fallos de equipos, problemas meteorológicos, problemas de mantenimiento, fallas en la gestión del tráfico aéreo, problemas de diseño o problemas de fabricación. Y en cuanto a sus consecuencias, pueden ser tanto en términos de pérdidas humanas como económicas.

Es por eso que la industria de la aviación, las autoridades reguladoras y los investigadores trabajan incansablemente para mejorar la seguridad de la aviación y prevenir futuros accidentes.

Por esto, el análisis de datos históricos de accidentes aéreos es fundamental para mejorar la seguridad de la aviación. La recopilación y el análisis sistemático de los datos de accidentes pueden ayudar a los investigadores a identificar patrones, tendencias y factores contribuyentes que podrían llevar a mejoras en la seguridad, desde ayudar a mejorar la capacitación de los pilotos y el personal de mantenimiento, así como a mejorar el diseño y la fabricación de aviones y equipos de aviación.

Rol a desarrollar

La Organización de Aviación Civil Internacional (OACI) es una organización intergubernamental que se dedica a promover la seguridad y eficiencia de la aviación civil internacional. Como parte de su misión, la OACI ha decidido llevar a cabo un proyecto de data analytics para analizar los accidentes aéreos de aviones en todo el mundo.

El objetivo del proyecto es recopilar, analizar y visualizar datos relevantes sobre accidentes aéreos para identificar patrones y tendencias en la seguridad de la aviación civil. El proyecto se llevará a cabo mediante la utilización de técnicas de data analytics que usted ya conoce, para procesar y analizar datos de accidentes aéreos.

Para llevar a cabo el proyecto, la OACI le proporciona los datos de accidentes de aviones, pero lo insta a usted, como parte del equipo de especialistas en data analytics, a que incluya otras fuentes de datos, como bases de datos gubernamentales, informes de la industria, informes de los medios de comunicación y otros recursos disponibles públicamente.

El resultado final del proyecto será un dashboard interactivo que permita a los usuarios explorar los datos y obtener información sobre accidentes específicos, el cual deberá utilizar para presentar los hallazgos obtenidos de la información analizada.

Dentro de este trabajo, con el fin de entender los datos y alinearlos con los objetivos de la organización, se le pide visualizar en su dashboard el siguientes KPI, junto a otros 3 adicionales que usted debe generar.

  • Reducir en 5% la tasa de mortalidad a nivel anual, siendo el número de fallecidos en los accidentes aéreos respecto al total de personas en los vuelos involucrados.

Nota: En la sección de material de apoyo se puede encontrar más información sobre los KPIs.

Se espera que el reporte y el dashboard proporcionen información valiosa a la industria de la aviación civil, los reguladores gubernamentales y otros interesados en la seguridad de la aviación. Con esta información, se podrán desarrollar medidas preventivas para reducir la incidencia de accidentes aéreos y mejorar la seguridad en la aviación civil a nivel mundial.

Propuesta de trabajo

Requerimientos de aprobación

Análisis Exploratorio de los datos (Exploratory Data Analysis = EDA)

El reporte debe incluir un resumen de estadísticas descriptivas de los datasets, análisis univariados (por ejemplo, distribución de variables numéricas), análisis bivariados (correlación entre variables numéricas y/o categóricas) y cualquier análisis que le ayude al mejor entendimiento de los datos (encontrar patrones, outliers y/o anomalías, entre otros). El reporte debe presentarse en un notebook (.ipynb) con adecuado uso de markdowns y comentarios.

En caso de hacer uso de librerias como pandas_profiling, es indispensable acompañar los graficos con análisis propios.

Dashboard

Debe ser funcional y coherente con el análisis y la historia que vayan a relatar. El archivo debe estar en su repositorio (.pbix, .py o el que aplique).

KPIs

Se deben sugerir 3 KPIs y deben aparecer en el dashboard. Tenga en cuenta que deben tener relación con la historia que está contando. Asimismo, se espera que en la presentación explique el análisis y la funcionalidad de los KPIs sugeridos.

⚠️ Análisis ⚠️

No se calificará solamente la producción de gráficos con datos (dashboard), sino también los análisis y conclusiones que encuentren en ellos.

Repositorio de GitHub

El repositorio debe contener un README principal donde se presente de forma general su proyecto. Presentar como propio el readme proporcionado por Henry será considerado como insuficiente para cumplir con este requerimiento.

Desafíate y no te quedes siendo Junior, sé Junior Advanced

Pensando en alcanzar tu Boom, te recomendamos incorporar los siguientes desafíos para tener un portfolio mucho más completo y competitivo:

  • Crear una base de datos en un motor SQL, ingestar el csv procesado y utilizarla como fuente de datos de su dashboard en Power BI (o la herramienta de visualización que utilice).
  • Redactar un reporte de análisis con base en sus dashboards e incluirlo en el readme de sus repositorios. También debe incluir el análisis y la funcionalidad de los KPIs sugeridos.
  • Ejecutar scripts de python en la herramienta de visualización de datos escogida.
  • Cruce de datos con datasets complementarios.

Nota: la realización de uno o más de estos ítems no es intercambiable con los requerimientos mínimos establecidos en la sección anterior "Propuesta de trabajo". Empiece con esta sección una vez haya cumplido con los requerimientos mínimos, a modo de desafiarse a usted mismo y destacar frente al resto.

Fuente de datos:

Obligatorio:

  • Dataset principal, incluido en el repositorio del proyecto.

Complementario:

Lo que tendremos en cuenta a la hora de evaluar:

Serás evaluado en dos grandes áreas, ambas con igual peso entre si: Tech y Soft!

Las habilidades técnicas (Tech) para este proyecto de analytics incluyen el tipo de herramientas utilizadas para la realización de dashboard (herramientas de Business Intelligence y/o DataViz), elección de gráficas pertinentes para la representación del dato y un dashboard efectivo (organización, uso de filtros y criterios estéticos y de diagramación dónde se ubican los filtros y visualizaciones, títulos adecuados, estandarización de idiomas, entre otros).

Las habilidades blandas (Soft) para este proyecto tendrán en cuenta la puntualidad y preparación para la demo, su comunicación oral y storytelling, la forma en que cuentas tu historia (¿los datos duros que presentas son útiles para tu audiencia?) y finalmente (esto es MUY importante) ⚠️EL ANÁLISIS⚠️ (¿brindas un contexto?, ¿haces comparaciones con otros datos?, ¿tienes conclusiones interesantes y realizas análisis no triviales?).

Spoiler: Te vamos a dar feedback y también vamos a evaluar tu capacidad de recepción a este 😛

Material de apoyo

Recomendaciones finales

¡No debes mostrar nada de código en la exposición! Te recomendamos el workshop From Data to Viz para que te quede más claro la dinámica y lo que se espera de tu demo.

Recordamos que seas puntuales y pruebes el correcto funcionamiento de las herramientas empleadas antes de ingresar a la meet.

La DEMO, donde defenderás tu proyecto, se realizará el día jueves o viernes. Debes estar atent@ a tu calendar para ver qué día y horario te corresponde.

Tendrá una duración total máxima de 30 minutos, de los cuales sólo 10 minutos serán para su presentación. Es importante que sepas gestionar bien tu tiempo y tengas un speech ya preparado de 10 minutos, ya que el tiempo restante será dedicado a la corrección, revisión de repositorio y feedback por parte del Henry Mentor.

Disclaimer

De parte del equipo de Henry se quiere aclarar y remarcar que los fines de los proyectos propuestos son exclusivamente pedagógicos, con el objetivo de realizar proyectos que simulan un entorno laboral, en el cual se trabajan diversas temáticas ajustadas a la realidad. No reflejan necesariamente la filosofía y valores de la organización. Además, Henry no alienta ni tampoco recomienda a los alumnos y/o cualquier persona leyendo los repositorios (y entregas de proyectos) que tomen acciones en base a los datos que pudieran o no haber recabado. Toda la información expuesta y resultados obtenidos en los proyectos nunca deben ser tomados en cuenta para la toma real de decisiones (especialmente en la temática de finanzas, salud, política, etc.).

pi03-analytics's People

Contributors

leandrofranchina avatar hx-fashur avatar cvillarragamo avatar hx-fn3 avatar amarcosd avatar jdeiloff avatar hx-jaragon avatar pjr95 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.