Code Monkey home page Code Monkey logo

lmf_proy.py's Introduction

LMF_proy.py

Este programa sirve para buscar y analizar unas proteínas query en una serie de genomas bacterianos.

USO:

usage: main.py [-h] [-p PROYECTO] [-c COVERAGE] [-i IDENTITY] carpeta query

Argumentos posicionales, obligatorios

Argumento Descripcion
carpeta Directorio que contiene los genomas bacterianos en formato genbank
query Fichero tipo fasta que contiene las proteíans que se quieren buscar en los genomas bacterianos

Argumentos opcionales

Argumento Descripción
-h, --help Muestra el mensaje de ayuda y termina el proceso
-p PROYECTO, --proyecto PROYECTO Nombre del proyecto
-c COVERAGE, --coverage COVERAGE Por defecto se define como 50
-i IDENTITY, --identity IDENTITY Por defecto se define como 30

TAREAS:

Para este análisis, realiza una serie de tareas:

  • BLASTP: Va a comparar las secuencias de nuestras proteínas con las proteínas de los genomas bacterianos. De esta forma, obtendremos como resultado solo aquellas proteínas del genoma que tienen una cierta similitud con la proteína query.

  • Árbol filogenético: Utilizando MUSCLE, se van a alinear las secuencias y se va a generar un árbol filogenético Neighbor-Joining (N-J) para cada proteína query.

  • Búsqueda de dominios: Encuentra los dominios proteicos presentes en las secuencias obtenidas en el BLASTP.

FICHEROS Y CARPETAS QUE CREA:

Se va a crear una carpeta con el nombre del proyecto que contiene una carpeta "resultados" y una carpeta "data"

Carpeta Resultados

Por cada proteína query, se van a crear una serie de archivos que se guardarán dentro de la carpeta "resultados":

  • blast_{query}.tsv : El resultado del BLASTP con los datos de evalue, identidad y cobertura además del nombre y secuencia de las proteínas subject

  • {query}.fasta : Un fichero tipo fasta con todos los hits del BLASTP, incluidos la secuencia y el identificador de la query

  • align_{query}.fa : Las secuencias de las proteínas alineadas mostradas en formato fasta

  • tree_{query}.nw : Árbol filogenético tipo N-J como fichero de texto preparado para ser introducido en programas como iTOL que lo dibujan.

  • dominios_{query}.txt : Fichero de texto con información sobre los dominios de PROSITE encontrados en las secuencias de los hits del BLASTP.

Carpeta Data:

Va a copiar los archivos con los genomas bacterianos que se han utilizado para correr el script y el archivo con las proteínas query. Además, también se creará la genoteca tipo fasta con todos los genomas bacterianos.

INSTALACIÓN:

Requiere la instalación de BLAST y BIOPYTHON

OTROS:

Se requiere la presencia del fichero "prosite.dat" en la carpeta desde la que se ejecuta el programa

lmf_proy.py's People

Contributors

luciamartinf avatar

Stargazers

 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.