24 de febrero de 2020

Pon tu conocimiento de plantas al servicio de UniProt

Hola,
esta mañana escuché a Michele Magrane explicar cómo funciona el proceso de curación de literatura en UniProt, la colección de proteínas más importante del mundo, que desarrollan entre el EBI, PIR y SIB. Por si no lo sabéis, la curación es el proceso por el que personas expertas extraen información y evidencias experimentales de artículos para agregarla de manera trazable a secuencias de proteínas.

Tras explicarnos que el núcleo (SwissProt) apenas pasa del medio millón de secuencias y que la parte automatizada se acerca a los 180 millones, nos dijo que creen que el proceso de curación es escalable, como describen en este artículo, dado que solamente un porcentaje muy pequeño de los artículos que se publican (3%) les sirven para anotar sus proteínas.

En cuanto a los plantas, mencionó que fundamentalmente curan artículos de Arabidopsis thaliana y Oryza sativa, por este orden. 

Felizmente es posible sugerir artículos para proteínas de UniProt, y de esa manera contribuir a su anotación y curación por expertos. Para ello solamente necesitas un identificador ORCID y un artículo publicado que hayas leído y que contribuya a describir la proteína en cuestión. En la figura verás el enlace "Add a publication" arriba a la derecha:

https://www.uniprot.org/uniprot/Q5Y386/protvista

Manos a la obra,
Bruno

6 de febrero de 2020

Valida con Travis tu código en un repositorio GitHub

Hola,
tras escuchar un par de charlas en la London Perl Conference 2019 (vídeos aquí) tenía pendiente agregar una validación por integración continua a uno de nuestros repositorios en GitHub. Opté por Travis, aunque otra buena opción si empiezas de cero es https://about.gitlab.com 
https://travis-ci.org



Para qué sirve esto? Pues para no romper nada en bases de código que ya tienen un cierto tamaño cuando haces cambios a lo largo del tiempo. En mi caso, el repositorio https://github.com/eead-csic-compbio/get_homologues tiene más de 20K líneas de código y acumula actualizaciones (commits) desde noviembre de 2016. Al vincular este repositorio a Travis (https://travis-ci.com/eead-csic-compbio/get_homologues) cada vez que hago un nuevo commit/push se lanza una máquina virtual que hace una batería de tests y me informa si va todo bien o si algo se ha roto.

Es sencillo, debes seguir estos pasos:

  1. Vincular tu repositorio GitHub en https://travis-ci.com con el mismo usuario que usas en GitHub.
  2. Agrega al repositorio un fichero .travis.yml con instrucciones para que Travis sepa como instalar correctamente el código del repositorio y sus dependencias. Puedes comprobar mi ejemplo .travis.yml , adecuado para un proyecto en Perl. Verás que las dependencias de Perl están en el fichero cpanfile. Hay documentación para otrs lenguajes, por ejemplo python .
  3. En tu repositorio preparar una batería de tests o pruebas para comprobar que todo funciona cómo esperas. Por defecto Travis hace $ make test, por tanto lo más fácil es crear un fichero Makefile con un objetivo test incluído. Ejemplo: Makefile
  4.  En el fichero markdwon README.md de tu repositorio puedes agregar la siguiente línea, adaptada a tu proyecto, para tener el certificado actualizado de que el repositorio pasa los tests en su estado actual:
    [![Build Status](https://travis-ci.com/eead-csic-compbio/get_homologues.svg?branch=master)](https://travis-ci.com/eead-csic-compbio/get_homologues)
Hasta pronto, Bruno

5 de febrero de 2020

Recursos y presentaciones del NCBI en PAG2020

Hola,
para empezar el año la gente genómica a menudo se cita en una de las conferencias más importantes del año, PAG . Allí se juntan los consorcios que producen los genomas último modelo de animales y plantas, las empresas que fabrican los instrumentos y reactivos, y los grupos que desarrollan los algoritmos y herramientas que lo sostienen todo, como el EBI o el NCBI.

Precisamente de éstos últimos hablo hoy, para compartir con vosotros los recursos y presentaciones que este año hicieron en PAG, entre los que destacaría:
https://github.com/NCBI-Hackathons/TheHumanPangenome

Que aproveche y hasta pronto,
Bruno