Mostrando entradas con la etiqueta biología computacional. Mostrar todas las entradas
Mostrando entradas con la etiqueta biología computacional. Mostrar todas las entradas

22 de julio de 2024

La brecha de la biología computacional en español

Hoy me encontré un artículo del reciente ISMB2024 que lleva por nombre 'Closing the computational biology ‘knowledge gap’: Spanish Wikipedia as a case study' y que podéis leer en https://doi.org/10.1093/bioinformatics/btae247.  Este trabajo analiza la brecha que hay en recursos didácticos sobre bioinformática en otras lenguas más allá del inglés, tomando el español como ejemplo. 

¿Por qué necesitamos estos recursos los hispanohablantes? Porque casi la mitad no hablaban otra lengua en 2016 y porque para escribir o hablar sobre ciencia nos cuesta mucho más en inglés. En biología computacional en concreto, sólo una quinta parte de los artículos en inglés en la Wikipedia tienen un equivalente en español, y la brecha es mayor aún en otras lenguas, como se ve en la figura:

Original en https://academic.oup.com/view-large/figure/468774084/btae247f2.tif. Datos y código aquí.

Una manera de cerrar la brecha es organizar talleres/competiciones para trabajar sobre la Wikipedia, como hicieron en ISCB-LA SOIBIO BioNetMX 2022. Como resultado, los participantes lograron mejorar de manera significativa algunas páginas con contenidos bioinformáticos en español, quedando en primer lugar 'pangenoma':

Original en https://academic.oup.com/view-large/figure/468774085/btae247f3.tif

Termino invitando a revisar nuestros materiales en español, que podéis encontrar junto con otros en inglés en https://eead-csic-compbio.github.io/matdidactico.html

Hasta luego,

Bruno

 

2 de junio de 2023

Aprende Bioinformática en España en 2023

Hola,

hoy comparto un documento que ha publicado la asociación de jóvenes bioinformáticos de Granada (BioInfoGRX).

https://bioinformaticsgrx.es/wp-content/uploads/2021/11/Main-web2.png

Se trata de la guía "Aprende BioInformática", que se ocupa de:

  • Estudiar BioInformática en España (grados y másters)
  • Cursos online de BioInformática (biología, programacion y analisis de datos)


Es un documento dinámico que actualizará su contenido periódicamente. Puedes sugerir cambios en bioinformaticsgrx@gmail.com y descargarlo en:

https://bioinformaticsgrx.es/wp-content/uploads/2022/02/Gui%CC%81a-formativa-en-bioinforma%CC%81tica.docx.pdf


Espero sea útil,

Bruno


21 de abril de 2021

Dos versiones del mismo genoma: el caso de la cebada

Hola,

una de las plantas con las que hemos trabajado más en los últimos años es la cebada (Hordeum vulgare), un cultivo de enorme importancia en el secano de la península ibérica (ver por ejemplo https://www.eead.csic.es/barley). Puedes leer aquí sobre otros genomas de plantas y para qué los usamos.

La cebada es una especie diploide con un genoma haploide de 5.3 Gbp repartidos en 7 cromosomas, con un %GC=44.5. Es un genoma de gran complejidad que ha requerido un esfuerzo de al menos un década por parte de un consorcio internacional. Las diferentes etapas de la secuenciación y ensamblaje del cultivar Morex se pueden recorrer en:

Mi intención es mostrar cuánto pueden cambiar dos versiones del mismo genoma a medida que se incorporan nuevas tecnologías, en este caso lecturas largas PacBio (circular consensus sequencing, CCS). 

En este ejemplo comparamos la versión más reciente (MorexV3) respecto a una anterior (IBSC_v2). Si consultamos el European Nucleotide Archive, podemos ver sus estadísticas generales (verás que he puesto en negrita los cambios más notables):
 

IBSC_v2 (GCA_901482405.1)

Total Length:           4,833,791,107
Ungapped Length:        4,446,895,020
Chromosomes & Plasmids:             0
Spanned Gaps:               1,030,196
Scaffolds:                          8
Scaffold N50:             657,224,000
Contigs:                    1,030,204
Contig N50:                    19,388
MorexV3 (GCA_904849725.1)
Total Length:           4,225,577,519
Ungapped Length:        4,224,251,725
Chromosomes & Plasmids:             7
Spanned Gaps:                     162
Scaffolds:                        290
Scaffold N50:             610,333,535
Contigs:                          452  
Contig N50:                69,630,691 

Se puede ver que el nuevo ensamblaje es más pequeño, contiene muchos menos huecos (gaps) y tiene 7 cromosomas construidos a partir de un conjunto de apenas 452 contigs enormes.

En cuanto a la anotación, tomando datos de Ensembl Plants, si la versión IBSC_v2 tenía 39,841 genes codificantes de proteínas de "alta confianza, HC", la más reciente tiene 35,825. Finalmente, si mapeamos con bwa SNPs de IBSC_v2 en ventanas de 150 nucleótidos contra el nuevo genoma, de un total de 16.5M logramos 13.4M mapeos únicos y perdemos 2.7M SNPs por el camino (un 16%).

En la versión de 2021 Mascher et al hacen incapié en la significante ganancia en la calidad de las anotaciones de elementos repetidos, como se ve en la figura para los retrotransposones del tipo BARE1: 

 

                               Fuente: https://doi.org/10.1093/plcell/koab077

En resumen, el nuevo genoma es sustancialmente diferente al anterior y visto lo visto, seguramente no sea el último, aunque todos ellos han sido muy útiles sin duda,

Bruno

17 de junio de 2014

postdoc computational systems biology Luxemburg

Postdoctoral Fellow in Computational Systems Biology at the Luxembourg Centre for Systems Biomedicine in collaboration with the Black Family Stem Cell Institute of the Mount Sinai School of Medicine

http://www.nature.com/naturejobs/science/jobs/425291-postdoctoral-fellow-in-systems-biology

The Computational Biology Group seeks a highly skilled and motivated Postdotoral Fellow to work on an exciting project on the application of network biology approaches to study the role of gene expression stochasticity in cell fate commitment. In particular, the selected candidate shall develop a computational model that integrates transcriptomics and epigenomics data to describe heterogeneity in embryonic stem cells and its implication in differentiation. Single cell and cell perturbation experiments will be performed in order to validate the predictions generated by the model. This project will be carried out in collaboration with Profs. Ihor Lemischka and Kateri Moore at the Black Family Stem Cell Institute of the Mount Sinai School of Medicine. The selected applicant will have the opportunity to visit the experimental labs of our collaborators at the Mount Sinai School of Medicine.

Requirements of the ideal candidate:

  • Ph.D. in Bioinformatics, Computer Science, Biology or a related discipline
  • Strong computational skills
  • Prior experience in mathematical modelling of biological networks, especially in network inference and analysis
  • A strong first-author publication record in the fields of Bioinformatics and Computational Biology
  • Excellent working knowledge in English.

We offer:

  • Opportunity to do applied research to medical problems within a highly dynamic research institution (LCSB) and in collaboration with internationally recognized partners
  • An exciting international environment
  • A very competitive salary

For further information, please contact:

Prof. Dr. Antonio del Sol, Luxembourg Centre for Systems Biomedicine
E-mail: antonio.delsol@uni.lu

9 de mayo de 2014

2nd CNB Course on Introduction to Research

Hola,
pego un anuncio de un curso para estudiantes interesados en investigar que se realizará en Madrid del  30 de Junio al 25 de Julio en el Centro Nacional de Biotecnología-CSIC, que me parece puede ser una excelente oportunidad para algunos de los seguidores del blog. Los alumnos elegidos tendrán la oportunidad de interaccionar con investigadores de todas las áreas del centro, y en concreto en el departamento de Biología de Sistemas hay varios grupos con tradición en la formación en biología computacional.




Toda la información en http://tinyurl.com/lnqtmgp.
 
Un saludo,
Bruno

25 de marzo de 2014

XII Jornadas de Bioinformática / XII Symposium on Bioinformatics

Hola,
hoy damos difusión a las pŕoximas Jornadas de Bioinformática, el mayor evento científico sobre biología computacional en España. Esta es la información que tengo de momento:


The XII Symposium on Bioinformatics (XII Jornadas de Bioinformática) will take place on 21-24 September in Sevilla, Spain, at cicCartuja (CSIC-US). 

The 21st will be the student symposium, and the main conference will start on Monday the 22nd. The URL for the meeting is: 


http://www.bioinformaticsconference2014.org/

(programme/committees are still preliminar, but will be updated periodically)
With the aim of encouraging the participation of younger bioinformaticians this year’s symposium main theme is “Bioinformatics: The New Breed”.Abstracts topics include but are not limited to:
  • Integrative Biology (NGS, -omics technologies...)
  • Structural Bioinformatics and function prediction
  • Algorithms, method, and tools development
  • Metagenomics
  • Medical Informatics 

    Abstract submission closes Thursday, July 31, 2014 

PD 25 de Agosto: nuestro laboratorio presentará dos charlas seleccionadas en las secciones de Metagenómica y Estructura y Función. Además Álvaro Sebastián, colaborador habitual del blog presentará un libro de texto sobre Bioinformática en español, en la sección The Unworkshop format.

9 de noviembre de 2013

Trucos para la biología computacional

Buenas,
hoy quiero invitaros a leer lo que nos cuentan dos bioinformáticos (Mick Watson y Nick Loman) sobre el trabajo y el aprendizaje de este oficio, publicado en Nature Biotechnology. Además de tocar temas más relacionados con el desarrollo de software (como el control de versiones) y la construcción de tuberías de análisis, el artículo repasa obviedades que no obstante conviene no olvidar, como
"knowledge of biology is vital in the interpretation of computational results"
 u otra más concreta:
 "Laboratory scientists wouldn’t dream of running experiments without the necessary positive and negative controls... tests are the computational biology equivalent".
El texto, breve, toca temas importantes como la elección apropiada de métodos en bioinformática, la validación de tu propio código y el que te descargaste de otros autores, y la búsqueda de opiniones expertas en foros como SEQanswers. Si te interesa, puedes seguir leyendo en http://www.nature.com/nbt/journal/v31/n11/full/nbt.2740.html?WT.ec_id=NBT-201311,
un saludo,
Bruno

14 de octubre de 2013

Premio Nobel en biología computacional

Buenos días,
han pasado ya unos días desde el anuncio, pero hasta hoy no he caído en que sería buena idea hablar en este blog sobre el reciente premio Nobel de Química, que ha caído sobre los hombros de Michael Levitt, Martin Karplus y Arieh Warshel. He de reconocer que al último no le conocía, pero a los dos primeros les he leído, visto en congresos y escuchado mencionar muchas veces a lo largo de mi aprendizaje, sobre todo en la vertiente estructural de la bioinformática.


Martin Karplus es famoso por sus trabajos sobre dinámica de macromoléculas, a menudo apoyados por datos cristalográficos,  y por el desarrollo de CHARMM. Por tanto, creo que tiene un perfil muy fuerte en química.

Sin embargo, Levitt ha tenido un papel muy relevante en la bioinformática estructural y en el desarrollo de algoritmos, y por tanto creo que es justo decir que ha sido muy influyente en el desarrollo de nuestra disciplina. Prueba de ello es que participa en los consejos editoriales de revistas que han sido clave en nuestra área como Journal of Molecular Biology, PNAS y PLoS Computational Biology, y que ha participado como evaluador en CASP. Además, como recoge una reciente nota de la ISCB, sus propias palabras traen un poco de este premio a la biología computacional:

“It’s sort of nice in more general terms to see that computational science, computational biology is being recognized. [...] It’s become a very large field and it’s always in some ways been the poor sister, or the ugly sister, to experimental biology.”

Así que estamos de enhorabuena, verdad?
Un saludo, Bruno

Añadido el 15/11/2013:
http://www.sciencedirect.com/science/article/pii/S0022283613006943

Añadido el 04/12/2013:
http://www.pnas.org/content/110/49/19656.extract.html