28 de abril de 2022

Gabriela y la dinámica molecular

Hola,

esta mañana leía sobre el descubrimiento de que una mutación en el gen TLR7 es suficiente para causar lupus eritematoso sistémico (LES), una enfermedad autoinmune. La mutación es la sustitución Y264H, deletérea según los programas SIFT y CADD (ver otras opciones aquí), de la que es portadora Gabriela, una chica madrileña. 

El artículo completo está en https://doi.org/10.1038/s41586-022-04642-z , yo quería simplemente destacar parte de la primera figura:

Adaptada del original en https://doi.org/10.1038/s41586-022-04642-z

En el alineamiento múltiple de arriba se puede ver que la tirosina Y264 está muy conservada en animales, y por eso SIFT le asigna una puntuación de 0.12 al cambio por histidina (otras dos mutaciones no sinónimas tienen puntuaciones de 0.05 y 0). 

El panel del medio muestra la unión del ligando guanosina al receptor silvestre TLR7 (Y264) y el de abajo con el receptor mutado, donde se ve que se libera volumen que ocupan varias moléculas de agua, aumentando a la vez la afinidad por la guanosina.

Este análisis fue posible por la disponibilidad de tres estructuras de la proteína ortóloga en Maccaca mulata en el PDB (6IF55GMF y 5GMH), que fueron usadas como punto de partida para hacer varias simulaciones de dinámica molecular que se describen con detalle (3 páginas) en el material suplementario,

hasta pronto,

Bruno

12 de abril de 2022

3D-footprint April 2022 version

Hi,

3D-footprint, our database for the structural analysis of protein-DNA complexes, has been up and running since 2010 (see https://doi.org/10.1093/nar/gkp781). Due to a hardware failure it had been last updated in 2021. Finally we found the time to bring the system up to speed again, now in a Debian environment, and will be releasing new protein-DNA complexes from the PDB quarterly. We will also add the new content to footprintDB.

 

What's new?

 That's all for today,

Bruno

4 de abril de 2022

Dominios de función desconocida (DUF) en proteínas

Hola,

como ya hemos mencionado en otras ocasiones aquí, las proteínas habitualmente tienen uno o más dominios con determinadas funciones. Por eso cuando analizas secuencias de proteínas recursos como Pfam (incluída en Interpro) o CDD son muy útiles.

El crecimiento de las colecciones de secuencias es tan rápido que a veces se definen dominios o familias de proteínas sin saber realmente qué función tienen. Sabemos que existen, porque sus secuencias están conservadas en los genomas de diferentes organismos y se pueden alinear, pero todavía no hay evidencias de en qué procesos bioquímicos participan. Son los llamados Domains of Unknown Function (DUF).

Hace unos unos años Carlos Cantalapiedra y yo descubrimos tránscritos en cebada y en Arabidopsis thaliana que contenían dominios DUF. Entre ellos está por ejemplo DUF3615, pero todavía no sabemos si son importantes o no:

https://www.frontiersin.org/files/Articles/238135/fpls-08-00184-HTML/image_m/fpls-08-00184-g005.jpg

Figura 1. Dominios de Pfam encontrados en tránscritos accesorios de Arabidopsis thaliana (izq) y cebada (der). Fuente: https://doi.org/10.3389/fpls.2017.00184

La continuación de esta historia la encontramos en un artículo muy reciente, donde los autores descubren una pareja de proteínas, una de ellas DUF1644, que tanto en arroz como maiz interaccionan entre ellas y, al hacerlo, afectan al número de granos producidos, un caracter de enorme interés en la agricultura:

Figura 2. Interacción entre KRN2 y DUF1644 confirmada en ensayos Y1H (A) y ensayos de complementación con luciferasa en hojas de tabaco(B). Adaptada de https://doi.org/10.1126/science.abg7985

 

Queda claro que los dominios DUF son una fuente interesante por explorar. Lo lógico sería que con el tiempo se vayan convirtiendo en familias de función conocida, pero la verdad es que este ejemplo tampoco nos dice mucho de la  función de DUF1644, solamente que interacciona con otras proteínas.

Hasta pronto,

Bruno

28 de marzo de 2022

Módulos core en Perl

Hola,

esta mañana estaba leyendo una entrada sobre cómo programar una pareja cliente/servidor TCP minimalista en Perl cuando aprendí una manera de obtener información de módulos core de Perl, los que puedes esperar que estén ya instalados en cualquier sistema o, a menudo, en contenedores Docker.

Es muy sencillo, como veremos con el módulo IO::Socket::INET del ejemplo:

$ corelist IO::Socket::INET 

Que en mi sistema devuelve:

Data for 2019-05-22
IO::Socket::INET was first released with perl v5.6.0


Si arranco un contenedor Docker basado en Ubuntu 18.04 obtengo:

Data for 2017-09-22
IO::Socket::INET was first released with perl v5.6.0

Espero que sea útil,

hasta pronto,

Bruno