Hola,
hace poco más de un año compartíamos en este blog que las predicciones estructurales de AlphaFold2 estaban ya disponibles para un total de 21 especies en UniProt, incluyendo 4 plantas (Arabidopsis thaliana, soja, arroz y maíz). El artículo donde se describió formalmente es https://doi.org/10.1093/nar/gkab1061
Qué ha pasado en este tiempo? Pues al grupo de Christine Orengo y sus colaboradores les ha dado tiempo a analizar estas 365.184 predicciones en el contexto de su base de datos de plegamientos de proteínas CATH (puedes leer un poco de contexto aquí) y han descubierto varias cosas interesantes:
- las especies que han ganado más anotaciones estructurales de proteínas en proporción son plantas (soja, arroz y maíz)
- Tras seleccionar los modelos 3D de AlphaFold2 que consideran de buena calidad (tras eliminar los desordenados por ejemplos), el 92% se pueden asignar a superfamilias ya existentes en CATH. Por tanto, hay indicios de que AlphaFold2 podría haber descubierto nuevos plegamientos. Sin embargo, hará falta más trabajo para confirmarlo.
- Los modelos de AlphaFold2 enriquecen de manera significativa (36%) las conformaciones de las superfamilias de plegamientos conocidas en CATH:
Puedes leer el artículo completo en https://www.biorxiv.org/content/10.1101/2022.06.02.494367v1 y una digestión alternativa en Twitter: https://twitter.com/ewanbirney/status/1568970047720235010
Cómo acceder a estos modelos 3D? Ahora mismo lo más fácil es UniProt pero se están integrando también en Ensembl Plants (ver ejemplo).
Hasta pronto,
Bruno