23 de julio de 2021

Alphafold2: estructuras de proteínas para todos los públicos

Hola,

el jueves pasado escribía aquí sobre RoseTTAFold, que ponía al alcance de los programadores una potente herramienta para predecir la estructura de cualquier proteína que tenga suficientes secuencias parecidas en los archivos. Unas horas más tarde me enteré de que su principal competidor, AlphaFold2, del que hemos escrito aquí, aquí y aquí , había hecho también sus deberes y publicaba sus modelos neuronales para predecir el plegamiento de secuencias de aminoácidos. Hay muchos hilos en Twitter, como éstos: 1 y 2 .

En un artículo en Nature repasan sus resultados en CASP14, como su notable precisión de 1.5 Å de RMSD para todos los átomos modelados, y muestran que esos resultados excelentes se sostienen en gran medida en un conjunto de 3144 estructuras recientemente publicadas en el Protein Data Bank tras descartar las estructuras conocidas con % identidad de secuencia > 40. El siguiente vídeo resume el proceso de predicción de una secuencia con múltiples dominios y 863 aminoácidos. Recuerdo que la única información de partida es la secuencia de aminoácidos y un alineamiento múltiple de esa secuencia con otras secuencias no redundantes de proteínas homólogas:

 

Fuente: https://www.nature.com/articles/s41586-021-03819-2

Alphafold2 no es perfecto, ya que en la validación contra el PDB hay un en torno a un 25% de predicciones con valores de RMSD elevados, pero en la mayor parte de los casos es excelente:

Una de las fortalezas del método es que es capaz de estimar bien la calidad los modelos que genera (ver Figura 2b de https://www.nature.com/articles/s41586-021-03828-1). Entre las limitaciones reseñadas por los autores del trabajo, destacan:

1) La calidad de las predicciones cae de manera significativa si el alineamiento múltiple de secuencias homólogas a la de interés tiene una profundidad < 30 (leer más aquí). 

2) Las estructuas de Alphafold son de menor calidad para dominios poco compactos, con pocos contactos, como los dominios puente. Esto contrasta con las buenas prestaciones observadas (3) para predecir estructuras cuaternarias de homómeros.

Para los que queráis probarlo hay varias opciones:

i) El contenedor Docker descrito en https://github.com/deepmind/alphafold que ojo, requiere 2.2TB de espacio si instalas todas las bases de datos. 

ii) Un cuaderno Colab con un predictor simplificado en https://colab.research.google.com/github/deepmind/alphafold/blob/main/notebooks/AlphaFold.ipynb

iii) Las predicciones ya disponibles en UniProt para un total de 21 especies (https://alphafold.ebi.ac.uk/download), incluyendo 4 plantas (Arabidopsis thaliana, soja, arroz y maíz). Puedes leer más en 4, 5 y 6 y 7.

Hasta pronto,

Bruno

17 comentarios:

  1. https://www.embl.org/news/science/thornton-alphafold/

    ResponderEliminar
  2. AlphaFold2 predice desorden con precisión:
    https://twitter.com/_BalintMeszaros/status/1419579483921731591

    ResponderEliminar
  3. https://science.sciencemag.org/content/373/6557/835

    ResponderEliminar
  4. https://mobile.twitter.com/thesteinegger/status/1430542140875055104

    ResponderEliminar
  5. https://www.blopig.com/blog/2021/07/alphafold-2-is-here-whats-behind-the-structure-prediction-miracle/

    ResponderEliminar
  6. https://medium.com/swlh/a-simple-overview-of-rnn-lstm-and-attention-mechanism-9e844763d07b

    ResponderEliminar
  7. https://twitter.com/RolandDunbrack/status/1432860702532845568

    ResponderEliminar
  8. La manera más fácil de hacer predicciones con AlphaFold, con el software Chimera: https://www.youtube.com/watch?v=le7NatFo8vI

    Parece que funciona con secuencias de hasta 700aa y tarda 1h por secuencia

    ResponderEliminar
  9. Éste lo probó Pablo: https://github.com/sokrypton/ColabFold

    ResponderEliminar
  10. https://twitter.com/DeepMind/status/1455589083611271169?s=20

    ResponderEliminar
  11. https://www.science.org/doi/full/10.1126/science.acx9610

    ResponderEliminar
  12. https://twitter.com/MoAlQuraishi/status/1459188604723351552

    ResponderEliminar
  13. https://www.nature.com/articles/s41594-021-00714-2

    ResponderEliminar
  14. https://www.nature.com/articles/s41592-021-01361-7

    ResponderEliminar
  15. https://doi.org/10.1126/science.abn9422

    ResponderEliminar
  16. https://www.nature.com/articles/s41592-023-02087-4

    ResponderEliminar
  17. combfold: https://www.nature.com/articles/s41592-024-02174-0

    ResponderEliminar