Por
Dentro de cada célula, miles de proteínas diferentes forman la maquinaria que mantiene vivos y en buen estado a todos los seres vivos, desde los humanos y las plantas hasta las bacterias microscópicas. Casi todas las enfermedades, incluido el cáncer, la demencia e incluso enfermedades infecciosas como COVID-19, están relacionados con la forma en que funcionan estas proteínas. Debido a que la función de cada proteína está directamente relacionada con su forma tridimensional, los científicos de todo el mundo se han esforzado durante medio siglo para encontrar un método rápido y preciso que les permita descubrir la forma de cualquier proteína.
Hoy (lunes), los investigadores del 14 ° Experimento comunitario sobre la evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP14) anunciarán que se ha encontrado una solución de inteligencia artificial (IA) para el desafío.
Sobre la base del trabajo de cientos de investigadores de todo el mundo, un programa de inteligencia artificial llamado AlphaFold, creado por el laboratorio de inteligencia artificial DeepMind con sede en Londres, ha demostrado ser capaz de determinar la forma de muchas proteínas. Lo ha hecho a un nivel de exactitud comparable al logrado con experimentos de laboratorio costosos y que requieren mucho tiempo.
CASP14 está organizado por el Dr. John Moult (presidente), Universidad de Maryland, EE. UU.; Dr. Krzysztof Fidelis, UC Davis, Estados Unidos; Dr. Andriy Kryshtafovych, UC Davis, Estados Unidos; Dr. Torsten Schwede, Universidad de Basilea y Instituto Suizo de Bioinformática SIB, Suiza; y la Dra. Maya Topf, Birkbeck, Universidad de Londres, Reino Unido y CSSB (HPI y UKE) Hamburgo, Alemania.
El Dr. Moult dijo: “Las proteínas son moléculas extremadamente complicadas, y su estructura tridimensional precisa es clave para las muchas funciones que desempeñan, por ejemplo, la insulina que regula los niveles de azúcar en la sangre y los anticuerpos que nos ayudan a combatir las infecciones. Incluso los pequeños reordenamientos de estas moléculas vitales pueden tener efectos catastróficos en nuestra salud, por lo que una de las formas más eficientes de comprender las enfermedades y encontrar nuevos tratamientos es estudiar las proteínas involucradas.
“Hay decenas de miles de proteínas humanas y muchos miles de millones en otras especies, incluidas bacterias y virus, pero determinar la forma de una sola requiere equipos costosos y puede llevar años.
“Hace casi 50 años, Christian Anfinsen recibió un premio Nobel por demostrar que debería ser posible determinar la forma de las proteínas en función de su secuencia de aminoácidos – los bloques de construcción individuales que componen las proteínas. Es por eso que nuestra comunidad de científicos ha estado trabajando en el desafío CASP bienal ”.
Los equipos que participan en el desafío CASP reciben el amino ácido secuencias para un conjunto de alrededor de 100 proteínas. Mientras los científicos estudian las proteínas en el laboratorio para determinar su forma experimentalmente, alrededor de 100 equipos CASP participantes de más de 20 países intentarán hacer lo mismo usando computadoras. Los resultados son evaluados por científicos independientes.
El Dr. Fidelis dijo: “El enfoque CASP ha creado una intensa colaboración entre los investigadores que trabajan en este campo de la ciencia y hemos visto cómo ha acelerado los avances científicos.
“Desde que realizamos el desafío por primera vez en 1994, hemos visto una sucesión de descubrimientos, cada uno de los cuales resolvió un aspecto de este problema, de modo que los modelos computarizados de estructuras de proteínas se han vuelto progresivamente más útiles en la investigación médica”.
Durante la última ronda del desafío, el programa AlphaFold de DeepMind ha determinado la forma de alrededor de dos tercios de las proteínas con una precisión comparable a la de los experimentos de laboratorio *. La precisión de AlphaFold con la mayoría de las otras proteínas también fue alta, aunque no del todo a ese nivel.
Los organizadores de CASP dicen que este éxito se basa en los logros alcanzados en rondas anteriores de CASP, tanto por el equipo DeepMind como por otros participantes, y que otros equipos que participan en CASP14 también han producido algunas estructuras de alta precisión durante esta ronda.
El Dr. Kryshtafovych dijo: “Lo que AlphaFold ha logrado es verdaderamente notable y el anuncio de hoy es una victoria para DeepMind, pero también es un triunfo para la ciencia en equipo. La forma única e intensa en que colaboramos con investigadores de todo el mundo a través de CASP, y las contribuciones de muchos equipos de científicos a lo largo de los años, nos han llevado a este gran avance «.
Y añade: “Ser capaz de investigar la forma de las proteínas de forma rápida y precisa tiene el potencial de revolucionar las ciencias de la vida. Ahora que el problema se ha resuelto en gran medida para las proteínas individuales, queda abierto el camino para el desarrollo de nuevos métodos para determinar la forma de los complejos de proteínas: colecciones de proteínas que trabajan juntas para formar gran parte de la maquinaria de la vida y para otras aplicaciones «.
La profesora Dame Janet Thornton, directora emérita del Instituto Europeo de Bioinformática de EMBL (EMBL-EBI), que no está afiliado a CASP o DeepMind, dijo: “Uno de los mayores misterios de la biología es cómo se pliegan las proteínas para crear estructuras tridimensionales exquisitamente únicas. Cada ser vivo, desde las bacterias más pequeñas hasta las plantas, los animales y los humanos, está definido y alimentado por las proteínas que lo ayudan a funcionar a nivel molecular.
“Hasta ahora, este misterio seguía sin resolverse, y determinar la estructura de una sola proteína a menudo requería años de esfuerzo experimental. Es tremendo ver el triunfo de la curiosidad, el esfuerzo y la inteligencia humanos para resolver este problema. Una mejor comprensión de las estructuras de las proteínas y la capacidad de predecirlas utilizando una computadora significa una mejor comprensión de la vida, la evolución y, por supuesto, la salud y las enfermedades humanas «.
* AlphaFold produjo modelos para aproximadamente dos tercios de las proteínas diana CASP14 con puntajes de prueba de distancia global superiores a 90 de 100. Por encima del umbral de 90 puntajes, las diferencias restantes entre los modelos y las estructuras experimentales son pequeñas y del tamaño esperado para experimentos artefactos y errores, y conformaciones locales alternativas de baja energía. Tenga en cuenta que estos objetivos CASP son proteínas o dominios individuales, no complejos de proteínas, que son la próxima frontera. La prueba de distancia global es una medida de qué tan cerca la forma del modelo de proteína coincide con la forma de los experimentos de laboratorio: Zemla A, Venclovas, Moult J, Fidelis K.Procesamiento y evaluación de predicciones en CASP4. Proteins 2001; Supl. 5: 13-21; Zemla A. LGA: un método para encontrar similitudes 3D en estructuras de proteínas. Res ácidos nucleicos 2003; 31 (13): 3370-3374).
Reunión: 14º Experimento comunitario sobre la evaluación crítica de técnicas para la predicción de la estructura de proteínas.
Financiamiento: Las operaciones de CASP están parcialmente apoyadas por una subvención de los Institutos Nacionales de Salud, NIH R01GM100482.