La IA predice las formas de las moléculas futuras

Desde hace algunos años, John McGeehan, biólogo y director del Centro de Innovación de Enzimas en Portsmouth, Inglaterra, ha estado buscando una molécula que pudiera descomponer las 150 millones de toneladas de botellas de refrescos y otros desechos plásticos esparcidos por todo el mundo.

Trabajando con investigadores de ambos lados del Atlántico, ha encontrado algunas buenas opciones. Pero su tarea es la del cerrajero más exigente: identificar los compuestos químicos que por sí solos se retorcerán y doblarán en la forma microscópica que puede encajar perfectamente en las moléculas de una botella de plástico y dividirlas, como una llave que abre una puerta. .

Determinar el contenido químico exacto de cualquier enzima es un desafío bastante simple en estos días. Pero identificar su forma tridimensional puede implicar años de experimentación bioquímica. Así que el otoño pasado, después de leer que un laboratorio de inteligencia artificial en Londres llamado DeepMind había construido un sistema que predice automáticamente las formas de las enzimas y otras proteínas, el Dr. McGeehan le preguntó al laboratorio si podía ayudar con su proyecto.

Hacia el final de una semana laboral, envió a DeepMind una lista de siete enzimas. El lunes siguiente, el laboratorio devolvió las formas de los siete. “Esto nos llevó un año por delante de donde estábamos, si no dos”, dijo el Dr. McGeehan.

Ahora, cualquier bioquímico puede acelerar su trabajo de la misma manera. El jueves, DeepMind lanzó las formas previstas de más de 350.000 proteínas, los mecanismos microscópicos que impulsan el comportamiento de las bacterias, los virus, el cuerpo humano y todos los demás seres vivos. Esta nueva base de datos incluye las estructuras tridimensionales de todas las proteínas expresadas por el genoma humano, así como las de las proteínas que aparecen en otros 20 organismos, incluidos el ratón, la mosca de la fruta y la bacteria E. coli.

Este vasto y detallado mapa biológico, que proporciona aproximadamente 250.000 formas que antes se desconocían, puede acelerar la capacidad de comprender enfermedades, desarrollar nuevos medicamentos y reutilizar los existentes. También puede conducir a nuevos tipos de herramientas biológicas, como una enzima que descompone de manera eficiente las botellas de plástico y las convierte en materiales que se pueden reutilizar y reciclar fácilmente.

Deberías leer:   ¿Buscas amor después del bloqueo? Las aplicaciones de citas de nicho son la próxima gran novedad

“Esto puede llevarlo adelante en el tiempo: influir en la forma en que piensa acerca de los problemas y ayudar a resolverlos más rápido”, dijo Gira Bhabha, profesor asistente en el departamento de biología celular de la Universidad de Nueva York. “Ya sea que estudies neurociencia o inmunología, sea cual sea tu campo de biología, esto puede ser útil”.

Este nuevo conocimiento es su propio tipo de clave: si los científicos pueden determinar la forma de una proteína, pueden determinar cómo otras moléculas se unirán a ella. Esto podría revelar, digamos, cómo las bacterias resisten a los antibióticos y cómo contrarrestar esa resistencia. Las bacterias resisten a los antibióticos al expresar ciertas proteínas; si los científicos pudieran identificar las formas de estas proteínas, podrían desarrollar nuevos antibióticos o nuevos medicamentos que las supriman.

En el pasado, identificar la forma de una proteína requería meses, años o incluso décadas de experimentos de prueba y error con rayos X, microscopios y otras herramientas en la mesa de laboratorio. Pero DeepMind puede reducir significativamente la línea de tiempo con su tecnología de inteligencia artificial, conocida como AlphaFold.

Cuando el Dr. McGeehan envió a DeepMind su lista de siete enzimas, le dijo al laboratorio que ya había identificado formas para dos de ellas, pero no dijo cuáles dos. Esta fue una forma de probar qué tan bien funcionaba el sistema; AlphaFold pasó la prueba, prediciendo correctamente ambas formas.

Fue aún más notable, dijo el Dr. McGeehan, que las predicciones llegaran en unos días. Más tarde se enteró de que AlphaFold había completado la tarea en tan solo unas horas.

AlphaFold predice estructuras de proteínas utilizando lo que se llama una red neuronal, un sistema matemático que puede aprender tareas analizando grandes cantidades de datos, en este caso, miles de proteínas conocidas y sus formas físicas, y extrapolando a lo desconocido.

Esta es la misma tecnología que identifica los comandos que ladras en tu teléfono inteligente, reconoce caras en las fotos que publicas en Facebook y que traduce un idioma a otro en Google Translate y otros servicios. Pero muchos expertos creen que AlphaFold es una de las aplicaciones más poderosas de la tecnología.

Deberías leer:   Facebook crea un equipo ejecutivo para trabajar en metaverso

“Demuestra que la IA puede hacer cosas útiles en medio de la complejidad del mundo real”, dijo Jack Clark, uno de los autores del Índice de IA, un esfuerzo por rastrear el progreso de la tecnología de inteligencia artificial en todo el mundo.

Como descubrió el Dr. McGeehan, puede ser muy preciso. AlphaFold puede predecir la forma de una proteína con una precisión que compite con los experimentos físicos alrededor del 63 por ciento de las veces, según pruebas de referencia independientes que comparan sus predicciones con estructuras proteicas conocidas. La mayoría de los expertos habían asumido que aún faltaban años para una tecnología tan poderosa.

“Pensé que tomaría otros 10 años”, dijo Randy Read, profesor de la Universidad de Cambridge. “Este fue un cambio completo”.

Pero la precisión del sistema varía, por lo que algunas de las predicciones en la base de datos de DeepMind serán menos útiles que otras. Cada predicción en la base de datos viene con una “puntuación de confianza” que indica qué tan precisa es probable que sea. Los investigadores de DeepMind estiman que el sistema proporciona una “buena” predicción alrededor del 95 por ciento de las veces.

Como resultado, el sistema no puede reemplazar completamente los experimentos físicos. Se utiliza junto con el trabajo en la mesa de laboratorio, ayudando a los científicos a determinar qué experimentos deben realizar y llenando los vacíos cuando los experimentos no tienen éxito. Usando AlphaFold, investigadores de la Universidad de Colorado Boulder, ayudaron recientemente a identificar una estructura de proteína que habían luchado por identificar durante más de una década.

Los desarrolladores de DeepMind han optado por compartir libremente su base de datos de estructuras de proteínas en lugar de vender el acceso, con la esperanza de impulsar el progreso en las ciencias biológicas. “Estamos interesados ​​en el máximo impacto”, dijo Demis Hassabis, director ejecutivo y cofundador de DeepMind, que es propiedad de la misma empresa matriz que Google, pero opera más como un laboratorio de investigación que como una empresa comercial.

Algunos científicos han comparado la nueva base de datos de DeepMind con el Proyecto Genoma Humano. Completado en 2003, el Proyecto Genoma Humano proporcionó un mapa de todos los genes humanos. Ahora, DeepMind ha proporcionado un mapa de las aproximadamente 20.000 proteínas expresadas por el genoma humano, otro paso hacia la comprensión de cómo funcionan nuestros cuerpos y cómo podemos responder cuando las cosas van mal.

Deberías leer:   Ganancias de Pinterest (PINS) segundo trimestre de 2021

También se espera que la tecnología continúe evolucionando. Un laboratorio de la Universidad de Washington ha construido un sistema similar llamado RoseTTAFold y, al igual que DeepMind, ha compartido abiertamente el código informático que impulsa su sistema. Cualquiera puede utilizar la tecnología y cualquiera puede trabajar para mejorarla.

Incluso antes de que DeepMind comenzara a compartir abiertamente su tecnología y datos, AlphaFold estaba alimentando una amplia gama de proyectos. Los investigadores de la Universidad de Colorado están utilizando la tecnología para comprender cómo las bacterias como la E. coli y la salmonela desarrollan resistencia a los antibióticos y para desarrollar formas de combatir esta resistencia. En la Universidad de California, San Francisco, los investigadores han utilizado la herramienta para mejorar su comprensión del coronavirus.

El coronavirus causa estragos en el cuerpo a través de 26 proteínas diferentes. Con la ayuda de AlphaFold, los investigadores han mejorado su comprensión de una proteína clave y esperan que la tecnología pueda ayudar a aumentar su comprensión de las otras 25.

Si esto llega demasiado tarde para tener un impacto en la pandemia actual, podría ayudar a prepararse para la próxima. “Una mejor comprensión de estas proteínas nos ayudará no solo a apuntar a este virus, sino a otros virus”, dijo Kliment Verba, uno de los investigadores en San Francisco.

Las posibilidades son innumerables. Después de que DeepMind le dio al Dr. McGeehan formas para siete enzimas que potencialmente podrían librar al mundo de los desechos plásticos, envió al laboratorio una lista de 93 más. “Están trabajando en esto ahora”, dijo.