DeepMind, una empresa comprada por Google, predice con una precisión sin precedentes la estructura de casi todas las proteínas que forman un ser humano
En cabeza de esta revolución camina el
neurocientífico británico Demis Hassabis (Londres, 44 años). El investigador
fue un niño prodigio del ajedrez y en 1997 quedó marcado por el combate entre
el maestro ruso Gari Kaspárov y el superordenador Deep Blue. La computadora
ganó aquella batalla, pero Hassabis se quedó con la sensación de que era un
cacharro tosco, inútil si había que jugar a las tres en raya. Cuando acabó la
última partida, el entonces estudiante de la Universidad de Cambridge se
propuso diseñar una máquina capaz de aprender cualquier juego. En 2010,
Hassabis fundó la empresa DeepMind para impulsar la inteligencia artificial. En
2013, su primera criatura había aprendido sola a jugar y ganar en diferentes
videojuegos de la legendaria videoconsola Atari. En 2014, Google compró la
compañía por unos 650 millones de dólares (unos 500 millones de euros al cambio
de entonces)
Tras su entrenamiento con los videojuegos, los
científicos de DeepMind se han lanzado a intentar resolver uno de los mayores
retos de la biología. Las proteínas —como las hormonas, las enzimas y los
anticuerpos— son diminutas máquinas que llevan a cabo las funciones básicas
para la vida. Están formadas por cadenas de otras moléculas más pequeñas, los
aminoácidos, como si fueran un collar de perlas. Estos collares se pliegan en
enrevesadas configuraciones que determinan su función. Los anticuerpos,
defensas del cuerpo humano ante invasores como el coronavirus, tienen forma de
Y.
En el ADN de cada célula están escritas las recetas
de todas las proteínas que necesita para funcionar. El sistema de DeepMind,
bautizado AlphaFold, lee esa información —una secuencia de aminoácidos— y
predice la estructura de cada proteína. Su precisión es similar a la lograda
con experimentos en el laboratorio, que requieren muchísimo más tiempo y
dinero. Es como adivinar la forma de una tortilla al ver por primera vez una
receta con huevos, patatas, cebolla, aceite y sal.
DeepMind y el Laboratorio Europeo de Biología
Molecular han publicado este jueves más de 350.000 estructuras, incluyendo las
de unas 20.000 proteínas humanas y las de otros 20 organismos, como el ratón de
laboratorio y la bacteria de la tuberculosis. El científico Venki Ramakrishnan,
ganador del Nobel de Química en 2009, afirma que es “un avance asombroso”, de
consecuencias impredecibles. “Ha ocurrido mucho antes de lo que muchos expertos
habrían predicho. Va a ser emocionante ver las muchas maneras en las que va a
cambiar radicalmente la investigación biológica”, ha señalado Ramakrishnan, del
Laboratorio de Biología Molecular de Cambridge (Reino Unido), en un comunicado.
Es “una
auténtica revolución para las ciencias de la vida”, en palabras de la
científica Edith Heard
Algunas organizaciones ya están trabajando con la
nueva base de datos. La Iniciativa Medicamentos para Enfermedades Olvidadas,
una entidad sin ánimo de lucro impulsada por Médicos Sin Fronteras, utiliza la
estructura de las proteínas para buscar nuevos tratamientos. Prácticamente
todas las enfermedades, desde el cáncer al alzhéimer, pasando por la covid,
están relacionadas con la forma de alguna proteína. Otras instituciones, como
la Universidad de Portsmouth (Reino Unido), están empleando el programa para
intentar diseñar proteínas capaces de reciclar plásticos.
Demis Hassabis, director ejecutivo de DeepMind, ha
anunciado que su plan es publicar 100 millones de estructuras en los próximos
meses. Eso supondría ofrecer gratis la predicción de la forma de prácticamente
todas las proteínas con una secuencia de aminoácidos conocida. “Creemos que esta
es la contribución más importante hasta ahora de la inteligencia artificial al
conocimiento científico”, ha proclamado Hassabis. En su estudio, publicado este
jueves en la revista Nature, ha participado el español Bernardino Romera
Paredes, un ingeniero informático de DeepMind nacido en Murcia hace 35 años.
El sistema AlphaFold no nace de la nada, como ha
recalcado Edith Heard, directora general del Laboratorio Europeo de Biología
Molecular, un organismo con 1.800 trabajadores y sedes en Alemania, Francia,
Italia, Reino Unido y, desde 2017, en España, en Barcelona. “AlphaFold ha sido
entrenado utilizando datos de recursos públicos creados por la comunidad
científica, así que tiene sentido que sus predicciones sean públicas”, ha
declarado Heard. La investigadora habla de “una auténtica revolución para las
ciencias de la vida, como lo fue la genómica hace décadas”.
Para determinar la estructura real de una proteína
se necesitan carísimas infraestructuras, como el Laboratorio Europeo de
Radiación Sincrotrón, una instalación circular de casi un kilómetro de
circunferencia en Grenoble (Francia). La radiación emitida por los electrones
que circulan por el anillo, compuesta básicamente por rayos X, permite observar
los secretos de la materia. El biólogo español José Antonio Márquez explica que
dilucidar la forma de una proteína con un sincrotrón, o con el método
alternativo de la criomicroscopía electrónica, puede requerir “meses o incluso
años”. AlphaFold lo consigue en minutos, pero con errores.
“Se trata de predicciones de ordenador, no de la
determinación experimental de la estructura. Y la precisión es del 58%”,
subraya Márquez, un investigador valenciano de 52 años que dirige la Plataforma
de Cristalografía del Laboratorio Europeo de Biología Molecular, en Grenoble.
Hoy en día, si un científico quiere estudiar una proteína implicada en el
cáncer, tiene que esperar meses o años para analizar su forma. En las bases de
datos solo hay unas 180.000 estructuras. La información publicada este jueves
duplica esa cifra. Y en unos meses serán millones. “Lo normal hoy es no
encontrar una proteína en las bases de datos. Con AlphaFold puedes tener una
predicción con un 58% de fiabilidad. Te ahorra una cantidad de tiempo enorme”,
opina Márquez, que no ha participado en el proyecto. Las imprecisiones del
sistema se concentran en unas determinadas regiones de las proteínas,
desestructuradas para adaptarse al ambiente.
El biólogo español señala otras limitaciones. El
sistema de DeepMind puede predecir la estructura de una molécula aislada, pero
las proteínas suelen interactuar con otras. AlphaFold todavía no es capaz de
pronosticar la forma de estos complejos, pero es un programa diseñado para que
aprenda solo. Márquez es optimista: “Va a conseguir acelerar los descubrimientos
en prácticamente todas las áreas de la biología”.
Fuente: El
Pais.com