Un algoritmo resuelve uno de los mayores problemas de la biología actual al calcular la forma de 200 millones de moléculas, algunas de ellas esenciales para entender enfermedades devastadoras como el alzhéimer o el párkinson
“Este trabajo da
inicio a una nueva era de biología digital”, ha celebrado Demis Hassabis, el
experto en programación y neurociencia de 45 años que es el principal creador
de AlphaFold, el sistema de redes neuronales que ha sido capaz de resolver casi
por completo uno de los mayores problemas de la biología.
El británico Hassabis
fue un talento juvenil del ajedrez y los videojuegos que en 2010 fundó
Deepmind, una empresa volcada en crear una inteligencia artificial capaz de
aprender como los humanos. En 2013, este sistema demostró ser mejor que
cualquier persona jugando a videojuegos de la empresa Atari. Al año siguiente,
Google compró la compañía por unos 500 millones de euros. En 2017, AlphaGo
arrasó ante los mejores campeones de Go, el complejísimo juego de tablero
asiático similar al ajedrez. Desde entonces, Hassabis volcó sus esfuerzos en un
reto mucho mayor: predecir la forma tridimensional que tendrá una proteína
leyendo únicamente su secuencia genética, escrita en dos dimensiones con letras
de ADN.
Conocer la estructura
tridimensional de estas moléculas a partir de su secuencia genética es esencial
para entender su función, pero supone un problema de inmensa dificultad. Es
como terminar un puzle con decenas de miles de piezas sin saber qué imagen representa.
Hasta la aparición de
este sistema, dilucidar la forma de una sola proteína compuesta por 100
unidades básicas —llamadas aminoácidos— podía llevar 13.700 millones de años,
la edad del universo. En el mejor de los casos, los científicos tardaban años
usando microscopía electrónica o enormes aceleradores de partículas como el
sincrotrón europeo de Grenoble (Francia). En cambio, el algoritmo de Google
predice la estructura de cualquier proteína en unos pocos segundos.
“Este universo de
proteínas” es “un regalo para la humanidad”, ha resaltado Hassabis durante la
presentación de la nueva base de datos, durante una rueda de prensa celebrada
el martes, junto a científicos del Laboratorio Europeo de Biología Molecular
(EMBL), una institución pública que ha colaborado en el desarrollo de
AlphaFold.
Antes de la llegada
de esta tecnología, se había conseguido determinar la estructura de unas 200.000
proteínas, una labor que llevó 60 años y la participación de miles de
científicos. Esa base de datos ha sido el material de aprendizaje de la
inteligencia artificial de Google, que ha buscado patrones válidos que predigan
qué forma tendrán las proteínas de las que solo se conoce su secuencia
bidimensional. En 2021, el sistema ya resolvió la estructura de un millón de
proteínas, incluidas todas las humanas. La nueva remesa de este año amplía el
récord a 200 millones: prácticamente todas las proteínas conocidas de todos los
seres vivos del planeta.
El acceso a esta
nueva base de datos es libre y gratuito y el código informático de su
inteligencia artificial es abierto y descargable. Este Google de la vida
muestra la secuencia bidimensional de cualquier proteína y un modelo
tridimensional que indica el nivel de fiabilidad de la predicción, que tiene un
margen de error similar o incluso menor que los métodos convencionales.
Es importante tener
en cuenta que AlphaFold no determina la realidad, sino que la predice. Lee la
secuencia genética y estima cuál es la forma más probable en la que se
configurarán los aminoácidos. La predicción tiene una alta fiabilidad, lo que
permite ahorrar mucho tiempo y dinero a los científicos para hacer trabajos
teóricos sin necesidad de usar costosos equipos para determinar la estructura
real de una proteína hasta que sea absolutamente necesario.
Las aplicaciones de
esta nueva herramienta son casi infinitas, pues las proteínas microscópicas
están involucradas en cualquier proceso biológico imaginable, desde la muerte
en masa de las abejas a la resistencia de las cosechas al calor, pasando por
una infinidad de enfermedades.
El equipo de Matt
Higgins, de la Universidad de Oxford (Reino Unido), ha usado AlphaFold como
parte de su proyecto para desarrollar un anticuerpo —un tipo de proteína— capaz
de neutralizar una de las proteínas esenciales para que el patógeno de la
malaria pueda reproducirse. Dentro de años, este tipo de investigaciones
podrían conseguir la primera vacuna altamente protectora contra esta
enfermedad, pues impediría la transmisión del parásito de una persona a otra a
través de la picadura de mosquitos.
Logros conseguidos
Otro de los hitos ya
logrados es la estructura más detallada hasta la fecha de los poros nucleares,
un complejo de proteínas con forma de rosquilla que es la puerta de entrada y
de salida del núcleo de las células humanas y que está relacionado con un
sinfín de enfermedades, incluidas el cáncer y las cardiovasculares. Esta nueva
herramienta permite un acceso sin precedentes a entender “cómo la receta de la
vida [escrita en el genoma] entra en funcionamiento al traducirse en
proteínas”, explicó a este diario Jan Kosinski, investigador del EMBL coautor
de este hallazgo.
Hassabis y el resto
de responsables de Deepmind y el EMBL han asegurado que se han analizado los
posibles riesgos que entraña publicar esta base de datos y hacerla accesible a
todo el mundo. “Los beneficios son claramente superiores a las amenazas”, ha
resaltado el creador del sistema, que ha añadido que en el futuro, a medida que
se desarrolle esta tecnología, será la comunidad internacional la que deba
decidir si debe limitarse su uso.
Una de las
aplicaciones más tangibles es el diseño de moléculas a la carta que puedan
bloquear proteínas nocivas o, mejor, modular su actividad, un efecto mucho más
deseable en el diseño de nuevos fármacos, explica Carlos Fernández, científico
del CSIC y líder del grupo de biología estructural de la Sociedad Española de
Biología Molecular. Su equipo ha utilizado AlphaFold para dilucidar parte de la
estructura de un complejo formado por varias proteínas esencial para la
propagación del tripanosoma que causa la enfermedad del sueño que existe en
países del África subsahariana.
Ahora quedan por
delante años de trabajo para confirmar si las predicciones son correctas,
explica el biólogo José Márquez, experto en estructura de proteínas del
sincrotrón de Grenoble. “La próxima frontera será que AlphaFold pueda
contribuir al diseño de fármacos bloqueadores de proteínas o activadores de
ellas, un problema que ya están abordando”, explica. Otro escollo: el sistema
no dice por qué una proteína obtiene su forma final, algo que puede ser
esencial en la investigación de dolencias como el alzhéimer o el párkinson,
relacionadas con un plegado incorrecto de las proteínas.
Alfonso Valencia,
director de ciencias de la vida en el Centro Nacional de Supercomputación,
habla de las carencias del sistema. “No todo está resuelto, porque AlphaFold
solo puede predecir cosas que estén en el dominio de cosas conocidas. Por
ejemplo, no puede predecir bien la estructura de un tipo de proteínas que
protegen de congelación porque son raras y no hay muchos ejemplos en las bases
de datos. Tampoco puede predecir la consecuencia de mutaciones, lo que es un
punto muy negativo en medicina”, resalta.
También reconoce uno
de sus puntos fuertes: que el código de todo el sistema es abierto, lo que
supone que otros científicos pueden mejorarlo o modificarlo a su gusto, incluso
si Google decide retirar el sistema de la red. “Es evidente que la gente de
Deepmind está buscando ganar el Premio Nobel al actuar de esta forma tan
transparente”, opina Valencia. “Por un lado, obtienen una gran imagen y una
ventaja sobre sus competidores, como Facebook. Por otro, ya han sugerido que se
reservan el uso privado de datos concretos sobre salud y para el diseño de
fármacos”, añade.
Fuente: El Pais.com