Laboratorio biomédico de alta tecnología con pantallas, instrumental y ambiente de investigación avanzada
Una imagen que sugiere ciencia aplicada, infraestructura avanzada y trabajo biomédico de alta precisión.

Durante décadas, desarrollar un nuevo fármaco ha sido una de las empresas más lentas, caras y arriesgadas que existe. No es una metáfora: llevar una molécula desde el laboratorio hasta la farmacia requiere, de media, entre diez y doce años de trabajo y una inversión que puede superar los mil quinientos millones de dólares. Y todo eso sin garantías. La mayoría de los candidatos fracasan en algún punto del camino, a menudo después de años de esfuerzo y decenas de millones gastados.

Ese modelo está empezando a cambiar. No de forma repentina ni espectacular, sino con la solidez discreta de lo que ya funciona en entornos reales. La inteligencia artificial y la biología computacional están reconfigurando cada etapa del proceso, desde la identificación de dianas terapéuticas hasta el diseño de ensayos clínicos. El libro Revolutionizing Drug Development: Harnessing AI and Computational Biology, editado por Jen-Tsung Chen y publicado por Elsevier en 2024, hace un mapa técnico de ese territorio. Este post intenta convertir ese mapa en algo legible para quien no viene del mundo de la bioinformática, pero quiere entender qué está pasando realmente.

Y quiere hacerlo con un anclaje concreto: lo que estamos construyendo en DevsHealth.

Un proceso diseñado para ser lento

Antes de hablar de soluciones, conviene entender bien el problema. El desarrollo farmacéutico tradicional es secuencial y enormemente despilfarrador. El proceso empieza identificando una diana biológica —una proteína, un receptor, una enzima— que juega un papel clave en una enfermedad. A continuación, hay que encontrar una molécula capaz de interactuar con esa diana de forma útil. Luego viene la optimización de esa molécula para que sea eficaz, segura, estable y administrable. Después, años de ensayos preclínicos y clínicos.

En cada etapa, el margen de error es enorme. La mayor parte de los candidatos que parecen prometedores en el laboratorio no lo son en el organismo. Los modelos animales no siempre predicen bien el comportamiento humano. Y cuando algo falla en la fase III de un ensayo clínico —a un paso del mercado—, el coste económico y el coste en tiempo perdido son devastadores.

Lo que hace que el problema sea especialmente grave en enfermedades infecciosas es la asimetría: los virus y las bacterias evolucionan mucho más rápido de lo que la industria farmacéutica es capaz de responder. La pandemia de COVID-19 lo ilustró con una claridad brutal. Como escribí en otro post de este blog, fue el tiempo jugando a favor del virus, y la industria tardó meses en ponerse a la altura.

Las tres palancas que cambian la lógica del proceso

La inteligencia artificial no resuelve todos estos problemas de golpe. Pero actúa sobre tres palancas que, combinadas, pueden cambiar la lógica del proceso.

La primera es la velocidad de exploración. Un laboratorio tradicional puede sintetizar y probar unos pocos miles de compuestos al año. Un sistema de cribado computacional puede evaluar, en cuestión de días, millones de moléculas candidatas contra una diana específica. Esto no es ciencia ficción: es lo que hacen hoy herramientas como el docking molecular asistido por redes neuronales o los modelos generativos de diseño molecular. La diferencia no es cuantitativa; es cualitativa. Permite explorar espacios químicos que antes eran, en la práctica, inaccesibles.

La segunda es la predicción de propiedades. Una molécula que se une bien a una diana no es necesariamente un buen fármaco. Hay que saber cómo se absorbe, cómo se distribuye por el organismo, cómo se metaboliza y cómo se elimina. Todo eso se agrupa bajo el acrónimo ADME, y predecirlo con precisión es uno de los cuellos de botella históricos del sector. Los modelos de machine learning entrenados sobre grandes bases de datos bioquímicas están mostrando una capacidad predictiva mucho más alta que los métodos anteriores. Menos experimentos costosos. Menos fracasos tardíos.

La tercera es el reposicionamiento de fármacos. Algunos de los hallazgos más rápidos y económicamente eficientes de los últimos años han venido de reutilizar fármacos existentes para nuevas indicaciones. El caso del baricitinib —aprobado inicialmente para artritis reumatoide y luego utilizado en COVID-19— es uno de los más conocidos. La IA permite identificar estas conexiones inesperadas analizando patrones en grandes volúmenes de datos biológicos y clínicos que un investigador humano nunca podría procesar manualmente.

De los datos a la molécula: qué hay dentro del embudo

Para quien quiera ir un poco más allá de la superficie, vale la pena entender la arquitectura técnica que hace posible todo esto. El libro de Chen la describe con detalle. Aquí la versión pedagógica.

El proceso empieza con los datos. Las grandes bases de datos públicas —PDB para estructuras proteicas, UniProt para anotaciones biológicas, ChEMBL para actividad de compuestos— son el sustrato sobre el que se entrenan los modelos. Sin datos de calidad, no hay IA que funcione. Este es, también, uno de los puntos de fricción más importantes del sector: los datos están fragmentados, son heterogéneos y no siempre están correctamente anotados.

Sobre esos datos operan distintos tipos de modelos. Las redes neuronales de grafos (GNNs) son especialmente útiles para representar moléculas, porque una molécula es, en esencia, un grafo: átomos como nodos, enlaces como aristas. Los modelos de deep learning pueden aprender patrones de actividad biológica a partir de millones de ejemplos. Y los modelos generativos —los mismos que en el mundo del lenguaje producen texto, y en el mundo de la imagen producen imágenes— pueden aquí proponer nuevas moléculas con propiedades predeterminadas. No buscan entre lo que ya existe: diseñan lo que aún no existe.

Una vez identificados los candidatos computacionales, entran en juego las simulaciones de dinámica molecular: se modela el comportamiento de la molécula en interacción con la proteína diana durante escalas de tiempo microscópicas, validando que el acoplamiento es real y estable. Solo después de pasar todos estos filtros se seleccionan unos pocos compuestos para síntesis y prueba experimental.

Es un embudo. En la parte ancha, cientos de miles de moléculas evaluadas in silico. En la parte estrecha, diez o veinte candidatos que pasan a laboratorio.

DevsHealth OS: cuando la teoría se convierte en plataforma

Todo lo anterior no es abstracto para mí. Es la lógica de fondo de DevsHealth, la empresa deeptech de la que soy cofundador, y que lleva varios años aplicando exactamente este paradigma al descubrimiento de fármacos para enfermedades infecciosas.

Nuestra plataforma, DevsHealth OS, implementa ese embudo computacional de forma integrada. Parte del diseño de la estructura de proteínas diana, construye moléculas candidatas mediante IA, las filtra con análisis estructural y de unión, las evalúa con modelos ADME y las valida mediante cálculos de dinámica molecular. El resultado: pasar de años a meses en la fase de descubrimiento. Y una tasa de éxito en los candidatos que avanzan a validación experimental que sería imposible de conseguir con métodos puramente convencionales.

Como expliqué en el post sobre el descubrimiento acelerado de fármacos para enfermedades infecciosas, la plataforma nos permite evaluar más de 100.000 compuestos in silico y seleccionar entre 10 y 20 candidatos para pruebas in vitro. El núcleo de datos —DevsHealth DataGalaxy— está construido sobre las bases de datos bioinformáticas y quimioinformáticas más relevantes del sector. Y la infraestructura computacional corre sobre Azure Cloud con capacidad HPC.

Los tres proyectos activos —un tratamiento oral para COVID-19, un antiviral de amplio espectro para Flavivirus (Dengue, Zika, Nilo) y un antimicrobiano contra Staphylococcus aureus multirresistente— son, en cierto modo, una demostración aplicada de todo lo que el libro de Chen describe en abstracto. No buscamos hacer ciencia para publicar. Buscamos candidatos que puedan licenciarse.

Hay un elemento más que merece mencionarse: la computación cuántica. En colaboración con el Barcelona Supercomputing Centre y el Institut de Recerca Química de Catalunya, estamos explorando cómo los algoritmos cuánticos pueden mejorar la precisión de las simulaciones moleculares en dimensiones que la computación clásica todavía no puede resolver bien. No es para el corto plazo. Pero es la dirección correcta.

Lo que todavía no funciona

Un post pedagógico honesto no puede quedarse solo en lo prometedor. El libro de Chen es explícito en esto, y conviene serlo también aquí.

La calidad de los datos sigue siendo el talón de Aquiles del sector. Los modelos aprenden de lo que ven, y si los datos son sesgados, incompletos o mal etiquetados, los modelos también lo serán. La interpretabilidad de los modelos es otro reto: para que la FDA o la EMA aprueben un fármaco, necesitan entender por qué funciona, y las redes neuronales profundas no siempre son fáciles de explicar. Y la integración de los flujos computacionales con los procesos regulatorios está todavía en fase temprana.

Ninguno de estos obstáculos invalida el cambio de paradigma. Lo pone en perspectiva. La IA no ha resuelto el problema del desarrollo farmacéutico; ha abierto una vía mucho más eficiente para abordarlo. La distancia entre abrir una vía y recorrerla completa sigue siendo considerable.

El tiempo como variable moral

Hay una pregunta más amplia que este tema invita a hacerse. El descubrimiento de fármacos es, en muchos sentidos, un caso límite de lo que la IA puede hacer cuando se aplica a problemas complejos con datos suficientes y consecuencias medibles. Si la IA puede comprimir de doce años a tres el ciclo de desarrollo de un antiviral, ¿qué otros procesos científicos o industriales tienen esa misma estructura —lentitud sistémica, información subutilizada, fricción en cada etapa— y podrían ser reconfigurados de la misma manera?

La respuesta, casi con certeza, es que son muchos más de los que estamos pensando todavía.

Eso es lo que hace que seguir esto de cerca no sea solo una cuestión de interés sectorial. Es una ventana a algo más grande: a cómo la inteligencia artificial está empezando a reescribir las reglas de tiempo y coste en algunos de los dominios más difíciles del conocimiento humano. El fármaco que tarda doce años en llegar al mercado no es solo un problema económico. Es vidas que podrían haberse salvado antes.

Si quieres seguir de cerca el trabajo de DevsHealth, puedes hacerlo a través de la categoría DevsHealth de este blog.