Un grupo de investigación de la Universidad Politécnica de Madrid ha desarrollado con inteligencia artificial una herramienta para clasificar variantes genómicas potencialmente malignas
El análisis de los datos genómicos y de ADN, así como la extracción de variantes o mutaciones, es bastante complejo. La detección automática de cuáles de ellas pueden ser de potencial riesgo para analizar en profundidad −ya sea por tener alta probabilidad a contribuir en el desarrollo de enfermedades como el cáncer, o por presentar características inusuales− es clave para los clínicos e investigadores.
Así, investigadores del Grupo de Aplicación de Telecomunicaciones Visuales (GATV) de la Universidad Politécnica de Madrid (UPM) han desarrollado una herramienta que propone un sistema que proporciona, mediante inteligencia artificial, una probabilidad de que las variantes bajo estudio sean potencialmente malignas (y, por tanto, de interés para el análisis) o puedan ser variantes benignas dentro del genoma humano. El trabajo desarrollado, y la herramienta propuesta, pueden ayudar al estudio de las alteraciones genómicas en cánceres humanos que permitan terapias dirigidas a oncología de precisión basadas en datos personales de secuenciación de próxima generación.
Investigadores del GATV de la UPM han llevado a cabo un estudio utilizando varias técnicas tradicionales de machine learning y nuevas técnicas de deep learning para clasificar las mutaciones somáticas. Como resultado, han desarrollado una herramienta de clasificación recopilando una gran cantidad de variantes conocidas, tanto malignas como benignas, recogidas en estudios clínicos avalados y puestas a disposición del público general en bases de datos abiertas. Para tener más información sobre cada una de esas mutaciones, han utilizado una herramienta de anotación software llamada ANNOVAR, que congrega otras bases de datos y algoritmos que proporcionan detalles adicionales sobre las mutaciones. Se han utilizado 70 anotaciones (es decir, 70 valores numéricos que describen cada variante recogida) como entrada para distintos modelos de inteligencia artificial cuyo objetivo es obtener una probabilidad de que cada una de esas mutaciones sea benigna o maligna.
Esquema general del procesamiento de ADN para la detección de variantes y su clasificación. Fuente: UPM
El mismo conjunto de datos se ha probado en clasificadores ya existentes que también emplean modelos de inteligencia artificial, entre otras propuestas, para comparar la eficacia de los detectores. Tras comparar las soluciones mediante conocidas métricas de clasificación para machine learning, se puede concluir que las implicaciones de estos resultados son considerablemente relevantes, ya que demuestran que esta herramienta de clasificación propuesta supera al resto de las estudiadas.
Los resultados obtenidos han sido muy prometedores, ya que los mejores modelos de inteligencia artificial han sido capaces de clasificar correctamente cerca del 80% de mutaciones potencialmente peligrosas. Como señala Anaida Fernández García, investigadora que ha formado parte del equipo de trabajo, “desde la perspectiva médica, estas herramientas son de gran utilidad a la hora de hacer análisis genómico de un paciente, ya que el porcentaje de variantes potencialmente malignas suele ser muy pequeño en comparación con las benignas, por lo que lograr encontrarlas de una manera rápida y automática supone una reducción enorme de horas de trabajo que pueden ser dedicadas al estudio directo de esas potenciales detecciones”.
Todo este trabajo se ha desarrollado gracias al proyecto europeo Genomed4All liderado por la UPM.
Referencia bibliográfica: Matteo Bastico; Anaida Fernández-García; Alberto Belmonte-Hernández; Silvia Uribe Mayoral. DrOGA: An Artificial Intelligence Solution for Driver-Status Prediction of Genomics Mutations. Precision Cancer Medicine. IEEE Access, vol. 11, pp. 37378-37391, 2023, doi: 10.1109/ACCESS.2023.3266983.