Científicos del <a href="http://www.crg.eu/" alt="Centro de Regulación Genómica" title="Centro de Regulación Genómica" target="blank">Centro de Regulación Genómica</a> (CRG) han desarrollado un nuevo método que mejora el catálogo más importante de genes, <a href="https://www.gencodegenes.org/" alt="GENCODE" title="GENCODE" target="blank">GENCODE</a>, y describe nuevos genes en la 'materia oscura' del ADN. Este nuevo método permite mapear los genes de forma más precisa, rápida y económica.
La información de la secuencia del genoma humano es primordial para la investigación biomédica. De todos modos, el valor de esta información es todavía muy limitado porque no contamos con un mapa detallado de todos los genes que se encuentran codificados en el genoma. Los genes son las unidades básicas responsables de las características biológicas en los organismos. Actualmente contamos con información detallada sobre los genes que codifican para proteínas, pero la información sobre las regiones del ADN que no codifican para proteínas -conocidas como la 'materia oscura' del ADN- todavía queda incompleta. En estas regiones, hay unos genes aún poco conocidos llamados 'ARN largos no codificantes' que se encuentran entre los más numerosos y que están relacionados con diversas enfermedades.
En un trabajo publicado en la revista Nature Genetics, un equipo internacional de científicos, liderado por investigadores del Centro de Regulación Genómica en Barcelona, en colaboración con investigadores del Cold Spring Harbor Laboratory de Nueva York, del Wellcome Trust Sanger Institute de Hinxton y de la empresa qGenomics en Barcelona, aporta nueva luz sobre este tema. Para identificar mejor y mapear estos 'genes de la materia oscura', han desarrollado un nuevo método que mejora el rendimiento y la precisión de los métodos actuales.
"El 98% de nuestro ADN no codifica para proteínas. Estas regiones de ADN contienen miles de genes no codificantes que no están caracterizados y todavía queda un largo camino hasta que comprendamos sus funciones y su papel en las enfermedades. Para ello, necesitamos tener mapas completos de todos los genes. Nuestro método representa un paso muy importante en esta dirección", explica Rory Johnson, antiguo investigador en el CRG que actualmente es jefe de grupo en la Universidad de Berna y que codirige de este trabajo.
La principal característica de este nuevo método, llamado RNA Capture Long Seq (CLS), es que se centra específicamente en las regiones no codificantes del genoma. Éstas se han amplificado y analizado mediante las técnicas más avanzadas de secuenciación. "De este modo, hemos podido producir un mapa detallado de más de 3.500 ARN largos no codificantes en humanos y ratones. Y eso nos ha permitido describir las características genómicas de ARN largos no codificantes para comprender mejor cómo funcionan", comentan los investigadores Julien Lagarde y Barbara Uszczynska, primeros autores del trabajo en el CRG.
Los investigadores usaron este nuevo método para mejorar una de las bases de datos genómicas más importantes: GENCODE, que es la referencia mundial para los genes codificantes en los genomas de humano y ratón. "Científicos en todo el mundo están utilizando GENCODE para sus proyectos de investigación como datos de referencia. Así que mejorar GENCODE, implica contribuir a la investigación biomédica mundial", afirma Roderic Guigó, coordinador del programa de Bioinformática y Genómica en el CRG y colíder del trabajo. El Dr. Guigó inició GENCODE en 2003 como parte del proyecto ENCODE La Enciclopedia de los Elementos del ADN. Ahora, gracias a este nuevo método, Guigó y colaboradores han mejorado sustancialmente los catálogos de genes, en concreto, los genes de ARN largos no codificantes. "Hemos encontrado un método más rápido, preciso y económico que nos ha permitido mejorar un catálogo que beneficiará en un primer momento a la comunidad científica, para luego, beneficiar a toda la sociedad", concluye Guigó.
Casi 20 años después del Proyecto del Genoma Humano, este trabajo ilustra cómo nuestra comprensión sobre la información comprendida en el genoma todavía evoluciona gracias al desarrollo de tecnología cada vez más potente. Una mejor comprensión del genoma nos llevará hacia una mejor comprensión de la salud y la enfermedad.
Referencia bibliográfica:
Julien Lagarde, Barbara Uszczynska-Ratajczak, Silvia Carbonell, Sílvia Pérez-Lluch, Amaya Abad, Carrie Davis, Thomas R Gingeras, Adam Frankish, Jennifer Harrow, Roderic Guigó and Rory Johnson. High-throughput annotation of full-length long noncoding RNAs with capture long-read sequencing. Nature Genetics. 2017. DOI: 10.1038/ng.3988