El mejor mapa del genoma humano hasta ahora arroja luz sobre “genes saltarines”, “ADN basura” y más

Biología

Veintidós años después de la finalización del Proyecto Genoma Humano, los científicos han revelado el catálogo más amplio de variación genética humana jamás compilado. En dos nuevos artículos publicados el miércoles 23 de julio en la revista Nature, científicos secuenciaron el ADN de 1084 personas de todo el mundo. Aprovecharon los últimos avances tecnológicos para analizar grandes fragmentos de material genético de cada persona, unieron esos fragmentos y compararon los genomas resultantes con gran detalle.

Los resultados profundizan nuestra comprensión de las variantes estructurales dentro del genoma humano. En lugar de afectar una sola letra del código del ADN, estas variaciones afectan a grandes fragmentos del código: pueden eliminarse o añadirse al genoma, o abarcar zonas donde el ADN se ha invertido o desplazado a una ubicación diferente.

Los estudios han revelado características “ocultas” del genoma humano que anteriormente eran demasiado complejas tecnológicamente para estudiar, afirmó Jan Korbel, director interino del Laboratorio Europeo de Biología Molecular (EMBL) de Heidelberg, coautor de ambos nuevos artículos. Por ejemplo, grandes porciones del genoma contienen códigos que se repiten una y otra vez, y se creía que estos no eran funcionales.

“Hace unos 20 años, lo considerábamos ‘ADN basura’; le dábamos un término muy negativo”, declaró Korbel a Live Science. “Cada vez hay más consciencia de que estas secuencias no son basura”, y el nuevo trabajo arroja luz sobre estas secuencias de ADN, tan denostadas desde hace tiempo.

Además, todos los datos generados en los nuevos estudios son de acceso abierto, por lo que otros investigadores del campo ahora pueden aprovechar los hallazgos y algunas de las herramientas que hemos desarrollado para comprender la base genética de las enfermedades, declaró Korbel a Live Science. “Creo firmemente que una parte de los avances que publicamos hoy en Nature también se incorporará al diagnóstico”.

Más de 1.000 genomas

Cuando se publicó el primer borrador de un genoma humano “completo” en 2003, le faltaba aproximadamente el 15% de su secuencia debido a las limitaciones tecnológicas de la época. En 2013, los científicos lograron reducir esa brecha a aproximadamente la mitad. Y finalmente, en 2022, se publicó el primer genoma humano “sin brechas”.

En 2023, investigadores publicaron el primer borrador de un pangenoma humano, que incorporaba ADN de 47 personas de todo el mundo, en lugar de basarse predominantemente en el ADN de una sola persona. Ese mismo año, publicaron el primer cromosoma Y secuenciado de principio a fin, ya que al genoma anterior, que no tenía huecos, aún le faltaba el cromosoma sexual masculino.

En los últimos años, este campo ha seguido avanzando gracias a las nuevas tecnologías y a los esfuerzos por ampliar el muestreo de ADN más allá de las poblaciones de ascendencia mayoritariamente europea. Estos avances dieron origen a los dos artículos publicados en Nature esta semana.

En el primer estudio, los investigadores secuenciaron el ADN de 1019 personas de 26 poblaciones de los cinco continentes. Para analizar el ADN, recopilaron lecturas largas, cada una compuesta por decenas de miles de pares de bases. Cada par de bases corresponde a un peldaño en la espiral de una molécula de ADN.

“Con lecturas cortas de unos 100 pares de bases, es difícil distinguir entre regiones genómicas similares”, explicó el coautor del estudio, Jesús Emiliano Sotelo-Fonseca, estudiante de doctorado del Centro de Regulación Genómica (CGR) de Barcelona, España. Esto es especialmente cierto en las regiones repetitivas del genoma. “Con lecturas más largas, de unos 20.000 pares de bases, asignar cada lectura a una posición única en el genoma se vuelve mucho más fácil”, declaró a Live Science por correo electrónico.

Más de la mitad de la nueva variación genómica descubierta en el estudio se encontró en esas complejas regiones repetitivas, incluyendo los transposones, también conocidos como genes saltarines. Los transposones pueden saltar a diferentes lugares del genoma, copiando y pegando su código. En ocasiones, dependiendo de dónde se encuentren, pueden desestabilizar el genoma, introducir mutaciones dañinas y contribuir al desarrollo de enfermedades como el cáncer.

“Nuestro estudio revela que algunos de estos transposones pueden secuestrar secuencias reguladoras para aumentar su actividad, lo que contribuye a comprender los mecanismos biológicos detrás de su mutagenicidad”, o capacidad de desencadenar mutaciones, dijo a Live Science en un correo electrónico el coautor del estudio Bernardo Rodríguez-Martín, investigador independiente del CGR y ex posdoctorado en el laboratorio EMBL de Korbel.

Los genes saltarines pueden, esencialmente, unirse a ciertas moléculas reguladoras (ARN largos no codificantes) y usar ese truco para crear muchas más copias de sí mismos de lo habitual. “Es un mecanismo muy sorprendente para nosotros”, afirmó Korbel.

Del 95% al 99%

El segundo estudio incluyó muchos menos genomas (sólo 65 en total), pero los secuenció de forma más exhaustiva que el primero. El primero capturó aproximadamente el 95% de cada genoma analizado, mientras que el segundo generó genomas con un 99% de completitud.

“Puede parecer una diferencia pequeña, pero en realidad es enorme desde la perspectiva genómica”, dijo Korbel. “Obtener los últimos porcentajes es un logro importante”.

Ese salto requirió diferentes técnicas de secuenciación, así como nuevos enfoques analíticos. “Este proyecto utilizó software de vanguardia para ensamblar genomas e identificar la variación genética, mucha de la cual simplemente no existía hace unos años”, explicó a Live Science en un correo electrónico el coautor Charles Lee, profesor del Laboratorio Jackson de Medicina Genómica.

Las técnicas de secuenciación incluyeron una que generó lecturas largas con muy pocos errores y otra que generó lecturas ultralargas ligeramente más propensas a errores. A pesar de analizar menos genomas, este enfoque permitió que el segundo estudio capturara fragmentos de ADN que se habían pasado por alto por completo en el primero, afirmó Rodríguez-Martín.

Esas regiones “ocultas” incluían los centrómeros, estructuras importantes en el centro de los cromosomas, claves para la división celular. A medida que una célula se prepara para dividirse, las fibras se unen a los centrómeros y luego separan el cromosoma en dos. El estudio descubrió que, en aproximadamente el 7% de los centrómeros, es probable que estas fibras tengan dos puntos de unión, en lugar de uno solo.

“¿Podría eso significar que esos cromosomas son más inestables? Porque si el huso [fibra] se une a dos puntos, podría confundirse”, dijo Korbel. Es una idea puramente especulativa, añadió, pero ahora se puede explorar. El siguiente paso será estudiar experimentalmente los efectos de estas variaciones del centrómero, coincidió Lee.

Los problemas con la división cromosómica pueden provocar diversas afecciones. Por ejemplo, “el síndrome de Down es el resultado de un error en la segregación cromosómica durante la división celular en la meiosis”, cuando las células se dividen para formar espermatozoides y óvulos, según explicó a Live Science la Dra. Miriam Konkel, coautora y profesora adjunta del Centro de Genética Humana de la Universidad de Clemson, en un correo electrónico.

Al igual que el primer estudio, el segundo también proporcionó una perspectiva sin precedentes sobre los genes saltarines, catalogando más de 12,900. Más allá del cáncer, los genes saltarines también pueden desencadenar diversas enfermedades genéticas al causar mutaciones, así como provocar cambios más sutiles en la activación y desactivación de los genes, señaló Konkel. Una mejor comprensión de la diversidad de los genes saltarines puede ayudar a comprender su función en la salud y la enfermedad humanas.

Al analizar ambos estudios, los científicos ahora pueden comparar los genomas recién secuenciados con otros conjuntos de datos que incluyen datos genómicos y de salud, señaló Korbel. Este sería el primer paso para vincular las nuevas variaciones estructurales con resultados tangibles de salud y, eventualmente, para incorporar estos conocimientos a la práctica médica.

“Ciertos estudios clínicos no podrán ignorar estas técnicas [de secuenciación] porque les otorgarán una mayor sensibilidad para identificar variaciones”, afirmó Korbel. “Es importante evitar que se pasen por alto las variantes”.

Lee añadió que aún queda trabajo por hacer para mejorar los datos genómicos. Se podría incorporar más ADN de poblaciones subrepresentadas, y las técnicas y el software de secuenciación podrían perfeccionarse para que el proceso sea más eficiente y preciso. Mientras tanto, los dos nuevos estudios representan un gran logro tecnológico.

“Estas herramientas avanzadas se desarrollaron recientemente para gestionar la enorme cantidad de datos de lectura larga que utilizamos actualmente para cada genoma”, afirmó Lee. “Hace unos años, ensamblar un cromosoma humano completo de principio a fin, especialmente incluyendo los centrómeros, era prácticamente imposible porque el software y los algoritmos aún no estaban maduros”.

Fuente: Live Science.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *