El manual de instrucciones de una célula es, básicamente, una enorme molécula de ADN de unos dos metros de largo. En él se encuentran las instrucciones para que una neurona sea capaz de transmitir un pensamiento o para que las células inmunes defiendan nuestro cuerpo. Estas instrucciones están escritas con tan solo cuatro letras (A, C, T, G), llamados nucleótidos.
A, T, G, C, las cuatro letras de la vida
Antes de los años 80 ya se conocía la secuencia de algunos genes aislados, o el genoma de organismos simples como virus o bacterias. Sin embargo, la gran mayoría del genoma humano permanecía inexplorada. Conocer la secuencia completa del genoma humano puede tener una gran relevancia en el diagnóstico de enfermedades y en el desarrollo de nuevos fármacos, y suponer un gran avance para la genética y la biomedicina. Por ello, en 1988 se crea HUGO (Organización del Genoma Humano, por sus siglas en inglés), y en 1990 comienza el Proyecto Genoma Humano. Con un presupuesto de 3.000 millones de dólares y una duración de 15 años el proyecto pretendía conocer y secuenciar la totalidad de nuestro genoma.
En abril del 2000 se anunció un primer borrador en el que se localizaban los genes en los cromosomas, y en febrero de 2001 se publicó en las revistas científicas Nature y Science la secuencia definitiva del genoma humano con un 99,99% de fiabilidad.
Las secuencias repetidas, un problema a resolver
Sin embargo, aquella primera versión estaba “llena de agujeros”. Las técnicas de secuenciación masiva no son capaces de leer todo el ADN del tirón, por lo que se deben secuenciar fragmentos que luego se van ordenando. El problema llega con fragmentos repetitivos (TATATATATATA), muy difíciles de encajar. El bioinformático estadounidense Adam Phillippy compara esta tarea con la de montar un puzzle de un paisaje, en la tienes que encajar las piezas del cielo, todas tan parecidas. Para conseguir rellenar estos agujeros del genoma el Consorcio Internacional T2T ha utilizado la pionera técnica Oxford Nanopore (un aparato que consigue secuenciar cientos de miles de nucleótidos seguidos). Así, el consorcio publicó el pasado 27 de mayo un nuevo borrador en el que afirman que el 8% de los 3.055 millones de nucleótidos estaban aún sin leer. Así, proponen que el genoma humano contaría con 19.969 genes que codifican para proteínas.
Alrededor de 20.000 genes humanos codifican proteínas
Sin embargo, como las células utilizadas son de una misma mujer, este genoma no permite diferenciar variaciones entre personas, y carece de la información del cromosoma Y. Los investigadores del Consorcio T2T proponen utilizar su genoma como referencia (como si fuese la foto de la tapa del puzzle) para poder secuenciar nuevos genomas.
Aunque el ser humano haya tardado 300.000 años en ser capaz de leer su propio manual de instrucciones, gracias a las nuevas tecnologías de secuenciación podremos conocer más a fondo enfermedades como el cáncer y abrir la puerta a nuevas terapias y tratamientos.