Secuenciación masiva y de tercera generación: NGS, Ion Torrent y nanoporos para ADN y ARN
V. Secuenciación masiva
Gracias a los métodos de secuenciación de primera generación se han conseguido secuenciar grandes genomas, incluido el humano. Sin embargo, el proceso que permite obtener la secuencia completa es tan largo (meses o años) que resulta inviable para analizar de manera rutinaria genomas de múltiples individuos.
La necesidad de secuenciar genomas completos en poco tiempo y a bajo coste ha impulsado el desarrollo de plataformas automáticas de secuenciación basadas en diferentes tecnologías. Es la llamada secuenciación masiva o secuenciación de segunda generación (del inglés Next-Generation Sequencing, NGS).
Estas nuevas tecnologías automatizan todo el proceso, que consta de tres fases principales:
- Preparación del ADN que se va a secuenciar.
- Secuenciación propiamente dicha.
- Procesado y gestión de datos.
Las tecnologías de alto rendimiento generan un volumen enorme de datos, ya que desencadenan en paralelo cientos de miles de reacciones de secuenciación diferentes.
1.1. ADN molde de molécula única
Una vez seleccionados los fragmentos de la biblioteca con el tamaño adecuado (200–250 pb), se movilizan sobre una superficie utilizando una de estas dos alternativas:
- Unión covalente de uno de los cebadores universales sobre la superficie del soporte sólido. De esta manera quedan anclados a la superficie y dispuestos de tal modo que una ADN polimerasa puede iniciar la reacción de secuenciación extendiendo el cebador.
- Unión covalente de los fragmentos de ADN molde a la superficie del soporte sólido. Posteriormente se hibridan con un cebador universal para poder iniciar la reacción de secuenciación.
1.2. Amplificación clonal del ADN molde
Con esta estrategia se pretende aumentar el número de copias de cada fragmento sin que se mezclen unos con otros; es decir, se pretende obtener clones de cada fragmento. Hay dos métodos basados en PCR:
PCR en emulsión (emPCR)
Se utilizan microesferas recubiertas de uno de los cebadores universales.
- Los fragmentos de la biblioteca de tamaño adecuado se desnaturalizan y son capturados sobre la superficie de las esferas mediante hibridación con el cebador.
- Las esferas con el ADN molde se introducen en un tubo Eppendorf con una mezcla de PCR que contiene un segundo cebador universal. El conjunto se cubre con aceite.
- Se emulsionan ambas fases y se obtienen multitud de microreactores formados por pequeñas gotas acuosas de mezcla de PCR que contienen una esfera con un único fragmento de ADN molde rodeada de aceite. En estos microreactores se lleva a cabo una PCR convencional de manera que, al final del proceso, cada esfera está recubierta de múltiples fragmentos idénticos de ADN molde anclados a su superficie.
- Una vez finalizado el proceso se rompe la emulsión y las esferas se fijan sobre una superficie o se depositan en micropocillos individuales de una placa picotiter.
Las placas picotiter o PTP (pico titer plate) son una versión en miniatura de las clásicas placas microtiter con múltiples micropocillos hexagonales de 30 µm de diámetro. En una placa cuadrada de 60 mm × 60 mm, el número de micropocillos es superior a 3·106.
1.2. Amplificación clonal del ADN molde
Con esta estrategia se pretende aumentar el número de copias de cada fragmento sin que se mezclen unos con otros; es decir, se pretende obtener clones de cada fragmento. Hay dos métodos basados en PCR:
PCR en emulsión (emPCR)
Se utilizan microesferas recubiertas de uno de los cebadores universales.
- Los fragmentos de la biblioteca de tamaño adecuado se desnaturalizan y son capturados sobre la superficie de las esferas mediante hibridación con el cebador.
- Las esferas con el ADN molde se introducen en un tubo Eppendorf con una mezcla de PCR que contiene un segundo cebador universal. El conjunto se cubre con aceite.
Se emulsionan ambas fases y se obtienen multitud de microreactores formados por pequeñas gotas acuosas de mezcla de PCR que contienen una esfera con un único fragmento de ADN molde rodeada de aceite. En estos microreactores se lleva a cabo una PCR convencional de manera que, al final del proceso, cada esfera está recubierta de múltiples fragmentos idénticos de ADN molde anclados a su superficie.
Una vez finalizado el proceso se rompe la emulsión y las esferas se fijan sobre una superficie o se depositan en micropocillos individuales de una placa picotiter.
Las placas picotiter o PTP son una versión en miniatura de las clásicas placas microtiter con múltiples micropocillos hexagonales de 30 µm.
PCR en fase sólida o PCR puente
Se realiza sobre una superficie a la que se fijan ambos cebadores universales con una alta densidad.
- Los fragmentos de la biblioteca del tamaño adecuado se desnaturalizan y las cadenas individuales se anclan a la superficie en una proporción que garantice cierta distancia entre ellas. Cada ADN molde queda, por tanto, rodeado de múltiples cebadores universales.
- El conjunto se inunda con una mezcla de PCR sin primers (ya fijos sobre la superficie) y se inicia el proceso de amplificación.
En cada ciclo de PCR se describen las siguientes fases:
- Fase de hibridación: El adaptador del extremo libre de cada fragmento de ADN molde hibrida con el cebador universal complementario más próximo, formando un puente sobre la superficie, de ahí el nombre del proceso.
- Fase de extensión: Se sintetiza una nueva cadena complementaria.
- Fase de desnaturalización: Ambas cadenas se separan permaneciendo ancladas a la superficie, muy próximas físicamente.
El resultado final es la generación de clusters o clones de cada uno de los fragmentos de la biblioteca, cada uno de ellos con miles de copias idénticas agrupadas.
2. Reacciones de secuenciación
Una vez inmovilizadas las moléculas de ADN molde sobre un soporte, de forma individual, en clusters o en microesferas, se proceden a realizar las reacciones de secuenciación. Se han desarrollado tecnologías que permiten realizar millones de reacciones individuales simultáneas y recoger los datos originados en cada una de ellas. Como característica común, son procesos cíclicos, no electroforéticos y basados en fluorescencia o bioluminiscencia.
2.1. Terminación reversible cíclica
Se basa en la utilización de dNTP marcados con un fluoróforo y bloqueados para impedir que se puedan unir más nucleótidos. De esta manera actúan como terminadores de cadena.
El soporte se inunda con una solución de ADN polimerasa y los cuatro dNTP marcados y bloqueados. La polimerasa incorpora un primer nucleótido pero no puede continuar polimerizando, ya que el nucleótido está bloqueado.
Se lava el exceso de dNTP no incorporado y se excita el soporte con un láser registrando la fluorescencia emitida en cada punto que coincide con la posición ocupada por cada molécula de ADN molde; la señal será del color correspondiente al fluoróforo que porta el nucleótido incorporado.
La lectura de los colores de las sucesivas matrices permite descifrar la secuencia de cada uno de los millones de fragmentos presentes en la placa.
2.2. Pirosecuenciación
Se basa en la producción de bioluminiscencia mediante reacciones enzimáticas acopladas a la incorporación de un nucleótido a una cadena en crecimiento. Es el método de elección cuando se usa PCR en emulsión con microesferas.
Una vez situadas las microesferas en los pocillos de la placa picotiter, se une uno de los cebadores universales a los ADN molde y se inician grupos de cuatro ciclos de secuenciación, cada uno de ellos con tres fases:
- Incubación de la placa con ADN polimerasa y un único dNTP.
- Producción y medida de bioluminiscencia. La incorporación de un nucleótido a una cadena de ADN en crecimiento libera una molécula de pirofosfato. Esto inicia una serie de reacciones enzimáticas catalizadas por la sulfurilasa y la luciferasa que terminan con la producción de bioluminiscencia que es registrada por el sistema de detección del secuenciador. Como en el método anterior, se obtiene una matriz de puntos: en los pocillos en los que no se haya incorporado el nucleótido no se producirá señal y en aquellos donde sí se haya incorporado, la intensidad de bioluminiscencia dependerá del número de nucleótidos incorporados.
3. Diagrama de flujo o pirograma. El software del secuenciador genera una gráfica que representa mediante líneas verticales la intensidad de bioluminiscencia medida en el pocillo en cada ciclo. Esta gráfica permite leer directamente la secuencia del fragmento presente en ese pocillo.
1. Fase de preparación del ADN molde
Una característica común a todas las tecnologías de secuenciación masiva es que, al final de la fase de preparación, los diferentes ADN molde se inmovilizan sobre una superficie sólida o soporte, lo que permite realizar cientos de miles de reacciones de secuenciación simultáneas.
También es común a todas las tecnologías NGS:
- Un primer paso de fragmentación al azar del genoma por métodos físicos o enzimáticos.
- La posterior unión a los extremos de cada fragmento de dos adaptadores universales.
De esta manera se obtiene una biblioteca de fragmentos con extremos universales que puede ser amplificada en su totalidad con un solo juego de cebadores complementarios de los adaptadores.
Algunas tecnologías movilizan directamente los fragmentos de la biblioteca sobre una superficie para iniciar la secuenciación (ADN molde de cadena única), mientras que otras amplifican previamente la biblioteca para mejorar el rendimiento en la secuenciación (amplificación clonal del ADN molde).
VI. Secuenciación de tercera generación
El futuro de la medicina progresa hacia el diagnóstico molecular personalizado y, por ello, la secuenciación de ácidos nucleicos evoluciona hacia el desarrollo de secuenciadores más rápidos, más potentes y de menor coste.
La tercera generación de secuenciadores no usa detectores ópticos para establecer la secuencia, por lo que evita el uso de marcadores fluorescentes.
1. Secuenciación Ion Torrent
Detecta microvariaciones de pH producidas en una reacción de polimerización. Cuando un dNTP se incorpora a una cadena en crecimiento, se libera un ion hidrógeno que produce una microvariación en el pH de la solución. Esta variación es detectada por un sensor de pH incluido en el pocillo y registrada por el software del secuenciador. Si se incorporan varios nucleótidos en un único ciclo, porque el ADN molde tiene varias bases iguales consecutivas, la variación de pH será proporcionalmente mayor.
Con base en las variaciones de pH ocurridas en cada pocillo, el secuenciador establece la secuencia del fragmento presente en cada pocillo y posteriormente ensambla las lecturas para obtener la secuencia genómica completa.
2. Secuenciación por nanoporos
Está basada en biosensores y carece de reacción de polimerización, así como de marcajes fluorescentes. Cada sensor consta de una membrana bicapa resistente eléctricamente y sometida a cierto voltaje, atravesada por un nanoporo proteico con un microelectrodo.
Por el nanoporo fluye de manera continua una corriente iónica detectada por el electrodo. Cualquier molécula que lo atraviese provoca una alteración en esta corriente basal cuya magnitud es característica de la molécula en cuestión, lo que permite identificarla.
Para secuenciar una molécula de ADN basta con hacer pasar una de las cadenas por el nanoporo. Cada base produce una señal característica, por lo que la secuenciación se produce simultáneamente al paso de la molécula por el nanoporo.
Es un método muy rápido y la tecnología empleada se puede miniaturizar.
VII. Secuenciación de ARN
La secuenciación de moléculas de ARN se puede realizar directamente por métodos enzimáticos o indirectamente mediante el paso previo a ADNc.
1. Métodos enzimáticos directos de secuenciación de ARN
Son métodos de terminación de cadena, al igual que el método de Sanger para secuenciar ADN. De manera análoga al modelo descrito para el ADN, en la secuenciación del ARN se reconocen las siguientes fases:
- Mezcla de dNTP y ddNTP (terminadores de cadena) en la proporción adecuada en una reacción de transcripción inversa catalizada por una retrotranscriptasa.
- La molécula de ARN actúa de molde y los fragmentos de nueva síntesis son ADNc.
- Marcaje de fragmentos por métodos radioactivos o fluorescentes.
- Realización de cuatro reacciones de transcripción inversa, una con cada ddNTP, o bien una única reacción con los cuatro ddNTP marcados con fluoróforos diferentes.
- Finalmente, los fragmentos generados en la reacción de transcripción inversa se separan mediante electroforesis y se analizan mediante autorradiografía o con luz ultravioleta según el tipo de marcaje.
2. Métodos indirectos de secuenciación de ADN
Se basa en la obtención previa de ADNc mediante la transcripción inversa. El ADNc es luego secuenciado por cualquiera de los métodos de secuenciación de ADN y la secuencia obtenida se traslada a ARN teniendo en cuenta la complementariedad de bases.
2. Métodos indirectos de secuenciación de ADN
Se basa en la obtención previa de ADNc mediante la transcripción inversa. El ADNc es luego secuenciado por cualquiera de los métodos de secuenciación de ADN y la secuencia obtenida se traduce a ARN teniendo en cuenta la complementariedad de bases.
VII. Secuenciación de ARN
La secuenciación de moléculas de ARN se puede realizar directamente por métodos enzimáticos o indirectamente previo paso a ADNc.
1. Métodos enzimáticos directos de secuenciación de ARN
Son métodos de terminación de cadena al igual que el método de Sanger para secuenciar ADN. De manera análoga al modelo descrito para el ADN, en la secuenciación del ARN consta de las siguientes fases:
- Mezcla de dNTP y ddNTP (terminadores de cadena) en la proporción adecuada en una reacción de transcripción inversa catalizada por una retrotranscriptasa.
- La molécula de ARN actúa de molde y los fragmentos de nueva síntesis son ADNc.
- Marcaje de fragmentos por métodos radioactivos o fluorescentes.
- Realización de cuatro reacciones de transcripción inversa, una con cada ddNTP, o bien una única reacción con los cuatro ddNTP marcados con fluoróforos diferentes.
- Finalmente, los fragmentos generados en la reacción de transcripción inversa se separan mediante electroforesis y se analizan mediante autorradiografía o con luz ultravioleta según el marcaje.
2. Métodos indirectos de secuenciación de ADN
Se basa en la obtención previa de ADNc mediante la transcripción inversa. El ADNc es luego secuenciado por cualquiera de los métodos de secuenciación de ADN y la secuencia obtenida se traduce a ARN teniendo en cuenta la complementariedad de bases.
