Next Generation Sequencing

Con il termine Next Generation Sequencing (NGS)^[1] ^[2] o sequenziamento in parallelo si indicano una serie di tecnologie che permettono di sequenziare grandi genomi in un tempo ristretto, dell'ordine di settimane. La tecnologia più utilizzata per il NGS permette di leggere fino a 300 bp per frammento.

Metodologia

L’impiego di queste tecniche permette, in un solo esperimento, di effettuare studi di vario genere tra i quali la caratterizzazione simultanea di genomi, individuazione di riarrangiamenti cromosomici bilanciati e sbilanciati, delezioni e copy number variations (CNV).

Il NGS viene anche definito come metodo “da estensione” perché la base viene identificata durante l’aggiunta alla catena nascente. In breve potremmo riassumere il processo partendo da DNA a singolo filamento, un primer, la DNA polimerasi e singoli nucleotidi marcati. Una volta iniziata la reazione di sintesi di DNA a doppio filamento, ogni volta che la DNA polimerasi inserisce un nucleotide sulla catena in allungamento, questo viene detectato immediatamente in quanto viene rilasciato un segnale di fluorescenza specifico per ognuno dei nucleotidi.

Ad oggi per il NGS ci sono diverse tecniche che si basano su principi differenti.

Illumina: fluorescent sequencing
Life Technologies: pH sequencing, si basa sulla variazione del pH che avviene quando viene incorporato un nucleotide
Roche Parallel Pyrosequencing questo metodo è stato dismesso a partire dal 2015 perché era meno efficiente dei metodi basati sulla fluorescenza.
Pacific Bioscences SMRT (Single molecule, real time) questa tecnologia non è ancora matura
Oxford Nanonopore rappresenta il futuro e non è ancora disponibile per i laboratori.

Le tecniche di NGS permettono di sequenziare:

DNA genomico:
- Intero genoma (la sequenza completa - piccoli genomi)
- Esoma (solo la parte di DNA trascritto in RNA, esoni)
- Geni mirati
- Ampliconi (solo prodotti PCR)
Trascrittoma:
- RNA totale
- mRNA
- small RNA (<30 nt)
Epigenoma:
- ChIP-Seq (Chromatin immunoprecipitation sequencing: DNA o RNA a cui sono legati specifiche proteine)
- Metil-Seq (studio del pattern di metilazione del DNA, epigenetica)

Tutti questi metodi necessitano della preparazione degli acidi nucleici che devono essere sequenziati. Questa preparazione è richiesta per avere l'acido nucleico puro, delle dimensioni corrette, pronto per essere sequenziato. Questo step di preparazione viene anche chiamato library preparation.

Una DNA library è una collezione di frammenti di DNA identificare e selezionare i frammenti di DNA che li interessano per un ulteriore studio.

Nel caso di una NGS library tutti i frammenti che vogliamo sequenziare hanno delle sequenze aggiuntive. Nella figura è riportato un esempio che si basa sulla tecnologia Illumina. Queste sequenze vengono introdotte in ogni frammento mediante ligazione e ognuna di queste ha una funzione: P5 e P7 sono le due sequenze che vengono ancorate alla flow cell dove i frammenti vengono prima amplificati e poi sequenziati. Le sequenze in giallo e in azzurro sono le sequenze che permettono il sequenziamento vero e proprio. Degli index parliamo più avanti perché non sempre sono presenti e sono facoltativi.

Processo

La procedura per arrivare al sequenziamento è diversa a seconda del materiale di partenza.

Se si vuole sequenziare un intero genoma è necessario frammentarlo e poi procedere con la preparazione di una library di cloni.

Se si vuole studiare l’epigenoma prima è necessario effettuare una ChIP e poi procedere con la preparazione di una library di cloni.

Nel target capture si sequenzia solo parte del genoma (ad esempio un gene candidato per una specifica patologia), in questo caso la NGS è molto utile se abbiamo un centinaio di geni candidati, diversamente da altre tecniche come la DGGE (Denaturing Gradient Gel Electrophoresis) che in questo caso richiederebbe lo svolgimento di un esperimento per ogni singolo esone da analizzare.

Il DNA viene stratto dal materiale di partenza utilizzando dei kit commerciali

Estrazione del DNA: Il primo step è estrarre gli acidi nucleici dal materiale di partenza (vettore o genoma da cellula). A tal fine esistono in commercio dei kit.
Frammentazione: Dopo l’estrazione degli acidi nucleici avviene la frammentazione o taglio del DNA, esistono tre metodi differenti di frammentazione:
- Frammentazione fisica basata sull'utilizzo di ultrasuoni
- Frammentazione enzimatica basata sull’utilizzo di trasposasi ingegnerizzate
- Nebulizzazione: in questo caso Il DNA viene fatto passare attraverso piccoli fori applicando un’alta pressione
End repair: I frammenti ottenuti possono avere le estremità overhangs al -5’ e al -3’ che vanno modificate in delle estremità blunt. Per fare questo si possono adottare due strategie:
- DNA polimerasi I: dal momento che è dotata di attività esonucleasica 3’-5’, i frammenti di DNA con l’estremità 5’ overhang possono essere smussati aggiungendo un dNTP al -3’ e le sporgenze al -3’ possono essere rimosse per attività esonucleasica 3' --> 5';
- Mung Bean Nuclease: i nucleotidi terminali non appaiati ad una estremità di DNA possono essere rimossi da questo singolo enzima specifico dotato di attività esonucleasica che idrolizza un legame fosfodiestere terminale, eliminando così la base “in eccesso” una alla volta.
Selezione dei frammenti secondo le dimensioni: In questa fase è necessario separare i frammenti in base alla loro dimensione: la tecnologia Illumina permette di sequenziare fino a 500 bp per singola corsa per questo motivo sono ideali frammenti di DNA con dimensione comprese tra 350-500 bp Per ottenere frammenti della dimensione corretta si utilizzano dei kit commerciali.

I frammenti vengono messi in un buffer con un rapporto differente di Sample Purification Beads SPB e PEG che ne permette la separazione. I primi ad essere rimossi sono i frammenti più lunghi e poi quelli più corti che vengono lavati via. Per separare questi frammenti si utilizzano magnetic beads^[3].

A-tailing: Viene adenilata l’estremità -3’ mediante l’addizione di una singola A. Questo può essere fatto mediante l’utilizzo di una Taq polimerasi^[4] o mediante altri enzimi come le transferasi terminali che permettono l’aggiunta di un singolo nucleotide all’estremità -3'. La corrispondente T è presente all’estremità -3’ dell’adattatore e ciò permette la formazione di due legami a idrogeno tra le due basi complementari e la conseguente ligazione.

Una flow-cell con frammenti P5 e P7 in verde e rosa

Amplificazione tramite PCR :La prima cosa da fare è arricchire (amplificare) perché il frammento di DNA può essere presente in una copia massimo due. Ovviamente è un po’ poco anche se il trend è quello di andare verso il single cell analysis.La cosa importante è che gli inserti si possano legare sulla slide ovvero la piastra (si parla di Illumina che è quello più famoso e maggiormente descritto). Sulla piastra gli oligo vengono sintetizzati con la tecnologia dei microarray. Per l'ibridazione è necessario che gli oligo presenti sulla piastra (flow-cell) si appaino con i frammenti da sequenziare. A tal fine esistono i frammenti P5 e P7 adesi alla flow-cell che sono complementari ai frammenti P5 e P7 presenti sui filamenti del DNA da sequenziare. (P5 e P7 sono le regioni che permetto di ancorare il frammento alla slide e sono anche utilizzati come primer per l’amplificazione)

Ad ogni colore corrisponde una diversa base che viene aggiunta dalla DNA polimerasi.

Dopo aver fatto avvenire l’ibridazione può iniziare la reazione di PCR. Al termine della PCR dove c’era un frammento ibridato ora ce ne sono milioni. Questo processo prende il nome di Cluster Amplification. Il cluster al suo interno avrà l’inserto specifico e all’interno di un cluster la sequenza interna sarà la stessa, o meglio ci saranno le due sequenze complementari dell’inserto. Quindi alla fine della PCR si arriva ad avere dei cluster e da una copia del DNA di partenza si ottengono molteplici copie. Questa è l’amplificazione, per ora non è stato sequenziato ancora niente ma è stato preparato il materiale da sequenziare.

Sequenziamento: Il cluster appena formato serve per avere milioni di sequenze vicine e identiche posizionate sulla flow-cell. A questo punto si utilizzano due primers che sono Rd1 SP e Rd2 SP (SP= sequencing primer) i quali permetteranno alla DNA polimerasi di procedere con la sintesi di nucleotidi. Ad ogni nucleotide aggiunto corrisponde una particolare emissione di fluorescenza, un detector registra la fluorescenza emessa in ogni punto della flow-cell, e un sistema di output fornisce la sequenza esatta dei nucleotidi.

Note

^ Jorge S. Reis-Filho, Next-generation sequencing, in Breast Cancer Research, vol. 11, n. 3, 1º gennaio 2009, pp. S12, DOI:10.1186/bcr2431. URL consultato il 31 marzo 2017.
^ (EN) Gert Matthijs, Erika Souche e Mariëlle Alders, Guidelines for diagnostic next-generation sequencing, in European Journal of Human Genetics, vol. 24, n. 1, 1º gennaio 2016, pp. 2–5, DOI:10.1038/ejhg.2015.226. URL consultato il 31 marzo 2017.
^ (EN) Lluis Martinez, Magnetic DNA Purification: History and recent developments. URL consultato il 3 marzo 2018.
^ (EN) The Role of Taq Polymerase in PCR, su Sciencing. URL consultato il 3 marzo 2018.

[1] Jorge S. Reis-Filho, Next-generation sequencing, in Breast Cancer Research, vol. 11, n. 3, 1º gennaio 2009, pp. S12, DOI:10.1186/bcr2431. URL consultato il 31 marzo 2017.

[2] (EN) Gert Matthijs, Erika Souche e Mariëlle Alders, Guidelines for diagnostic next-generation sequencing, in European Journal of Human Genetics, vol. 24, n. 1, 1º gennaio 2016, pp. 2–5, DOI:10.1038/ejhg.2015.226. URL consultato il 31 marzo 2017.

[3] (EN) Lluis Martinez, Magnetic DNA Purification: History and recent developments. URL consultato il 3 marzo 2018.

[4] (EN) The Role of Taq Polymerase in PCR, su Sciencing. URL consultato il 3 marzo 2018.

[1]

[2]

[3]

[4]