Next Generation Sequencing
Trainier deine Lernmuskeln!
Mit Flash Cards, Quiz und mehr
LoslegenSynonyme: Sequenzierung der nächsten Generation, Hochdurchsatz-Sequenzierung
Englisch: next generation sequencing (NGS), massively parallel sequencing, Deep sequencing
Definition
Next Generation Sequencing, kurz NGS, ist eine verbesserte Technologie zur DNA- und RNA-Sequenzierung. Sie erlaubt im Gegensatz zur Sanger-Sequenzierung höhere Geschwindigkeiten: Ein komplettes, menschliches Genom kann innerhalb eines Tages sequenziert werden.
Hintergrund
Vorherige Methoden beruhen entweder auf enzymatischen (Sanger-Sequenzierung) oder chemischen (Maxam-Gilbert-Verfahren) Techniken. Dabei werden Abschnitte der DNA sequenziert und untersucht. Um das gesamte menschliche Genom zu sequenzieren, müssten die Ergebnisse vieler Abschnitte zusammengefügt werden, was sowohl arbeits- als auch kostenintensiv ist.
Beim Next Generation Sequencing verläuft der Prozess mehr oder weniger automatisiert und die Ergebnisse werden parallel zur Sequenzierung erhalten. Zusätzlich können die Ergebnisse mit einem menschlichen Referenzgenom abgeglichen werden. Insgesamt ist das NGS somit schneller und kostengünstiger.[1]
Prinzip
Das Grundprinzip des NGS basiert auf vier Schritten:[2]
Fragmentation
Im ersten Schritt werden DNA-Fragmente erzeugt, z.B. mit Hilfe von Enzymen, Ultraschall (Sonikation) oder Transposase-basierte Verfahren.
Adaption
Im nächsten Schritt werden spezifische Adapter-Oligonukleotide an die Bruchstücke gebunden und so eine "DNA-Bibliothek" erstellt.[3]
Amplifikation
Bei einigen NGS-Verfahren ist eine vorherige Amplifikation der DNA notwendig. Die DNA-Fragmente werden an feste Reaktionsmedien (zum Beispiel an einen Chip) gebunden und vervielfältigt. Dabei werden Cluster identischer DNA generiert, in denen die eigentliche Sequenzierung abläuft. Durch die Aufteilung in Cluster können in sehr kurzer Zeit viele Sequenzierungen gleichzeitig ablaufen.
Datenanalyse
Die erhaltenen Daten werden in Form strukturierter Datensätze (FASTQ, BAM/CRAM) gespeichert und bioinformatisch analysiert. Die Datenmengen können dabei über 200 GB erreichen. Das erschwert die Datenspeicherung und vor allem die -weitergabe an andere Wissenschaftler oder Ärzte. Viele Labors arbeiten daher mit Cloud-Diensten.
Verfahren
Beim NGS existieren verschiedene Verfahren.[2] Entscheidend für die Auswahl des Verfahrens ist die Coverage. Sie gibt die Mindestanzahl an Reads an, die für die Erstellung einer Referenzsequenz nötig ist. Als Read wird eine zum DNA-Fragment komplementäre Basensequenz bezeichnet. Für die zuverlässige Sequenzierung eines menschlichen Genoms wird in der Regel eine mittlere Coverage von mindestens 30× angestrebt, was z.B. durch die Illumina-Sequenzierung gewährleistet ist. Die Illumina-Sequenzierung dominiert heute (2026) die Short-Read-Sequenzierung, während die Nanopore-Sequenzierung und die SMRT-Sequenzierung die wichtigsten Long-Read-Technologien sind. Die Pyrosequenzierung (454-Sequenzierung) und die SOLiD-Sequenzierung besitzen nur noch geringe praktische Bedeutung.
Illumina-Sequenzierung
Die Illumina-Sequenzierung basiert auf dem Prinzip des Sequencing-by-Synthesis. Bei diesem Verfahren sind die Nukleotide an einen Terminator und einen fluoreszierenden Farbstoff gebunden. Die Basenpaarung führt zu Anregung des Farbstoffs, die von einem Detektor registriert wird. Danach wird der Terminator entfernt und neue Nukleotide hinzugefügt.
Nanopore-Sequenzierung
Die Nanopore-Sequenzierung basiert auf dem Nachweis von Änderungen des elektrischen Stroms beim Durchtritt einzelner DNA- oder RNA-Moleküle durch eine Protein- oder Festkörpernanopore. Aus den charakteristischen Stromsignalen wird die Nukleotidsequenz bioinformatisch rekonstruiert. Im Gegensatz zu den meisten anderen NGS-Verfahren ist keine PCR-Amplifikation erforderlich. Die Methode ermöglicht die Analyse von DNA-Fragmenten mit Längen von mehreren 10.000 bis über 1.000.000 Basenpaaren.
SMRT-Sequenzierung
Die SMRT-Sequenzierung ("Single Molecule Real-Time Sequencing") ist ein Long-Read-Sequenzierungsverfahren. Die DNA-Synthese wird dabei in mikroskopisch kleinen Reaktionskammern in Echtzeit beobachtet. Fluoreszenzmarkierte Nukleotide erzeugen während ihres Einbaus charakteristische Signale, aus denen die Basensequenz rekonstruiert wird. Die Methode ermöglicht die Sequenzierung einzelner DNA-Moleküle ohne vorherige Amplifikation und erreicht Read-Längen von mehreren 10.000 Basenpaaren.
Halbleitersequenzierung
Bei der Halbleitersequenzierung werden die einzelnen DNA-Cluster von einem Halbleiter umgeben, der als pH-Meter dient. Kommt es zu einer Basenpaarung, wird ein Proton freigesetzt. Die daraus resultierende pH-Wert-Änderung wird durch den Halbleiter aufgezeichnet.
Pyrosequenzierung
Bei der Pyrosequenzierung werden die DNA-Basen an Pyrophosphat gebunden einzeln zugesetzt. Findet eine Basenpaarung statt, wird das Pyrophosphat frei, das mithilfe einer enzymatischen Reaktion zu Adenosintriphosphat umgewandelt wird. In einem Luciferin-Luciferase-System wird Licht erzeugt, das über einen Detektor erfasst wird.
SOLiD-Sequenzierung
Die SOLiD-Sequenzierung basiert auf dem Prinzip des Sequencing-by-ligation. Hierbei kommen 16 verschiedene, sogenannte Oligonukleotidsonden zum Einsatz. Jede dieser Sonden trägt einen spezifischen Farbstoff und besteht aus zwei spezifischen und sechs weiteren Basen. An den oben erwähnten Adapter wird ein spezifischer Primer gebunden. Mithilfe einer Ligase wird eine passende Oligonukleotidsonde angelagert. Anschließend wird das Signal des Farbstoffs ausgelesen.
Anwendung
Derzeit (2026) wird das Next Generation Sequencing v.a. zu Forschungszwecken, in der klinischen Genetik, der Mikrobiologie und der Onkologie verwendet.[1]
Quellen
- ↑ 1,0 1,1 Behjati S., Tarpey PS What is next generation sequencing?, Arch Dis Child Educ Pract Ed. 2013;98(6):236–238, abgerufen am 10.01.2020
- ↑ 2,0 2,1 Selzer, PM et al., Angewandte Bioinformatik, Springer Verlag Heidelberg, 2. Auflage, 2018
- ↑ New England BioLabs NGS sample preparation and Target enrichment, abgerufen am 10.01.2020