Nukleotidsequenz

Synonym: "Basensequenz"

Definition

Die Nukleotidsequenz gibt in der Genetik die Abfolge der Nukleotide in einem DNA- oder RNA-Bereich an, z.B. ...AGGATTAGGCCTG...

Abkürzungen

Nach Konvention steht jeder Buchstabe der Nukleotidsequenz für ein Nukleotid.

A für Adenin
G für Guanin
C für Cytosin
T für Thymin

In der RNA kommt das U für Uracil vor. Es ersetzt das Thymin.

Richtung der Sequenz

Diese Repräsentation der DNA-Sequenz wird zur Absicherung in den großen öffentlichen genomischen Datenbanken wie z.B. GenBank verwendet. Die Sequenz wird üblicherweise nach Konvention vom 5'-Ende zum 3'-Ende des kodierenden Stranges aufgeschrieben, also in der selben Richtung, wie die Polymerasen oder die Ribosomen über den Strang laufen.

Nutzen

Aufgrund der Darstellung als Symbolfolge lässt sich die DNA so sehr einfach statistisch untersuchen. Dabei wird die Häufigkeit so genannter n-Tupel untersucht, d.h. das Vorkommen von Teilwörtern der Länge n. So taucht im menschlichen Genom im Mittel die Folge "CG" deutlich seltener auf als alle anderen 2er-Wörter. Die lokalen Häufigkeitsverteilungen verschiedener Nukleotidwörter können erste Hinweise auf die Funktionen bestimmter DNA-Abschnitte geben (CpG-Inseln, Stoppcodons, Sequenzenden von Introns).

Nukleotidsequenz

Trainier deine Lernmuskeln!

Inhaltsverzeichnis

Definition

Abkürzungen

Richtung der Sequenz

Nutzen

Empfehlung