rsIDs, Microarray und SNP-Suche

rsID

Ein SNP ist eine einzelne Position im Genom, an der sich Menschen in einem Buchstaben unterscheiden. Eine rsID ist die stabile Adresse dieser Position. Verbrauchertests wie 23andMe messen viele tausend solcher Positionen; Genome liest dieselben Stellen aus vollständigen Sequenzdaten und schlägt einzelne rsIDs nach. Diese Seite erklärt, wie das funktioniert und wie man das Ergebnis liest.

ANATOMIE EINER rsID rs429358 · eine Genomposition AGCTACGATCG 5′ 3′ Referenz-Allel C · Alternativ-Allel T Du erbst zwei Kopien, der Genotyp nennt beide: C C C / C homozygot Referenz C T C / T heterozygot T T T / T homozygot Variante Welche Wirkung ein Allel hat, hängt vom Gen ab; die Strang-Orientierung kann je nach Anbieter wechseln.

Was eine rsID ist

rs steht für Reference SNP. Die Nummer ist ein Eintrag in der dbSNP-Datenbank des NCBI, der eine genaue Position und die dort bekannten Varianten festhält. Der Vorteil: Während sich Koordinaten zwischen Referenz-Builds (GRCh37, GRCh38) verschieben, bleibt die rsID dieselbe. So kann man eine Variante eindeutig benennen und in der Literatur wiederfinden.

Referenz-, Alternativ- und Effektallel

Das Referenz-Allel ist der Buchstabe, der im Referenzgenom steht; das Alternativ-Allel ist die abweichende Variante. Wichtig ist eine dritte Rolle: das Effektallel ist dasjenige, für das eine Studie eine Wirkung berichtet. Das muss nicht das seltene oder das alternative Allel sein. Eine Aussage wie „das T-Allel erhöht das Risiko“ ist nur mit dieser Angabe interpretierbar.

Wie man einen Genotyp liest

Du hast jedes autosomale Gen zweimal, also nennt der Genotyp beide Allele, zum Beispiel C/C, C/T oder T/T. C/C und T/T sind homozygot (zwei gleiche), C/T ist heterozygot. Viele Effekte sind dosisabhängig: ein Risikoallel wirkt schwächer als zwei. Manche Anbieter notieren die Allele auf dem Minus-Strang, sodass aus C/T scheinbar G/A wird. Das ist dieselbe Variante, nur anders herum geschrieben.

Microarray gegenüber vollständiger Sequenzierung

Ein Microarray misst nur ausgewählte, vorab festgelegte Positionen (typisch einige hunderttausend). Vollständige Sequenzierung (WGS) liest das ganze Genom und kann jede dieser Positionen nachbilden, plus alle dazwischen. Genome nutzt das: Es liest an jeder gewünschten Stelle die Allele aus dem Alignment und schreibt sie im Format von 23andMe, AncestryDNA oder GEDmatch heraus, damit eigene Daten in vertraute Werkzeuge passen. Nichts davon verlässt das Gerät.

Grenzen

Ein einzelner SNP ist selten ein Urteil. Die meisten Effekte sind klein, hängen von Abstammung, Lebensstil und anderen Genen ab und stammen aus Assoziationsstudien, nicht aus Kausalbeweisen. Array-Befunde können zudem an einzelnen Positionen falsch sein. Die Einzelseiten zu den Vitaminen und Genen erklären, was für wichtige Marker wirklich belegt ist und was nicht.

Vitamine und Mikronährstoffe

Für die Vitamine gibt es jeweils eine eigene Seite mit den belegten Markern, Effektallelen und Quellen: Vitamin A (BCMO1), Vitamin B6 (ALPL), Vitamin B9 / Folat (MTHFR), Vitamin B12 (FUT2, CUBN, TCN2), Vitamin C (SLC23A1), Vitamin D (GC, DHCR7, CYP2R1, VDR), Vitamin E (CYP4F2, SCARB1), Vitamin K (VKORC1) sowie die antioxidativen Enzyme (SOD2, GPX1, CAT, NQO1). Sie folgen alle demselben Aufbau: Marker, Bedeutung, Einordnung.

Weitere SNP-Panels in Genome

Über Vitamine und Enzyme hinaus stellt Genome Built-in-Panels für Pharmakogenetik (darunter CYP2C19, CYP2C9, CYP2D6, DPYD, TPMT, SLCO1B1 und HLA-Hypersensitivität), krankheitsassoziierte Marker (MTHFR, APOE, kardiovaskulär, Autoimmunität, Krebs), Eisenstoffwechsel (HFE C282Y und H63D, TMPRSS6), Entgiftung (GSTP1, COMT, CYP1A1), Sportgenetik (ACTN3, PPARGC1A), Schlaf (DEC2, ADA, CLOCK) und Laktose/Koffein bereit. Jedes Panel enthält rsIDs, Genotyp-Interpretationen und die zugrundeliegenden PubMed-Quellen.

Was Genome misst. Den Genotyp (beide Allele) an einer per rsID benannten Position, abgelesen aus dem Alignment, sowie den Export vieler solcher Positionen im Format gängiger Microarray-Anbieter.

Verwandte Themen

Quellen

  1. 1Sherry et al., 2001 dbSNP: the NCBI database of genetic variation. Nucleic Acids Research 29:308–311. doi.org/10.1093/nar/29.1.308
  2. 2Buniello et al., 2019 The NHGRI-EBI GWAS Catalog of published genome-wide association studies. Nucleic Acids Research 47:D1005–D1012. doi.org/10.1093/nar/gky1120
  3. 3Bush & Moore, 2012 Chapter 11: Genome-wide association studies. PLoS Computational Biology 8:e1002822. doi.org/10.1371/journal.pcbi.1002822