Ein Allel ist eine Genvariante an einer bestimmten genomischen Position. Allelfrequenzen spielen eine wichtige Rolle bei genetischen Variationen. In der Populationsgenetik geben Allelfrequenzen die Häufigkeit eines Allels in einer bestimmten Population an. Ein Beispiel hierfür ist die Häufigkeit der AB0 Allele, die für die verschiedenen Blutgruppen verantwortlich sind. Die Allelfrequenz wird berechnet als Bruchzahl oder Prozentzahl, wobei die Häufigkeit, mit der das betreffende Allel in der Population beobachtet wird, im Zähler steht und die Populationsgröße im Nenner. In unserem Beispiel in Abbildung 1 besteht die Population aus 50 Individuen, von welchen 6 das betreffende Allel tragen. Das ergibt eine Allelfrequenz von 12 %. Wenn die Allelfrequenz einer Variante über einem bestimmten Schwellenwert liegt, häufig über 1 %, dann wird diese Variante als Einzelnukleotidpolymorphismus („single nucleotide polymorphism“, SNP) und nicht als pathognomonisch relevante Variante eingestuft. Das bedeutet, dass die Variante nicht charakteristisch für eine bestimmte Erkrankung ist. Informationen über Allelfrequenzen in bestimmten Populationen können in geeigneten Datenbanken gefunden werden, wie zum Beispiel der „single nucleotide polymorphism database (dbSNP)“.
Die Allelfrequenz in der Molekularpathologie unterscheidet sich maßgeblich von der Allelfrequenz in der Populationsgenetik. Die Allelfrequenz in der
Molekularpathologie konzentriert sich auf Next-Generation-Sequencing (NGS)-Analysen und dem Anteil der nachgewiesen mutierten Allele. Diese Allelfrequenz wird auch Varianten-Allelfrequenz („variant allele frequency“, VAF), Varianten-Allelanteil („variant allle fraction“, VAF) oder Häufigkeit der mutierten Allele („mutant allele frequency“, MAF) genannt. Die VAF wird berechnet als Anzahl der mutierten Moleküle im Verhältnis zur Gesamtzahl der Wildtyp-Moleküle an einer bestimmten Stelle im Genom. In unserem Beispiel in Abbildung 1 tragen 6 der 50 Moleküle die betreffende Mutation. Dies führt zu einer VAF von 12 %.
Die VAF kann verwendet werden, um den Ursprung einer Variante zu bestimmen. Für Keimbahnvarianten werden Varianten-Allelfrequenzen von 50 % für heterozygote Varianten und 100 % für homozygote Varianten erwartet. Varianten-Allelfrequenzen zwischen weniger als 1 % und 50 % können auf Mosaik-Mutationen hinweisen. Beim Mosaizismus besitzen nicht alle Keimbahnzellen den gleichen genetischen Aufbau, da pathologische Veränderungen erst nach der Befruchtung stattfinden. Dies führt zu so-genannten postzygotischen Mutationen.
Im Fall von Tumoranalysen, in denen keine entsprechende Normalgewebsprobe vorhanden ist, kann die VAF verwendet werden, um Schlussfolgerungen darüber anzustellen, ob eine Variante von somatischen Zellen stammt oder von den Eltern vererbt wurde. Das ist besonders interessant bei Flüssigbiopsie-Analysen. Bei physiologischen Vorgängen, wie zum Beispiel der Apoptose oder Nekrose von Zellen, sowie der Sekretion, wird zellfreie DNA („cell-free DNA“, cfDNA) von normalem Gewebe und von Tumoren stammend („tumor-derived DNA“, ctDNA) in den Blutkreislauf freigesetzt. Diese DNA kann in Flüssigbiopsie-Ansätzen eingefangen, sequenziert und analysiert werden – und die VAF kann dabei helfen, den Ursprung einer Variante zu bestimmen. Da zellfreie DNA während physiologischen Vorgängen freigesetzt wird, bietet die Analyse dieses genomischen Materials einen umfassenderen Blick über die Heterogenität eines Tumors und seiner potenziellen Metastasen im Vergleich zu Analysen von Tumor-Gewebebiopsien. Zusätzlich hat zellfreie DNA eine relativ kurze Halbwertszeit von ungefähr zwei Stunden. Daher können Flüssigbiopsie-Analysen als „Echtzeit“-Betrachtung des genetischen Tumorstatus betrachtet werden.
Die Menge der zellfreien DNA-Fragmente im peripheren Blutkreislauf ist allerdings begrenzt. Zusätzlich ist der Anteil der Tumormoleküle innerhalb der bereits begrenzten Menge an zellfreier DNA noch geringer. Dieser Anteil ändert sich auch abhängig von der Krebsart, seinem Stadium und seiner Lage. Daher kann die VAF bis auf 0,1 % sinken. Bei solch niedrigen VAFs ist es schwierig zu unterscheiden, ob eine Variante von einem Tumor abstammt oder ob es sich um eine intrinsische Fehlerrate des NGS-Prozesses handelt, wie sie zum Beispiel bei der Vorbereitung der Library, der Formierung von Clustern oder der Sequenzierung
selbst, vorkommt. Daher hat jeder Ansatz eine Nachweisgrenze („limit of detection“, LOT). Bis zu diesem Limit können VAFs bestimmt und von intrinsischen Fehlern unterschieden werden. Daher müssen das Protokoll für Flüssigbiopsien und die anschließenden Analysen sorgsam ausgewählt werden, um die VAFs eines Tumors zuverlässig zu bestimmen.