Weltweit leiden fast 300 Millionen Menschen an seltenen Erkrankungen 10. Eine Mehrheit der Betroffenen zeigt bereits im Kindesalter erste gravierende Symptome, wobei die Hälfte der Fälle mit einer verkürzten Lebenserwartung einhergeht. 2, 5 Obwohl schätzungsweise mehr als drei Viertel der Fälle genetischen Ursprungs sind, bleibt die Hälfte der Patienten ohne Diagnose. 3, 8 Damit rückt die Erforschung seltener Erkrankungen in den Fokus der aktuellen genetischen Forschung.
In der genetischen Diagnostik bleibt nach wie vor die Short-Read-Sequenzierung das Mittel der Wahl. Sie ermöglicht, möglichst viele Genome in kurzer Zeit mit hoher Genauigkeit zu sequenzieren. Jedoch stößt sie in einigen Fällen an ihre Grenzen, wenn es darum geht, große strukturelle Varianten, Mutationen in repetitiven Regionen und Imprinting-Störungen zu bestimmen, welche häufig ursächlich für seltenen Erkrankungen sind.
Einige Studien untersuchen den Anteil zusätzlicher Diagnosen durch Long-Read-Sequenzierungen in Patientenkohorten, die durch Short-Read-Sequenzierungen allein keine Diagnose erhalten hatten. Dabei zeigte sich, dass der Einsatz von PacBio-Sequenzierplattformen die Diagnoserate deutlich erhöhen konnte. 9, 6, 1
Aber woran liegt das? Long-Read-Technologien können Varianten in repetitiven oder strukturell komplexen Regionen besser auflösen, da sich Reads präziser und eindeutiger bestimmten Positionen zuordnen lassen.
Viele Gene, die mit seltenen Erkrankungen in Verbindung gebracht werden, liegen in repetitiven Regionen. Für die Short-Read-Sequenzierung stellt das korrekte Mapping in diesen Bereichen eine Herausforderung dar, wodurch viele Varianten nicht detektiert werden. 4 Da sich die sequenzierten Reads nicht mehr eindeutig einer genomischen Position zuordnen lassen, entstehen sogenannte „Short Read Dark Regions“ im Genom. Studien belegen, dass die Long-Read-Sequenzierung die Analyse dieser bislang schwer zugänglichen Regionen ermöglicht, da herausfordernde Bereiche teilweise oder sogar vollständig überspannt werden. 12
Des Weiteren ermöglicht diese Eigenschaft die Auflösung struktureller Varianten, welche häufig seltenen Erkrankungen zugrunde liegen. Insbesondere Kopienanzahlveränderungen wurden in 5–35 % der Fälle als pathogene Varianten bei Mendel-Erkrankungen identifiziert. 11
Neben strukturellen Varianten und repetitiven Sequenzen spielen auch epigenetische Modifikationen (Epimutationen) eine Rolle. Diese verändern nicht die DNA-Sequenz selbst, sondern die Genaktivität. In diesem Zusammenhang wird eine Methylierung des 5. Kohlenstoffs von Cytosin (5-Methylcytosin, 5mC) in CpG-Dinukleotiden besonders häufig erwähnt. 7 Die PacBio-Sequenzierplattform erfasst diese Modifikation automatisch während eines Sequenzierlaufes und liefert dadurch wichtige Informationen zu beispielsweise Imprinting-Störungen. Diese entstehen durch Fehler in der elternspezifischen epigenetischen Genregulation, etwa infolge uniparenaler Disomien oder Epimutationen.
Um die Forschung in diesem Bereich weiter voranzubringen und dadurch mehr Patienten Zugang zu einer Diagnose zu ermöglichen, haben wir unsere Bioinformatik-Pipeline um einige Tools erweitert. Dies soll die Analyse neuer diagnostisch relevanter Gene unterstützen.
Wenn Sie Ihre Forschung zu seltenen Erkrankungen mit unserer HiFi Whole Genome Sequenzierung auf die nächste Stufe bringen wollen, nehmen Sie gerne Kontakt mit uns auf. Wir freuen uns darauf, Ihr Projekt begleiten zu dürfen.
Literaturverzeichnis
1 Fabian-Morales, G. et al. Resolving the diagnostic odyssey in inherited retinal dystrophies through long-read genome sequencing. medRxiv; 10.1101/2024.08.28.24312668 (2024).
2 Ferreira, C. R. The burden of rare diseases. American journal of medical genetics. Part A 179 (6), 885–892; 10.1002/ajmg.a.61124 (2019).
3 Graessner, H.; Zurek, B.; Hoischen, A.; Beltran, S. Solving the unsolved rare diseases in Europe. European journal of human genetics: EJHG 29 (9), 1319–1320; 10.1038/s41431-021-00924-8 (2021).
4 Mandelker, D. et al. Navigating highly homologous genes in a molecular diagnostic setting: a resource for clinical next-generation sequencing. Genetics in medicine: official journal of the American College of Medical Genetics 18 (12), 1282–1289; 10.1038/gim.2016.58 (2016).
5 Nguengang Wakap, S. et al. Estimating cumulative point prevalence of rare diseases: analysis of the Orphanet database. European journal of human genetics: EJHG 28 (2), 165–173; 10.1038/s41431-019-0508-0 (2020).
6 Redfield, S. E. et al. Long-Read Sequencing Increases Diagnostic Yield for Pediatric Sensorineural Hearing Loss. medRxiv; 10.1101/2024.09.30.24314377 (2024).
7 Schübeler, D. Function and information content of DNA methylation. Nature 517 (7534), 321–326; 10.1038/nature14192 (2015).
8 Sernadela, P. et al. Linked Registries: Connecting Rare Diseases Patient Registries through a Semantic Web Layer. BioMed research international 2017, 8327980; 10.1155/2017/8327980 (2017).
9 Steyaert, W. et al. Unravelling undiagnosed rare disease cases by HiFi long-read genome sequencing. medRxiv: the preprint server for health sciences; 10.1101/2024.05.03.24305331 (2024).
10 The Lancet Global Health The landscape for rare diseases in 2024. The Lancet. Global health 12 (3), e341; 10.1016/S2214-109X(24)00056-1 (2024).
11 Truty, R. et al. Prevalence and properties of intragenic copy-number variation in Mendelian disease genes. Genetics in medicine: official journal of the American College of Medical Genetics 21 (1), 114–123; 10.1038/s41436-018-0033-5 (2019).
12 Wenger, A. M. et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nature biotechnology 37 (10), 1155–1162; 10.1038/s41587-019-0217-9 (2019).
