Korrelation von Probenqualität und Output bei PacBios HiFi-Sequenzierung

Für PacBios HiFi-Sequenzierungsansatz ist hochmolekulare DNA der Schlüssel für die erfolgreiche Generierung hochpräziser Long-Reads, die auch als HiFi-Reads bekannt sind. Die Qualität der DNA beeinflusst nicht nur die Länge der DNA-Moleküle, sondern auch den gesamten Output der HiFi-Sequenzierung.

Die DNA ist allerdings anfällig für verschiedene Arten von Schädigungen, die zum Beispiel durch

  • zahlreiche unnötige Frost-Tau-Zyklen,
  • übermäßiges Pipettieren,
  • hohe Temperaturen, extreme pH-Werte, interkalierende fluoreszierende Farbstoffe, ultraviolette Strahlung oder
  • Abbau der DNA aufgrund von Formalin-Fixierung und Lagerung in FFPE-Proben

zu DNA mit geringer Qualität führen können. Zusätzlich können Kontaminationen mit einzelsträngiger DNA, RNA, Proteinen, Farbstoffen oder Salzen die DNA-Qualität und das Gesamtergebnis der Sequenzierung beeinflussen. Während der Vorbereitung der PacBio Library werden Haarnadel-Adapter („hairpin adapters“) an beide Seiten der DNA-Fragmente gebunden, um so eine zirkuläre Vorlage für die Polymerase zu schaffen.

Nach der Vorbereitung der Library und der Bindung der Polymerase werden die Libraries für die Sequenzierung auf die PacBio SMRT Cell geladen. Jede SMRT Cell besteht aus einer vordefinierten Anzahl an winzigen Vertiefungen, die „Zero-Mode Waveguides“ (ZMWs) genannt werden. In diesen ZMWs werden einzelne Library-Molekül gebunden und der Baseneinbau durch die Polymerase wird in Echtzeit gemessen und aufgenommen. Das Ziel ist es, die SMRT Cell so zu beladen, dass in jedem ZMW ein einzelnes DNA-Library-Molekül gebunden ist. Während der Sequenzierung wird die zirkuläre DNA in sich wiederholenden Durchläufen sequenziert. Nach dem Sequenzierprozess werden die Adapter-Sequenzen von den fortlaufenden Polymerase-Reads entfernt und eine Konsensus-Sequenz wird auf Grundlage aller Sub-Reads erstellt. Diese Konsensus-Reads werden dann hinsichtlich ihrer Qualität gefiltert, wodurch nur noch hochpräzise HiFi-Reads übrigbleiben. Folglich wird aus jedem besetzten ZMW ein HiFi-Read, vorausgesetzt es besteht die Qualitätsprüfung.

Auf einen Blick

  • DNA mit geringer Qualität ist oft stärker fragmentiert, was zu kürzeren DNA-Fragmenten führt.
  • Verunreinigungen und Kontaminationen können die Bindung des DNA-Polymerase-Komplexes vermindern oder sogar verhindern.
  • Die durchschnittliche DNA-Länge und die SMRT Cell-Beladung korrelieren mit dem Output
  • Gutes Startmaterial und hochmolekualre DNA sind unerlässlich für ausreichend Output und qualitativ hochwertige Ergebnisse.

Da die Anzahl der ZMWs auf einer SMRT Cell vordefiniert ist, korreliert der generierte Output direkt mit der Länge der DNA-Moleküle in der Library und der Beladung der SMRT Cell. Beide Parameter (durchschnittliche DNA-Länge und SMRT Cell-Beladung) werden durch die DNA-Qualität beeinflusst, da DNA mit geringer Qualität häufig eine höhere Fragmentierung aufweist und Verunreinigungen enthalten kann, die das Binden des DNA-Polymerase-Komplexes an die SMRT Cell entweder vermindern oder sogar verhindern können. Um diesen Zusammenhang zu verdeutlichen, zeigt Abbildung 1 eine vereinfachte Version des PacBio Sequenzierprozesses. In diesem Beispiel nehmen wir an, dass die SMRT Cell insgesamt 5 ZMWs hat und die linke Probe DNA mit geringer Qualität (fragmentiert und Verunreinigungen enthaltend) besitzt, während die rechte Probe hochmolekulare DNA enthält. Die Verunreinigungen in der Probe mit geringer DNA-Qualität können zu reduzierter Bindung in den ZMWs führen. In unserem Beispiel werden dadurch nur 2 der 5 ZMWs beladen, während bei der qualitativ hochwertigen Probe 4 der 5 ZMWs beladen werden. Bitte beachten Sie, dass die SMRT Cells im PacBio-Workflow in der Regel nie vollständig beladen werden können . Zusätzlich nehmen wir an, dass die DNA der Probe mit geringer DNA-Qualität durch Fragmentierung kürzere DNA-Moleküle besitzt (8 bp) im Vergleich zur Probe mit hochmolekularer DNA (16 bp). Da aus jedem beladenen ZMW in der Theorie ein HiFi-Read entsteht, wird der gesamte Output der SMRT Cell durch die Multiplikation der Anzahl der beladenen ZMWs (= HiFi -Reads) mit der durchschnittlichen Länge der DNA-Moleküle berechnet. Daraus ergibt sich für die Probe mit geringer DNA-Qualität ein Output von 8 bp x 2 beladene ZMWs = 16 bp. Im Gegensatz dazu hat die Probe mit der hochmolekularen DNA einen Output von 16 bp x 4 beladene ZMWs = 64 bp.

Natürlich ist dies ein fiktives Beispiel, aber es hebt die Wichtigkeit und den Einfluss des Startmaterials auf den Output hervor: schlechtes Startmaterial mit geringer DNA-Qualität führt zu kürzeren HiFi-Reads und weniger Output. Daher ist es essenziell, das Startmaterial mit einzubeziehen, wenn der Output in Gigabasen eingeschätzt werden soll. Die Anzahl der HiFi-Reads könnte hier eine verlässlichere Einschätzung geben. Gutes Startmaterial und hochmolekulare DNA sind unerlässlich für die Erstellung langer Libraries, für Sequenziererfolge und für qualitativ hochwertige Ergebnisse. Daher haben wir für Sie Flyer mit Tipps zur DNA-Extraktion und Vorbereitung der DNA für PacBios HiFi-Sequenzierung erstellt.

Einfluss des Startmaterials auf den Output

Abbildung 1 | Einfluss des Startmaterials auf den Output. Proben mit geringer DNA-Qualität können zu kürzeren DNA-Fragmenten und damit zu kürzeren Sequenzierlibraries führen. Zusätzlich können Verunreinigungen in Proben mit geringer DNA-Qualität eine reduzierte Binungseffizienz in den ZMWs begünstigen. Folglich werden im Vergleich zu Proben mit hochmolekularer DNA weniger und kürzere HiFi-Reads während des Sequenzierprozesses erzeugt, was letztendlich zu einem reduzierten Output führt.