Nach der kürzlich erfolgten offiziellen Markteinführung des neuen CycloneSEQ™ von BGI liegen nun die ersten unabhängig geprüften Benchmarking-Daten vor. Die CycloneSEQ™-Plattform liefert mithilfe einer neuartigen Nanopore-Technologie Long-Reads. Diese Studie testet die Leistung einer neuen Plattform bei der Sequenzierung verschiedener mikrobieller Genome und präsentiert sowohl die Rohdaten als auch die verarbeiteten Daten, um anderen die Möglichkeit zu geben, die Arbeit zu prüfen und zu verifizieren. Um weitere Transparenz zu schaffen, sind auch die Peer-Reviews, Skripte und Protokolle dieses Benchmarking-Prozesses enthalten, so dass andere diese neue Technologie direkt bewerten können. Durch das direkte Lesen von DNA-Molekülen ohne Fragmentierung zeigt die Analyse, dass CycloneSEQ Long-Read-Daten mit beeindruckender Länge und Genauigkeit liefert und damit Lücken schließt, die Short-Read-Technologien allein nicht überbrücken können. Diese Arbeit wurde in der Open-Science-Zeitschrift GigaByte. veröffentlicht.
Die Herausforderung: Die Lücken in Millionen bakterieller Genome füllen
Während die seit langem etablierte Short-Read-Sequenzierungstechnologie weiterhin kosteneffizient und genau ist, gibt es nach wie vor Schwierigkeiten, vollständige, zirkuläre Bakteriengenome zusammenzustellen – was zu kritischen Lücken in unserem Verständnis der mikrobiellen Funktionen führt. Die Forscher von BGI-Research haben CycloneSEQ-Longreads mit DNBSEQ™-Shortreads kombiniert und so geschlossene, zirkuläre Genome mit hoher Genauigkeit für gängige Darmbakterien erhalten.

Als Standard-Validierungsansatz sequenzierten die Forscher den bakteriellen Referenzstamm Akkermansia muciniphila ATCC BAA-835 und erhielten 12,07 Gbp an Long-Reads mit einer durchschnittlichen Länge von 11,6 kbp. Die hybride Assemblierungsmethode übertraf sowohl die Short- als auch die Long-Read-Methode und stellte erfolgreich ein vollständiges Genom von ATCC BAA-835 mit einer Mismatch-Rate von weniger als 0,0001 % zusammen. Anschließend sequenzierten die Forscher 10 häufige Stämme, die aus dem menschlichen Darm isoliert worden waren, und schlossen erfolgreich alle 10 bakteriellen Genome sowie winzige Phagen-/Plasmidkreise, die typischerweise von Short-Reads allein übersehen werden. Mit Hilfe von Long-Read-Only-Assemblies gelang es ihnen, vollständige, zirkuläre Genome für 8 von 10 Stämmen zu erstellen, wohingegen mit der vorherigen Generation von Short-Read-Only-Assemblies kein einziges vollständiges Genom erzeugt werden konnte. Die Forscher stellten außerdem fest, dass das Problem nicht in der Unfähigkeit der Short-Read-Sequenzierung lag, relevante Regionen zu erkennen, sondern vielmehr in den inhärenten Einschränkungen der Short-Read-Assemblierung, die typischerweise durch das Vorhandensein repetitiver Regionen und einen hohen GC-Gehalt in diesen Genomen verursacht werden.
Die Technologie wurde auch mit komplexen mikrobiellen Gemeinschaften getestet. In einer synthetischen Darmgemeinschaft mit 21 Stämmen (18 Bakterien, 2 Pilze, 1 Archäon) übertraf die hybride Assemblierung mit CycloneSEQ + DNBSEQ einige andere Einzelmethoden und lieferte 5 vollständige Metagenom-assemblierte Genome (MAGs) – was mit Short- oder Long-Read-Assemblierungen allein nicht erreicht wurde.
Die Long-Reads von CycloneSEQ liefern derzeit eine ausreichende Länge und Qualität für die zirkuläre Genomassemblierung, aber die Verwendung von Short-Reads bleibt für die Verbesserung der Genauigkeit unerlässlich. Die künftige Arbeit der Forscher zielt darauf ab, nicht-synthetische Proben zu bewerten und zu verwenden und das Gleichgewicht zwischen Short-Read- und Long-Read-Daten fein abzustimmen, um noch schnellere und hochwertigere Assemblierungen zu ermöglichen.
