Zum Inhalt springen
Home » Neues KI-Modell entschlüsselt die versteckte Sprache der DNA

Neues KI-Modell entschlüsselt die versteckte Sprache der DNA

DNA enthält die grundlegenden Informationen für das Leben. Zu verstehen, wie diese Informationen gespeichert und organisiert sind, war und ist eine der größten wissenschaftlichen Herausforderungen des letzten Jahrhunderts. Mit GROVER, einem neuen Large Language Model (großen Sprachmodell), das mit menschlicher DNA trainiert wurde, können Forschende nun versuchen, die in unserem Genom verborgenen komplexen Informationen zu entschlüsseln. Entwickelt von einem Team am Biotechnologischen Zentrum (BIOTEC) der Technischen Universität Dresden, behandelt GROVER menschliche DNA wie Sprache und lernt seine Regeln und Zusammenhänge, um funktionale Informationen über die DNA-Sequenzen abzuleiten. Dieses neue Werkzeug, veröffentlicht in „Nature Machine Intelligence“, hat das Potenzial, die Genomik zu revolutionieren und die personalisierte Medizin voranzutreiben.

Seit der Entdeckung der Doppelhelix suchen Forschende nach dem in der DNA verschlüsselten Wissen. 70 Jahre später ist klar, dass die in der DNA verborgenen Informationen vielschichtig sind. Nur 1-2 Prozent des Genoms bestehen aus Genen, den Sequenzen, die für Proteine codieren.

„DNA hat viele Funktionen, die über die Proteincodierung hinausgehen. Einige Sequenzen regulieren Gene, andere dienen strukturellen Zwecken, die meisten Sequenzen erfüllen mehrere Funktionen gleichzeitig. Derzeit verstehen wir die Bedeutung des größten Teils der DNA nicht. Für die Bereiche außerhalb von Genen scheinen wir erst an der Oberfläche gekratzt zu haben. Hier können KI und Large Language Models helfen“, sagt Dr. Anna Poetsch, Forschungsgruppenleiterin am BIOTEC.

Das Team zeigte, dass GROVER nicht nur die folgenden DNA-Sequenzen präzise vorhersagen kann, sondern auch verwendet werden kann, um Informationen biologischer Bedeutung aus Kontext zu extrahieren. So kann man z.B. den Start von Genen identifizieren oder Proteinbindungsstellen auf der DNA. GROVER lernt auch Prozesse, die allgemein als „epigenetisch“ gelten, also solche, die auf der DNA stattfinden und bisher nicht als „kodiert“ betrachtet werden.


Original Paper