Die Forscher trainierten zunächst ein Vorhersagemodell anhand der Daten von 6,7 Millionen erwachsenen Dänen aus den Jahren 1995 bis 2014. Der Trainingsdatensatz umfasste mehr als 1.000 verschiedene Vordiagnosen, sowie Krebserkrankungen bei Familienmitgliedern, Alter und – sofern vorhanden – grundlegende Körperdaten und Risikofaktoren wie Tabakkonsum oder Fettleibigkeit.
Anschließend wurde das Modell anhand der Datensätze von 2015 bis 2018 validiert, die 4,7 Millionen Dänen umfassten, und lieferte eine hohe Vorhersagegenauigkeit. Das Modell ermöglicht Vorhersagen über die individuellen Risiken, an 20 verschiedenen Krebsarten zu erkranken. Im Laufe eines Lebens erreichte das Modell eine Genauigkeit von 81 Prozent. Unter Berücksichtigung von Alters- und Geschlechtseffekten betrug die Genauigkeit 59 Prozent. Die höchste Genauigkeit erreichte das Modell bei Krebserkrankungen des Verdauungssystems sowie bei Schilddrüsen-, Nieren- und Gebärmutterkrebs.
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00062-1/fulltext
