Unstatistik des Monats: Microsofts Suchmaschine erhöht die Überlebensrate bei Bauchspeicheldrüsenkrebs
Die Unstatistik des Monats Juni 2016 ist die Meldung, dass Microsoft-Wissenschaftler mittels der Suchmaschine „Bing“ Bauchspeicheldrüsenkrebs erkennen können und dies Leben rettet.
Diese Früherkennung kann „die 5-Jahres-Überlebensrate der Patienten von 3 Prozent auf 5 bis 7 Prozent erhöhen“, schreibt die New York Times. Die Microsoft-Wissenschaftler (Journal of Oncology Practice) hatten die Suchanfragen von 6,4 Millionen Nutzern nach Symptomen wie unerklärlichem Gewichtsverlust und nach Risikofaktoren wie Alkoholabhängigkeit durchsucht. Aus dem Muster der Anfragen versuchte man dann jene Nutzer vorherzusagen, die später anscheinend Krebs bekamen, was man aus Anfragen wie „Warum bekam ich Bauchspeicheldrüsenkrebs?“ erschloss. Die Süddeutsche Zeitung berichtete in ihrer Online-Ausgabe am 9. Juni unter dem Titel „Krebsdiagnose aus der Suchmaschine“: „In 5 bis 15 Prozent der Fälle gelang ihnen die Früherkennung. Beeindruckender ist die sehr niedrige Zahl von Fehlalarmen. Von 10.000 Nutzern wurde weniger als einer fälschlicherweise als krebskrank eingestuft.“
Die Menschen wurden – wie inzwischen üblich – nicht gefragt, ob ihre persönlichen Daten analysiert werden dürfen. Aber was soll’s, wenn sich die Überlebensrate verdoppelt? Schließlich ist gezeigt worden, dass Bing Leben rettet. Wirklich?
Nein. Denn ein Anstieg von 5-Jahres-Überlebensraten sagt nichts darüber aus, ob Früherkennung Leben rettet. Das ist nicht schwer zu verstehen. Denken Sie an 100 Menschen, die alle im Alter von 70 Jahren an invasivem Krebs sterben. Wenn diese nicht zum Screening gehen, dann wird der Krebs spät entdeckt und die 5-Jahres-Überlebensrate ist klein. Gehen sie zum Screening, wird der Krebs früher entdeckt und die 5-Jahres-Überlebensrate steigt an. In diesem Beispiel lebt also niemand länger, sondern nur länger mit der Diagnose. Studien zeigen entsprechend, dass höhere Überlebensraten nach einem Screening nicht mit niedrigerer Sterblichkeit einhergehen. Der Trick mit den Überlebensraten ist nicht neu. In der Unstatistik vom Oktober 2014 haben wir gezeigt, wie man Frauen damit über den Nutzen des Brustkrebs-Screenings hinters Licht führt. Jetzt versucht man uns damit vom Nutzen von Big Data zu überzeugen.
Aber was ist mit der von den Medien hervorgehobenen kleinen Falsch-Positiv-Rate von 1 in 10.000? Heißt das, dass unter den Nutzern, welche der Algorithmus als positiv einschätzt, Fehler so gut wie nie vorkommen? Nein. Auch das kann man einfach erklären. Nehmen wir 100.000 Nutzer von denen 10 unerkannt Bauchspeicheldrüsenkrebs haben. Bei einer Erkennungsrate von 10 Prozent (das Mittel aus 5 und 15 Prozent) erwarten wir, dass von diesen 10 nur einer als positiv klassifiziert wird, die anderen 9 Krebse werden übersehen. Von den 99.990 Nutzern, die keinen Krebs haben, erwarten wir, dass 10 dennoch positiv eingeschätzt werden (die Falsch-Positiv-Rate von 1 in 10.000). Das heißt, von den insgesamt 11 Personen mit positivem Ergebnis hat einer Bauchspeicheldrüsenkrebs und 10 haben keinen. Die meisten, die positiv getestet werden, werden also fälschlicherweise als krebskrank eingestuft. Also, selbst wenn die Falsch-Positiv-Rate klein ist, kann bei seltenen Erkrankungen wie dem Bauchspeicheldrüsenkrebs der Anteil der Falsch-Positiven an allen Positiven dennoch hoch sein.
Erinnern Sie sich noch an Google Flu Trends? Dieses Programm sollte, ganz ähnlich wie Bing, aufgrund von Suchanfragen die Verbreitung von Influenza vorhersagen. Es wurde 2009 mit Fanfare als Paradebeispiel für den Erfolg von Big Data verkündet. Inzwischen hat man es ohne Fanfare beerdigt, nachdem es über Jahre hinweg zu hohe Vorhersagen lieferte. Ob Dr. Google oder Dr. Bing: Big Data ist in erster Linie Big Business und nicht notwendigerweise bessere medizinische Versorgung.