KI erklärt Ergebnisse des ersten Cosmos-Krebs-Follow-ups (Forschung)

H. Lamarr @, München, Donnerstag, 12.09.2024, 00:41 (vor 72 Tagen) @ H. Lamarr

Ergebnisse: 264'574 Teilnehmer haben 1'836'479 Personenjahre angesammelt. Während einer medianen Nachbeobachtungszeit von 7,12 Jahren wurden 149 Gliome, 89 Meningiome und 29 Fälle von Akustikusneurinomen diagnostiziert. Die bereinigte HR pro 100 regressionskalibrierte kumulative Stunden Mobiltelefonierdauer betrug 1,00 (95.% CI 0,98-1,02) für Gliome, 1,01 (95.% CI 0,96-1,06) für Meningeome und 1,02 (95.% CI 0,99-1,06) für Akustikusneurinome. Für Gliome betrug die HR für mehr als 1908 regressionskalibrierte kumulative Stunden (90. Perzentil-Cut-Point) 1,07 (95 % CI 0,62-1,86). Mehr als 15 Jahre Mobiltelefonnutzung war nicht mit einem erhöhten Tumorrisiko verbunden; für Gliome lag die HR bei 0,97 (95.% CI 0,62-1,52).[/i]

Für Laien sind Studienergebnisse wie die oben zitierten böhmische Dörfer. Gilt das auch für KI? Um das herauszufinden, habe ich mit "Copilot" (KI von Microsoft), kürzlich eine kleine Unterhaltung geführt:

Was besagt bei Studien das Konfidenzintervall CI? Bitte anhand eines Beispiels erklären.

Copilot: Das Konfidenzintervall (CI) ist ein statistisches Maß, das den Bereich angibt, in dem ein unbekannter Parameter (z.B. der Mittelwert einer Population) mit einer bestimmten Wahrscheinlichkeit liegt. Es gibt also an, wie genau eine Schätzung ist und wie viel Unsicherheit mit dieser Schätzung verbunden ist.

Ein Beispiel: Angenommen, wir möchten den durchschnittlichen Blutdruck einer bestimmten Bevölkerungsgruppe messen. Wir nehmen eine Stichprobe und berechnen den durchschnittlichen Blutdruck dieser Stichprobe. Der berechnete Durchschnitt ist jedoch nur eine Schätzung des tatsächlichen Durchschnitts der gesamten Population.

Nehmen wir an, der durchschnittliche Blutdruck in unserer Stichprobe beträgt 120 mmHg und das 95%-Konfidenzintervall beträgt 115 bis 125 mmHg. Das bedeutet, dass wir zu 95% sicher sind, dass der tatsächliche durchschnittliche Blutdruck der gesamten Population zwischen 115 und 125 mmHg liegt.

Das Konfidenzintervall hilft also dabei, die Präzision unserer Schätzung zu verstehen und gibt uns einen Bereich, in dem der wahre Wert mit hoher Wahrscheinlichkeit liegt. Es ist ein nützliches Werkzeug, um die Unsicherheit in statistischen Schätzungen zu quantifizieren.

Und welche Rolle spielt dabei das Hazard-Ratio HR?

Das Hazard-Ratio (HR) ist ein Maß, das häufig in Überlebensanalysen verwendet wird, um das relative Risiko eines Ereignisses (z.B. Tod, Krankheitsrückfall) zwischen zwei Gruppen zu vergleichen. Es gibt an, wie viel wahrscheinlicher ein Ereignis in einer Gruppe im Vergleich zu einer anderen Gruppe zu einem bestimmten Zeitpunkt auftritt.

Ein Beispiel: Angenommen, wir haben eine klinische Studie, die die Wirksamkeit eines neuen Medikaments zur Behandlung von Krebs untersucht. Die Patienten werden in zwei Gruppen eingeteilt: eine Gruppe erhält das neue Medikament und die andere Gruppe erhält ein Placebo. Das Hazard-Ratio wird berechnet, um zu bestimmen, wie viel wahrscheinlicher es ist, dass Patienten in der Medikamentengruppe im Vergleich zur Placebogruppe ein bestimmtes Ereignis (z.B. Überleben) erleben.

Wenn das Hazard-Ratio 0,5 beträgt, bedeutet dies, dass das Risiko des Ereignisses in der Medikamentengruppe halb so groß ist wie in der Placebogruppe. Ein Hazard-Ratio von 1 bedeutet, dass das Risiko in beiden Gruppen gleich ist, und ein Hazard-Ratio von 2 bedeutet, dass das Risiko in der Medikamentengruppe doppelt so hoch ist wie in der Placebogruppe.

Das Hazard-Ratio ist besonders nützlich, weil es die Zeit bis zum Eintreten des Ereignisses berücksichtigt und somit eine dynamischere Analyse ermöglicht als einfache Risikoverhältnisse.

Ein HR von 0,5 wäre in deinem Beispiel also ein Hinweis, dass das neue Krebsmedikament die Leute mehr umbringt, statt sie zu heilen?

Ein Hazard-Ratio (HR) von 0,5 bedeutet tatsächlich das Gegenteil. Es zeigt an, dass das Risiko des Ereignisses (z.B. Tod) in der Medikamentengruppe halb so groß ist wie in der Placebogruppe. Das bedeutet, dass das neue Krebsmedikament in diesem Beispiel das Risiko des Todes um 50% reduziert im Vergleich zur Placebogruppe.

Ein HR von 0,5 wäre also ein Hinweis darauf, dass das Medikament wirksam ist und die Überlebenschancen der Patienten verbessert.

Moment mal, du hast doch das erlebte Ereignis mit dem Überleben gekoppelt, nicht mit dem Tod!

Du hast recht, das war missverständlich formuliert. Danke für den Hinweis!

Lass mich das klarstellen: Das Hazard-Ratio (HR) bezieht sich auf das relative Risiko eines bestimmten Ereignisses. In meinem Beispiel hätte ich präziser sein sollen. Wenn wir das Ereignis als “Tod” definieren, dann bedeutet ein HR von 0,5, dass das Risiko des Todes in der Medikamentengruppe halb so groß ist wie in der Placebogruppe. Das heißt, das Medikament reduziert das Risiko des Todes um 50%.

Wenn das Ereignis hingegen “Überleben” wäre, würde ein HR von 0,5 bedeuten, dass die Wahrscheinlichkeit zu überleben in der Medikamentengruppe halb so groß ist wie in der Placebogruppe, was natürlich negativ wäre.

Ich hoffe, das klärt die Verwirrung!

Okay. Und nun interpretiere mir doch zur Krönung folgendes Studienergebnis: "Die bereinigte HR pro 100 regressionskalibrierte kumulative Stunden Mobiltelefonierdauer betrug 1,00 (95.% CI 0,98-1,02) für Gliome, 1,01 (95.% CI 0,96-1,06) für Meningeome und 1,02 (95.% CI 0,99-1,06) für Akustikusneurinome."

Gerne! Schauen wir uns die angegebenen Hazard-Ratios (HR) und Konfidenzintervalle (CI) genauer an:

Gliome: Die bereinigte HR pro 100 regressionskalibrierte kumulative Stunden Mobiltelefonierdauer beträgt 1,00 (95% CI 0,98-1,02).

Interpretation: Eine HR von 1,00 bedeutet, dass es keinen Unterschied im Risiko gibt, Gliome zu entwickeln, unabhängig von der Mobiltelefonierdauer. Das Konfidenzintervall von 0,98 bis 1,02 zeigt, dass das tatsächliche Risiko mit 95%iger Wahrscheinlichkeit in diesem Bereich liegt. Da das Konfidenzintervall 1 einschließt, gibt es keinen statistisch signifikanten Zusammenhang zwischen Mobiltelefonierdauer und dem Risiko, Gliome zu entwickeln.

Meningeome: Die bereinigte HR pro 100 regressionskalibrierte kumulative Stunden Mobiltelefonierdauer beträgt 1,01 (95% CI 0,96-1,06).

Interpretation: Eine HR von 1,01 deutet darauf hin, dass das Risiko, Meningeome zu entwickeln, minimal erhöht ist, aber praktisch keinen Unterschied macht. Das Konfidenzintervall von 0,96 bis 1,06 zeigt, dass das tatsächliche Risiko mit 95%iger Wahrscheinlichkeit in diesem Bereich liegt. Da das Konfidenzintervall 1 einschließt, gibt es keinen statistisch signifikanten Zusammenhang zwischen Mobiltelefonierdauer und dem Risiko, Meningeome zu entwickeln.

Akustikusneurinome: Die bereinigte HR pro 100 regressionskalibrierte kumulative Stunden Mobiltelefonierdauer beträgt 1,02 (95% CI 0,99-1,06).

Interpretation: Eine HR von 1,02 deutet darauf hin, dass das Risiko, Akustikusneurinome zu entwickeln, leicht erhöht ist, aber praktisch keinen Unterschied macht. Das Konfidenzintervall von 0,99 bis 1,06 zeigt, dass das tatsächliche Risiko mit 95%iger Wahrscheinlichkeit in diesem Bereich liegt. Da das Konfidenzintervall 1 einschließt, gibt es keinen statistisch signifikanten Zusammenhang zwischen Mobiltelefonierdauer und dem Risiko, Akustikusneurinome zu entwickeln.

Zusammengefasst zeigen die angegebenen HR-Werte und Konfidenzintervalle, dass es keinen statistisch signifikanten Zusammenhang zwischen der kumulativen Mobiltelefonierdauer und dem Risiko gibt, Gliome, Meningeome oder Akustikusneurinome zu entwickeln.

Mein Fazit: Von dem offensichtlichen Ausrutscher beim Hazard-Ratio einmal abgesehen, finde ich die Interpretationen der KI für Laien ziemlich aufschlussreich. Unsicher bin ich allerdings, ob ihre Behauptung stimmt, bei Gliomen gäbe es "unabhängig von der Mobiltelefonierdauer" keinen Risikoanstieg. Hat man keinen Wissenschaftler von Fach zur Hand, den man zu jeder Tages- und Nachtzeit mit Fragen terrorisieren kann, ist "Copilot" (in der Betriebsart: Im höheren Maße Genau) aus meiner Sicht ein brauchbarer Ansprechpartner, um schnell Auskünfte zu bekommen. Wie die Unterhaltung oben zeigt, ist Argwohn gegenüber den Auskünften freilich nach wie vor angebracht.

Richtig gefährlich wird es mMn, wenn selbsternannte Experten der Versuchung nicht widerstehen können, im stillen Kämmerlein eingeholte Auskünfte einer KI als Eigenleistung vor Publikum zu verbreiten, um sich mit minimalem Aufwand den Status einer wissenschaftlichen Autorität zu ergaunern. Das hat etwas mit Anstand zu tun und mit dem Risiko, unerkannt digitalisierten Stuss zu verbreiten. Im IZgMF-Forum verpflichten deshalb die Forumregeln seit 3. Juni 2024 jeden Teilnehmer dazu, zumindest substanzielle Auskünfte einer KI als solche kenntlich zu machen.

--
Jedes komplexe Problem hat eine Lösung, die einfach, naheliegend, plausibel – und falsch ist.
– Frei nach Henry Louis Mencken (1880–1956) –


gesamter Thread:

 RSS-Feed dieser Diskussion

powered by my little forum