Aufgrund von hoher Anzahl an Versuchsteilnehmern kann man keine Kausalität ableiten. Alternative Erklärungsversuche kann man sich einfach ausdenken, ist nicht sonderlich schwierig.
Ich habe mir die Studie gerade mal angeschaut. Bei der Beurteilung deren Validität kommt es imho sehrstark darauf an, wie sie auf das Thema "Kaffee" gekommen sind. Erst nach Durchsicht der Daten oder davor schon?
The study protocol was approved by the institutional review boards of Brigham and Women’s Hospital and Harvard School of Public Health.
Fraglich bleibt dennoch, wie sie auf Kaffee gekommen sind und ob sie die Daten schon vorher hatten.
Das Problem ist, in dem Fragebogen wurde zuerst nach 116 Nahrungsmittel und deren Verzehrhäufigkeit gefragt, dann später sogar nach 131. Alleine durch Zufall wird es Nahrungsmittel geben, welche einen statistischen Effekt anzeigen, obwohl in Wahrheit keiner vorhanden ist.
Das Problem ist auch, dass der Großteil der Kaffeetrinker auch raucht. Dies berücksichtigen sie, indem sie einmal zwischen Rauchern und Nicht-Rauchern trennen. Lustigerweise haben die Nichtraucher weit größere Schwankungsbreiten und damit auch Konfidenzintervalle als die Raucher. Wenn man aber wieder über beide mittelt schrumpft die durchschnittliche Schwankungsbreite wieder deutlich, weil es mehr Raucher als Nichtraucher gibt (die Studie fing 1984 an). Es wurde außerdem Rauchen berücksichtigt.
Die pro-Tasse Erhöhung der Sterblichkeitsrate ist bei nur Herausrechnung des Alters in allen 3 Substudien insignifikant. Wenn man zudem nooch das Rauchverhalten rausrechnet, sind 2 der 3 Studien signifikant (und eine von beiden nur sehr knapp). Wenn man alle möglichen Einflussfaktoren rausrechnet (was auch sinnvoll ist), dann ist keine der 3 Einzelstudien mehr signifikant - allerdings das Aggregat dieser 3 Einzelstudien. Könte also auch sowas wie das
Simpson-Paradoxon auf Level der p-Values bei Aggregation sein.
Ich kann mit den Infos im Paper nicht sagen, ob die jetzt einen echten Effekt gefunden haben oder nicht. Für sonderlich stark halte ich die Evidenz für einen Effekt aber nicht.