3x schwarzer Kater hat geschrieben:(28 Apr 2020, 14:25)
korrekt, ich würde es fast schon als unseriös bezeichnen. Dass man den das geschätzte r dann einfach mal rundet (natürlich nach oben) zeigt ja schon, dass man es nicht wirklich genau berechnen kann. Wie auch bei dem zu Grunde liegenden Datenmaterial. Seriös wäre es (Nicman hat das ja hier schon mal angemerkt) ein Intervall zu nennen in dem sich r unter Annahme eines bestimmten Konfidenzniveaus befindet. Nur befürchte ich, dass das niemand will, weil das Intervall mangels qualitativ guter Datenbasis wohl zu groß wäre, als dass man daraus wirklich eine relevante Aussage treffen könnte.
Dem schließe ich mich an. Problematisch erscheint mir zudem, dass die exakte Berechnung des R, wie das RKI sie vornimmt selbst nach Lektüre des Reports nicht wirklich klar wird. Man kann kann von anderen Veröffentlichungen, wie beispielsweise der von der TU Ilmenau, halten was man will, aber dort wird immerhin die wissenschaftliche Mindestanforderung der intersubjektiven Nachvollziehbarkeit erfüllt. Deren Berechnung kann als Code in der Programmiersprache R sogar öffentlich eingesehen werden.
Das RKI verweist für seine Berechnung auf ein in der Statistik bekanntes Standarderk zum Umgang mit fehlenden Daten (Little und Rubin), ein wissenschaftliches Paper zu (baysianischer) Modellierung eines Coli-Bakterien-Ausbruchs 2011 (Höhle und an der Heiden), einen Aufsatz zum Umgang mit Meldeverzug im Kontext von Epidemien (Lawless), sowie einen Artikel über den Einfluss der angenommenen Generationszeit auf die Schätzung des R. Daraus muss man sich dann als Leser selbst heraussuchen, wie denn nun das genaue Modell aussehen könnte. Wissenschaftlich eher unseriös.
Wirft man dann einen Blick in einen Nowcast-Report des RKI, so stellt man fest, dass im Text sogar ein Konfidenzintervall angegeben wird. Und das Ergebnis bestätigt das, was meine Wenigkeit und Kater hier schon vermutet hatten. Ich zitiere:
.
Das bedeutet: In deren eigener Schätzung für beispielsweise den 9. April überlappt das Konfidenzintervall den gesamten Bereich von R < 1, R = 1 und R >1 - alle drei Varianten sind somit statistisch gleichermaßen plausibel, wenn die zugrundliegenden Modellannahmen plausibel und korrekt sind (und noch nicht mal davon kann man ja wirklich ausgehen).
Mein Dozent hätte das alles wohl als "sophisticated bullshit" bezeichnet. Das RKI tut sich damit momentan wahrlich keinen Gefallen.