Los bericht bekijken
Oud 16 juli 2020, 16:41   #9
TheFourHorsemen
Secretaris-Generaal VN
 
TheFourHorsemen's schermafbeelding
 
Geregistreerd: 21 januari 2014
Locatie: Antwerpen, De Verenigde Nederlanden
Berichten: 23.766
Standaard

Citaat:
Oorspronkelijk geplaatst door patrickve Bekijk bericht
Kijk, op een cijfer van ongeveer honderd zit een statistische fout van 30. Maw, meet je 100, dan is dat een indicatie voor de "gemiddelde waarde" die tussen 70 en 130 zit. Aan die statistische fluctuaties is niks te doen.

Maw, heb je een dag 70 en de volgende 130, dan is dat alletwee statistisch nog verenigbaar met "geen enkele tendens".

Het statistisch betrouwbaarheidsinterval met 99% zit namelijk tussen plus en min 3 keer de vierkantswortel van het aantal dat je geteld hebt. Vierkantswortel van 100 is 10, drie keer 10 is 30. Dus 100 +/- 30.

Vandaar dat zo een cijfers enkel maar "tendenzen" aangeven als je stijgingen of dalingen met meer dan 50% hebt, de rest is gewoon statistisch niet significant.

Maar hier hebben we het enkel over de STATISTISCHE fout, niet over systematische fouten ten aanzien van wat we willen weten (de echte verandering van gemiddelde besmettingen). Daar zit een fout op van bijna een factor 10.

Als we ons beperken tot statistische fouten, en we middelen uit over 7 dagen (wat ook alle systematische wekelijkse variaties opheft), dan zitten we rond de 700 met dus een fout van 25 * 3 = 75.

Dus op de wekelijkse gemiddelden zit een statistische fout van ongeveer 10 op 100. Alles wat meer dan 10 afwijkt van een week naar de andere is inderdaad statistisch significant. Wat niks zegt over de systematische fouten.

Als dusdanig is het idioot van terug dagelijkse cijfers te communiceren, zonder daar de foutenmarges bij te citeren: men had die stijging dus NIET kunnen zien op dagelijkse cijfers.
Hoe kom je aan die fout van 30?
TheFourHorsemen is offline   Met citaat antwoorden