Betrouwbare schattingen

#88

Waar gaat het over?

 

Als je een uitspraak wilt doen over een populatie zoals Hoeveel procent van de Nederlandse volwassenen rookt nog?, dan gebruik je steekproeven. Maar een steekproef heel vaak herhalen is meestal te duur. Nu blijkt dat de gemiddelden in een steekproef bij herhalingen ervan met kans `0,95` liggen in een te berekenen 95%-betrouwbaarheidsinterval.

 

Hoe werkt het?

 

Populatieproportie schatten: Als in een steekproef met grootte `n` de proportie `hat(p)` is, dan ligt met 95% betrouwbaarheid de proportie bij eenzelfde steekproef binnen het interval `[hat(p) - 2*sqrt((hat(p)(1 - hat(p)))/(n)), hat(p) + 2*sqrt((hat(p)(1 - hat(p)))/(n))]`, een schatting van de populatieproportie.
Populatiegemiddelde schatten: Als in een steekproef met grootte `n` het gemiddelde `bar(X)` met standaardafwijking `S` is, dan ligt met 95% betrouwbaarheid het gemiddelde bij eenzelfde steekproef binnen het interval `[bar(X) - 2*S/(sqrt(n)), bar(X) + 2*S/(sqrt(n))]`, een schatting van de populatieproportie.

Wie en wanneer?

 

De Poolse wiskundige en statisticus Jerzy Neyman (1894 - 1981) ontwikkelde in de jaren dertig van de 20e eeuw betrouwbaarheids-intervallen als methode voor statistische schattingen. Betrouwbaarheidsintervallen werden echter pas ongeveer vijftig jaar later op grote schaal toegepast buiten het veld, toen medische tijdschriften ervan gebruik maakten.


Kernwoorden op deze pagina:

  • interval
  • proportie
  • steekproef
  • populatie