Als je over veel data beschikt, dan wil je die ordenen. Hier zie je een frequentietabel van de inhoud van `400` jampotten. De ruwe data zijn geordend in gewichtsklassen en bij elke klasse zijn de frequentie en de relatieve frequentie berekend. Dat geeft een duidelijk beeld van de verdeling van de gewichten bij de productie van deze potten jam.
Maar het kan duidelijker. Je kunt zo'n frequentieverdeling samenvatten met behulp van centrummaten zoals: het gemiddelde `451,25` mL, de modus (hier modale klasse) `450 - lt 455` of de mediaan (zit in de klasse `450 - lt 455`).
Maar dan wil je ook wel iets weten over de spreiding van de data. Enkele spreidingsmaten zijn: de spreidingsbreedte `470 - 440 = 30` mL, de standaardafwijking `~~ 4,6` mL.
De standaardafwijking bereken je zo: kwadrateer de verschillen van de middens van elke klasse en het gemiddelde en tel ze op, rekening houdend met de frequentie. Deel dit door het aantal waarden en trek de wortel uit de uitkomst.
En er zijn meer spreidingsmaten, die te maken hebben met de verschillende soorten data.
De echte start van de mathematische statistiek is toe te schrijven aan Francis Galton (1822 - 1911), een neef van Charles Darwin, de bioloog die de evolutietheorie opzette. Hij paste statistische methoden toe bij de analyse van sociale gegevens en erfelijke eigenschappen. Hij dacht dat de normale verdeling de mate van variatie van fysieke eigenschappen aangaf. Hij werkte met de standaardafwijking als maat voor de spreiding van de normale verdeling.
Met name in de 20e eeuw werden de statistische methoden verder ontwikkeld. De inductieve statistiek geeft methoden om uitspraken over de populatie als geheel te doen. Bekende methoden zijn hypothesen toetsen, schattingsmethoden, correlatie en regressie.
Kernwoorden op deze pagina: