Loading [MathJax]/extensions/asciimath2jax.js

Statistiek met Google Sheets: Data presenteren

In Google Sheets kun je mooi statistieken zichtbaar maken. Daarmee kun je verschillen tussen (deel)groepen mooi in beeld brengen. Verder beschikt Google Sheets over allerlei statistische functies om de statistieken mee samen te vatten. Bij dit practicum hoort het rekenblad

 

GSlogo.jpg Gegevens 154 leerlingen

 

Dat moet je eerst downloaden en via "Opslaan als..." opslaan onder een eigen naam als Stat[..].ods, waarbij [..] je eigen naam is. Het is dan een "Open Document Spreadsheet". Open Google Sheets via sheets.google.com. Kies (na inloggen) vervolgens "Ga naar spreadsheets" en "Lege spreadsheet" en je krijgt een lege spreadsheet waarin je via "Bestand" en "Openen" de spreadsheet kunt inladen.

 

Het is wel van belang dat je met eenvoudige formules in Google Sheets kunt werken. Als je dat niet beheerst, doe dan eerst van de Basistechnieken het practicum "Tafels".

 

Inhoud:

 

Een frequentietabel maken

Open jouw bestand Stat[...].ods in Google Sheets.
Als het goed is tref je de gegevens van 154 leerlingen in 4 havo aan. Er zijn gegevens van 11 statistische variabelen verzameld. Op het werkblad wordt omschreven wat onder elke variabele wordt verstaan.

 

GSgegevens154leerlingen.jpg

 

Je wilt de lengtes van jongens en meisjes vergelijken om de verschillen tussen beide deelgroepen te kunnen bekijken. Je maakt dan frequentietabellen en histogrammen voor beide groepen afzonderlijk. Maak eerst een nieuw werkblad met alleen de variabelen waarmee je wilt werken. Dat doe je zo:

 

  • Kopieer eerst het werkblad naar een nieuw werkblad door onderaan met de rechter muisknop op de naam van het eerste werkblad te klikken en "Dupliceren" te kiezen.
  • Je hebt een kopie gemaakt van het originele werkblad. Wijzig de naam van dit werkblad in "LengteGewichtJM" door met de rechter muisknop op de naam te klikken en "Naam wijzigen" te kiezen.
  • Vervolgens haal je de kolommen gebjaar, gebmnd, cijfgem, cijfwis, huiswerk, wisgroep, profiel en plezier weg, door deze kolommen in de balk met de letters van de cellen tegelijk te selecteren en met behulp van de rechter muisknop te verwijderen.
    De kolommen gewicht en lengte worden nu D en E. Verwijder ook de uitleg over de betekenis van de variabelen om ruimte te maken voor je gegevensanalyse.

 

Je hebt nu een werkblad om te werken met geslacht, lengte en gewicht.

 

GSsorteren.jpg

  • Sorteer de gegevens zo, dat de jongens bij elkaar staan en de meisjes bij elkaar staan.
    - Selecteer de gegevens in de kolommen C, D, E en F zonder de titels van de kolommen.
    - Kies "Gegevens" en "Bereik sorteren" en "Geavanceerde sorteeropties voor bereik" en kies voor "Kolom C" en "Van Z tot A" en druk op "Sorteren".
  • Ga na dat alle jongens bovenaan staan. Hoe zou je de meisjes bovenaan hebben gekregen?

 

Sla steeds tussentijds je resultaten op!

 

Nu wil je overzichtelijke frequentietabellen en diagrammen maken om te kunnen vergelijken. Daartoe maak je een geschikte klassenindeling, van ongeveer 10 klassen. Google Sheets kan een bijpassende frequentietabel voor je maken. Daarmee wordt het vervelende "turven" overbodig.
Je doet dit eerst voor de variabele lengte. Zo maak je een overzicht van de kleinste en de grootste lengtes.

 

  • Zet in de cellen G2, H2 en I2 achtereenvolgens "lengte", "jongens", "meisjes". En zet in de cellen G3 en G4 "minimum" en "maximum".
  • Zet in cel H3: =MIN(E2:E70) en [ENTER].
    Je kunt dit doen door te beginnen met =MIN( en dan de lengtes van de jongens te selecteren (cellen E2 t/m E70). Dan ) en [ENTER].
  • Zet in de cellen H4, I3 en I4 de andere maximale en minimale lengtes.

 

Je weet nu welke verschillende lengtes er voorkomen. Als het goed is lopen ze vanaf 156 tot en met 200. Daarmee maak je een klassenindeling, bijvoorbeeld 156 t/m 160, 161 t/m 165, etc.

 

  • Zet in G6 het woord "klassen" en voer in cel G7 t/m G16 de klassen 155 t/m 160, 160 t/m 165, etc, in (bedoeld is van 155 tot en met 160, van 160 tot en met 165, etc., dus 160 zit in de klasse 155 t/m 160).
  • Zet in H6 het woord "max" en voer in cel H7 t/m H16 de maximale lengtes van de klasse in. Zet in H7 160 en in H8 165 en selecteer H7 en H8. Sleep met de vulgreep tot je een kolom hebt met lengtes van 160 t/m 205 (205 staat in cel H16).
  • Selecteer de cellen I7 t/m I16 en voer in de functiebalk =FREQUENCY(E2:E70;H7:H15) en doe [Enter]. (Gek genoeg moet je niet H16 als laatste hebben, want dan komt er een 0 in H17 te staan, waarom dat zo is?)
  • Je krijgt dan in kolom I een frequentieverdeling van de lengtes van de jongens. In bijvoorbeeld cel I12 zie je dat er 22 jongens zijn met een lengte vanaf 176 t/m 180 cm.
  • Doe dit zelf ook voor de lengtes van de meisjes in de kolom J. Om de lengtes van beide groepen te kunnen vergelijken is het wel verstandig om dezelfde beginwaarden voor de klassengrenzen en de klassenbreedte te kiezen.
  • Controleer je aantallen door I7 t/m I16 en J7 t/m J16 op te tellen: 69 jongens en 85 meisjes.

 

Je hebt nu nette frequentietabellen voor de lengtes van de 154 leerlingen.
Wil je liever relatieve frequentietabellen?
Je moet dan elke frequentie delen door het totaal en (om procenten te krijgen) vermenigvuldigen met 100.
Sla weer je werkmap op!

 

  • Voer dit alles nog eens uit voor de variabele gewicht, zowel voor de jongens als de meisjes.

 

resource.jpg


Diagrammen om verschillen te zien

Diagrammen kun je maken op het tabblad "Invoegen". Een histogram voor de lengtes van de jongens gaat zo:

 

  • Selecteer de gemaakte frequentietabel voor de jongens (hier: J7 t/m J16) in één keer.
  • Kies Invoegen > Diagram en er wordt automatisch een staafdiagram ("kolomdiagram" volgens Google Sheets) gemaakt.
  • Om bij de horizontale as de klassenindeling te krijgen klik je met de rechter muisknop op het diagram en klik je de drie stipjes rechtsboven aan en kies je "Diagram bewerken". Je krijgt dan een dialoogvenster waarin je bij "X-as" de horizontale aslabels kunt toevoegen. Daarvoor gebruik je de klassen in kolom G. Met het knopje rechts kun je die selecteren en dan komen ze bij de figuur te staan.
  • Eigenlijk moeten bij een histogram de staven tegen elkaar aanzitten. In Google Sheets lijkt dat echter niet te kunnen.

 

 

Als het goed is krijg je als histogram een staafdiagram zoals dat hierboven te zien.
Je hebt natuurlijk wel gezien dat je ook achteraf de grafiek kunt opmaken door met je rechter muisknop de verschillende gedeelten van de grafiek te selecteren. En je kunt ook andere soorten diagrammen maken. Experimenteer maar even. Als je jongens en meisjes op deze manier wilt vergelijken, moet je met relatieve frequenties werken.

 

  • Maak in dit werkblad een lijngram voor de lengteverdeling van de meisjes. Maak alles zo fraai mogelijk en sla het resultaat op.
  • Vergelijk de lengteverdeling van de jongens en de meisjes met behulp van staafdiagrammen van de relatieve frequenties. Maak alles zo fraai mogelijk en sla het resultaat op.
  • Voer alles nog eens uit voor de variabele gewicht, zowel voor de jongens als de meisjes.

 

resource.jpg


De statistische functies

Je kunt eenvoudig alle centrum en spreidingsmaten door Google Sheets laten berekenen. Hieronder zie je hoe je in een zelf gekozen cel de centrum- en de spreidingsmaten van de lengtes van de jongens bepaalt:

 

GSstatfuncties

  • de modus wordt berekend met =MODE(E2:E70)
  • de mediaan wordt berekend met =MEDIAN(E2:E70)
  • het gemiddelde wordt berekend met =AVERAGE(E2:E70)
  • de standaardafwijking wordt berekend met =STDEVP(E2:E70)
  • de kleinste waarneming wordt berekend met =MIN(E2:E70)
  • de grootste waarneming wordt berekend met =MAX(E2:E70)
  • de spreidingsbreedte wordt berekend met =MAX(E2:E70)-MIN(E2:E70)
  • het eerste kwartiel Q1 wordt berekend met =QUARTILE(E2:E70;1)
  • het derde kwartiel Q2 wordt berekend met =QUARTILE(E2:E70;3)
  • de kwartielafstand wordt berekend door de kwartielen van elkaar af te trekken

 

MODE, MEDIAN, e.d. zijn statistische functies in Google Sheets. Je kunt gewoon hun naam na het = teken invoeren in de cel, maar je kunt ze ook vinden via de drie puntjes rechtsboven op de bovenbalk en naar `Sigma` gaan. Dan wordt het dialoogvenster "Functies" ingeschakeld. Kies in het venster dat nu verschijnt "Statistiek" en je vindt de hele lijst met statistische functies. Zoek daarin de juiste functie en klik daarop. Je krijgt nu een venstertje te zien, waarin je kunt invoeren: E2:E70. Dat zijn de cellen waarin de waarnemingen staan. (Je kunt die cellen ook met de muis selecteren.) Kies [Enter] en je vindt de juiste waarde in de gewenste cel.

 

  • Bepaal van de jongens al deze centrummaten en spreidingsmaten.
  • Doe ditzelfde bij de lengtes van de meisjes.
  • Ga na, dat al de berekende statistische maten mee veranderen als je lengtes en/of gewichten in de tabel verandert.

 

Boxplots maken

 

Om de lengtes van jongens en meisjes met elkaar te vergelijken kun je boxplots maken. In Google Sheets heb je eerst een paar gegevens nodig om ze te maken. Je moet de twee kwartielen, het minimum en het maximum van de gegeven waarden bepalen. Dat zet je in een tabel zoals in de figuur.
Omdat Google Sheets geen boxplot optie kent, ga je een kandelaardiagram maken.

 

  • Maak eerst deze tabel naast je gegevens, voor de jongens en de meisjes boven elkaar zoals je hier ziet.
  • Kies "Invoegen" en "Diagram" en selecteer daar het "Kandelaardiagram". Kies bij "Gegevensbereik" de hele tabel die je hebt gemaakt, inclusief de tekstkolom aan het begin en je ziet de boxplots verschijnen.
  • Helaas wordt de mediaan niet weergegeven in de figuur.

 

Je hebt nu twee verticale boxplots naast elkaar. Waarschijnlijk wil je de assen nog aanpassen (waarden van 150 tot 205 zijn op de verticale as wel genoeg).

 

GSboxplot2.jpg

 

Ga na, dat al de berekende statistische maten mee veranderen als je een lengtes en/of gewichten in de tabel verandert. Het uitbreiden van de tabel is ook niet al te moeilijk, je hoeft dan maar een kleine aanpassing in de formules aan te brengen.
Sla je resultaten op!

 

  • Voer dit alles nog eens uit voor de variabele gewicht, zowel voor de jongens als de meisjes. Maak voor dit geval verticale boxplots.

 

resource.jpg


Cumulatieve frequenties

Stel je wilt de frequentietabellen van de lengtes van jongens en meisjes vergelijken met behulp van cumulatieve frequentiepolygonen.

 

  • Je hebt eerder gewerkt in het werkblad "LengteGewichtJM". Dupliceer dit werkblad naar "LengteGewichtJM_2".
  • Maak op dit werkblad voor de jongens een frequentietabel in de cellen I7 t/m I17.
  • Maak in de cellen J7 t/m J17 de somfrequenties (cumulatieve frequenties).
    Zet in J7 =$I7 en zet in J8: =$J7+$I8. Kopieer dit naar beneden t/m J17.
  • Maak in de cellen K7 t/m K17 de relatieve somfrequenties (cumulatieve frequenties).
    Zet in K7 =$J7/$I$18*100 en kopieer dit naar beneden t/m K17.
  • Doe hetzelfde voor de meisjes.
  • Je maakt nu de twee cumulatieve relatieve frequentiepolygonen in één figuur.
    - Selecteer de bovengrenzen in H6 t/m H17 en relatieve somfrequenties in K6 t/m K17 en N6 t/m N17 en kies bij "Invoegen > Diagram" voor "Lijndiagram" met twee gebroken lijnen.
    - Kies "Diagram bewerken" en zet bij "Reeks" de punten op de lijnen aan, kies zelf een dikte. - Zet bijschriften bij de assen, zet primaire en secundaire rasterlijnen en maatstreepjes aan en kies het juiste aantal secundaire rasterlijnen. Pas ook de namen in de legenda aan.

 

Als het goed is krijg je deze figuur:

 

GScumfrequentiepolygoon

 

Stel je wilt verdeling van de wiskundecijfers per profiel (CM, EM, NG en NT) bekijken. Deze vier frequentieverdelingen wil je vergelijken. Maak eerst een nieuw werkblad met de variabelen geslacht, cijfwis en profiel.
In dat werkblad ga je dan zo te werk:

 

  • Sorteer alle gegevens op de variabele profiel.
  • Maak frequentietabellen van cijfwis per profiel. Zet ze om naar relatieve frequenties en maak er histogrammen bij.
  • Maak ook cumulatieve relatieve frequentiepolygonen per profiel.

 

Je hebt nu geleerd om cumulatieve frequentiepolygonen te maken.

 

  • Voer dit alles nog eens uit voor de variabele gewicht, zowel voor de jongens als de meisjes.

 

resource.jpg


Het practicum afsluiten

Gebruik het bestand met gegevens van 154 leerlingen en probeer elk van de volgende vragen te beantwoorden met behulp van tabellen, diagrammen, centrummaten en spreidingsmaten. Bekijk daarbij goed in je wiskundeboek welke tabellen, diagrammen, centrummaten en spreidingsmaten zinvol zijn in de genoemde situaties. Motiveer het gebruik van de juiste diagrammen en maten.

  • Zijn er duidelijke verschillen in gewicht tussen de meisjes en de jongens van deze groep leerlingen? Motiveer je antwoord m.b.v. histogrammen en gemiddelde en spreiding.
  • Zijn er duidelijke verschillen in gewicht tussen de meisjes en de jongens van deze groep leerlingen? Motiveer je antwoord m.b.v. boxplots.
  • Hebben de leerlingen in de N-profielen hogere cijfers in 3 havo gehad dan de leerlingen in de M-profielen? Motiveer je antwoord m.b.v. diagrammen en bijpassende centrummaten en spreidingsmaten.
  • Formuleer zelf een vraag waarin je de verschillen tussen twee deelgroepen aan de orde stelt. Beantwoord je vraag m.b.v. diagrammen en bijpassende centrummaten en spreidingsmaten.

 

resource.jpg


LogoM4Ainf.gif