In het rekenblad OpenOffice Calc kun je mooi statistieken zichtbaar maken. Je kunt OO-Calc ook gebruiken om statistische variabelen te vergelijken en te zoeken naar verbanden ertussen. Bij dit practicum hoort het rekenblad
Gegevens 154 leerlingen
Dat moet je eerst downloaden en via "Opslaan als..." opslaan onder een eigen naam als Stat[..].ods, waarbij [..] je eigen naam is.
Het is wel van belang dat je met diagrammen, centrummaten en spreidingsmaten in OO-Calc kunt werken.Als je dat niet beheerst, doe dan eerst het practicum "Statistisch onderzoek: data presenteren".
Inhoud:
Open jouw bestand Stat[...].ods. Je wilt kijken naar een eventuele relatie tussen de statistische variabelen wisgroep (de gekozen soort wiskunde, A of B) en geslacht (jongen of meisje) met behulp van een kruistabel, in OO-Calc heet dit een draaitabel. In zo'n kruistabel zet je bijvoorbeeld horizontaal de soort wiskunde, dus wisgroep uit en verticaal het geslacht. Je wilt dan zien hoeveel personen van welk geslacht een bepaalde soort wiskunde hebben gekozen.
Maak een kruistabel voor de variabelen cijfwis en profiel op een nieuw werkblad.
Bij kwalitatieve variabelen kun je vaak een `2 xx 2`-kruistabel maken zoals die voor de variabelen "wisgroep" en "geslacht" (zie eerder).
Je zoekt nu naar de verschillen in keuze voor wiskunde A of B tussen beide geslachten. Een maat voor die verschillen is phi - vaak met de Griekse letter `varphi` aangeduid.
Als je kruistabel inderdaad aan cel F3 is gekoppeld, dan kun je `varphi` door Excel laten berekenen: phi =($G$5*$H$6-$H$5*$G$6)/(WORTEL($I$5*$I$6*$G$7*$H$7)). Ga na, dat je dezelfde waarde van `varphi` = phi krijgt.
Opmerking: Als je de formule voor phi niet verplaatst naar een andere cel zijn de dollartjes niet nodig.
Uit deze waarde van `varphi` blijkt dat het verschil gering is volgens de gebruikelijke vuistregels.
Bij de variabelen "cijfwis" en "profiel" kun je geen `2 xx 2`-kruistabel maken. Die kruistabel wordt veel groter.
Als je in dit geval bijvoorbeeld de wiskundecijfers van de leerlingen in het profiel CM wilt vergelijken met die van de leerlingen in het profiel NT, dan zet je de bijbehorende waarden in de kruistabel om in percentages, daar kun je maar beter een nieuwe tabel voor maken. Je berekent dan de bijbehorende cumulatieve percentages en kijkt naar hun verschil: `Vcp` betekent "verschil cumulatieve percentages". Dat kan omdat er in de waarden van "cijfwis" een logische volgorde zit. Op grond van de maximale waarde van `Vcp` trek je met behulp van de gebruikelijke vuistregels een conclusie.
Om de lengtes van jongens en meisjes met elkaar te vergelijken kun je boxplots maken. In OO-Calc heb je eerst een paar gegevens nodig om ze te maken. Je moet de twee kwartielen, het minimum en het maximum van de gegeven waarden en de twee medianen bepalen. Dat laat je OO-Calc in een tabel zetten zoals die je hiernaast ziet. Omdat OO-Calc geen boxplot optie kent, ga je een gestapeld staafdiagram ombouwen tot een boxplot. De box wordt begrensd door de ondergrens Q1 en de bovengrens Q3. Het middelste getal is de mediaan. Het gestapelde staafdiagram bestaat nu uit drie blokken: het eerste blok is vanaf 0 tot "onder" = Q1, het tweede blok loopt van "onder" tot "midden" = Mediaan - Q1 en het derde blok loopt van "midden" tot "boven" = Q3 - Mediaan. De twee "snorharen" ("whiskers") van de boxplot maak je met behulp van foutbalken: fout onder = Q1 - minimum en fout boven = maximum - Q3. Nu ga je als volgt te werk:
Je hebt nu twee verticale boxplots naast elkaar. Waarschijnlijk wil je de assen nog aanpassen (waarden van 150 tot 210 zijn op de horizontale as wel genoeg). En wellicht wil je de boxplots nog van kleuren voorzien. Ga vooral je gang.
Ga na, dat al de berekende statistische maten mee veranderen als je een lengtes en/of gewichten in de tabel verandert. Het uitbreiden van de tabel is ook niet al te moeilijk, je hoeft dan maar een kleine aanpassing in de formules aan te brengen. Sla je resultaten op!
Met name bij kwantitatieve variabelen zijn er nog diverse andere methoden om een verschil tussen twee variabelen in een getal uit te drukken, bijvoorbeeld de "effectgrootte", "de normale verschilverdeling", enz. Deze vallen buiten het bestek van dit practicum.
Je wilt bij de jongens kijken naar een eventueel statistisch verband tussen de variabelen lengte en gewicht met behulp van een spreidingsdiagram. Dat doe je zo:
Je ziet dat OO-Calc standaard de linker kolom op de horizontale as zet, dat zijn hier de gewichten. Maar wellicht heb je liever de lengte op de horizontale as. Dan bewerk je het grafiekgebied en na rechtsklikken kies je "Gegevensbereiken". Je moet daar bij "Gegevensreeksen" de juiste kolommen voor de X-waarden en Y-waarden instellen, de D wordt de E-kolom en omgekeerd.
Nu heb je wel een puntenwolk, maar daarmee heb je nog geen verband tussen y (gewichten) en x (lengtes). Dit verband kun je zichtbaar maken met een zogenaamde trendlijn. OO-Calc tekent die lijn voor je, maar of hij enige serieuze betekenis heeft hangt af van de correlatiecoëfficiënt `R`. `R` heeft waarden uit het interval `[text(-)1, 1]`. Hoe dichter `R` bij `1` of `text(-)1` ligt, hoe beter het verband. Als `R` dicht bij `0` ligt is de correlatie slecht. De trendlijn en de bijbehorende correlatiecoëfficiënt vind je zo:
Omdat de correlatie behoorlijk goed is, geeft de trendlijn een (statistisch) verband tussen `y` en `x` weer. Die lijn heet ook wel de regressielijn. Daarmee kun je dan redelijk voorspellen hoe zwaar iemand in deze groep zou moeten zijn als je zijn lengte weet.
Gebruik het bestand met gegevens van 154 leerlingen en probeer de volgende vragen te beantwoorden. Motiveer je antwoord op de beschreven manier.
Math4all
Ik wil mij aanmelden voor: