De Basis van de Statistiek
Een sport team loopt elk jaar een coopertest om te bepalen hoe het met de conditie gesteld is. In 12 minuten moet daarbij zo ver mogelijk gerend worden. Vorig jaar werd daarbij een gemiddelde afstand behaald van 2500 meter. Dit jaar scoorde het teams ‘slechts’ een gemiddelde van 2465 meter. Aanvoerder boos op zijn team, trainer teleurgesteld, conditietrainer ontslagen, maar is dat wel nodig? Is het gevonden verschil van 35 meter wel echt een verschil te noemen?
Precies voor een vraag als het bovenstaande, daarvoor is statistiek uitgevonden! Want ja, er is een verschil in de twee metingen, maar maakt dat verschil nou echt uit? Of zoals het in de statistiek geformuleerd wordt: zijn de metingen significant verschillend?
Om dit dieper te gaan onderzoeken kunnen we gaan kijken naar de spreiding van de metingen. Stel, vorig jaar scoorde iedereen tussen de 2490 en de 2510 (in jargon: de range) en dit jaar werd er een range gevonden van 2455 tot 2475, dan is het duidelijk dat iedereen slechter is gaan presteren. In dit geval spreken we van een structurele verandering en waarschijnlijk brengt dat wel significante verschillen met zich mee (dit kan je nog niet zeker zeggen, dat moet getoetst worden).
Maar stel nu, de range is groter en er is ook overlap tussen de metingen. Dan kan je een structurele verandering moeilijk meer herkennen. En daarvoor zijn dan de statistische toetsen bedacht. Met een statistische toets kan je makkelijk onderzoeken of je aan mag nemen of het verschil dat je hebt gevonden op toeval berust of dat er structurele veranderingen hebben plaats gevonden.
Voor alle verschillende situaties zijn er verschillende toetsen. Er zijn toetsen om twee of meer groepen te vergelijken, of twee of meer tijds momenten of combinaties van die twee, een andere tak van de statistiek houdt zich bezig met verbanden aantonen, met statistiek kan je vragenlijsten beoordelen, modellen maken en nog veel meer. Ik probeer van de basis hier een overzicht te maken zodat statistiek voor iedereen inzichtelijk wordt.
Want statistiek kan ook voor iedereen van belang zijn. Zelf kom ik uit een sociale kant van de wetenschap, waarmee ik statistiek geleerd heb. Maar de kennis geld in elke tak van de wetenschap. Met kennis over de basisbegrippen kan je dan ook statistiek van alle soorten begrijpen. En daarom is statistiek belangrijk, het is universeel, statistiek is de taal van de wetenschap.