4.6 simulaties |
Top Previous Next |
Als twee variabelen niet samenhangen, onafhankelijk zijn, wil nog niet zeggen dat een steekproef vanzelf een perfecte kruistabel oplevert. En ook niet een relatief risico van 1. Het zal wel in de buurt zitten, maar dat is wel een beetje vaag. Een indruk van de "buurt" kun je krijgen met behulp van simulaties door at random veel steekproeven uit de data van een perfecte tabel te nemen.
Je hebt een drietal maten om een kruistabel te beoordelen, het relatief risico, het percentage-verschil en de chi-kwadraat. Door toeval zijn er altijd kleine afwijkingen in de data ten gevolge van variatie in de steekproeven. Dus zijn er ook toevallige afwijkingen ten opzichte van de perfecte tabel in de beoordelingsmaten. Wanneer de afwijkingen zo groot zijn dat toeval geen argument is moet je concluderen dat het uitgangspunt van de perfecte tabel met de verwachte frequenties bij onafhankelijkheid, niet kan kloppen. Dan kunnen de variabelen niet onafhankelijk zijn en zullen ze dus samenhang vertonen. De vraag is dan hoe je dat uitzoekt. Heel handig met behulp van simulaties zoals je hiervoor hebt gedaan.
4.6b
Bij de bovenstaande kruistabel is het relatief risico voor "omgekomen: mannen t.o.v vrouwen" gelijk aan 1,48. Dat is groter dan 1, is dat een te grote afwijking of niet? Met een simulatie kun je dat nagaan en kun je concluderen dat de variabelen geslacht en overleving al of niet afhankelijk zijn.
4.6c
Een andere steekproef leverde bovenstaande kruistabel op. Het relatief risico is daar 1,23 Onderzoek met een simulatie tot welke conclusie over de (on)afhankelijkheid je nu komt.
4.6d
De bovenstaande steekproef is drie keer zo groot als de vorige. Het relatief risico is dus ook 1,23 Onderzoek of je tot dezelfde conclusie over (on)afhankelijkheid komt.
Conclusie: De omvang van de steekproef speelt een belangrijke rol bij het trekken van statistische conclusies.
|