4.6 simulaties

Top  Previous  Next

 

Als twee variabelen niet samenhangen, onafhankelijk zijn, wil nog niet zeggen dat een steekproef vanzelf een perfecte kruistabel oplevert.

En ook niet een relatief risico van 1. Het zal wel in de buurt zitten, maar dat is wel een beetje vaag. Een indruk van de "buurt" kun je krijgen met behulp van simulaties door at random veel steekproeven uit de data van een perfecte tabel te nemen.

 

4.6aButton

 

Je hebt een drietal maten om een kruistabel te beoordelen, het relatief risico, het percentage-verschil en de chi-kwadraat.

Door toeval zijn er altijd kleine afwijkingen in de data  ten gevolge van variatie in de steekproeven.  Dus  zijn er ook  toevallige afwijkingen ten opzichte van de perfecte tabel in de beoordelingsmaten.

Wanneer  de afwijkingen zo groot zijn dat toeval geen argument is moet  je concluderen dat het uitgangspunt van de perfecte tabel met de verwachte frequenties bij onafhankelijkheid, niet kan kloppen. Dan kunnen de variabelen niet onafhankelijk zijn en zullen ze dus samenhang vertonen.

De  vraag is dan hoe je dat uitzoekt. Heel handig met behulp van simulaties zoals je hiervoor hebt gedaan.

 

4.6b

 

overleving

geslacht

gered

omgekomen

totaal

man

10

35

45

vrouw

50

55

105

totaal

60

90

150

 

Bij de bovenstaande kruistabel is het relatief risico voor "omgekomen: mannen t.o.v vrouwen" gelijk aan 1,48. Dat is groter dan 1, is dat een te grote afwijking of niet?

Met een simulatie kun je dat nagaan en kun je concluderen dat de variabelen geslacht en overleving al of niet afhankelijk  zijn.

 

Button

 

4.6c

 

overleving

geslacht

gered

omgekomen

totaal

man

14

31

45

vrouw

46

59

105

totaal

60

90

150

 

Een andere steekproef leverde bovenstaande kruistabel op. Het relatief risico is daar 1,23

Onderzoek met een simulatie tot welke conclusie over de (on)afhankelijkheid je nu komt.

 

Button

 

4.6d

 

overleving

geslacht

gered

omgekomen

totaal

man

42

93

136

vrouw

138

177

315

totaal

180

270

450

 

De bovenstaande steekproef is drie keer zo groot als de vorige. Het relatief risico is dus ook 1,23

Onderzoek of je tot dezelfde conclusie over (on)afhankelijkheid komt.

 

Button

 

Conclusie:  De omvang van de steekproef speelt een belangrijke rol bij het trekken van statistische conclusies.

 

4.6eVan de variabelen in de 2x3 tabel die je in 4.5 onderzocht was de afhankelijkheid twijfelachtig.

 Je gaat dat nauwkeuriger bekijken met de chi-kwadraat.
 
Button