-ocr page 1-
DIE NORMA LIE
VIERDIEI.ING
Freudenthal instituut
Archief
-ocr page 2-
DIE NORMA LIE
VIERDIELING
-ocr page 3-
%
Tiberdreef 4 - 3561 GG Utrecht
DE NORMALE VERDELING
Een produkt ten behoeve van de
experimenten in het kader van de
Herverkaveling Eindexamenprogramma's
Wiskunde I en II V.W.O.
Samenstelling: Martin Kindt
Jan de Lange Jzn
Vormgeving: Ellen Hanepen
©1983, 1e versie
Utrecht, december 1983.
-ocr page 4-
INHOUDSOPGAVE
1. VERDELINGEN VAN LICHAAMSAFMETINGEN                                  pag. 1
2. DE STANDAARD-NORMALE VERDELING                                                    15
3. STANDAARDISEREN                                                                                 23
4. STATISTISCHE VUISTREGELS/                                                             31
NORMAAL WAARSCHIJNLIJKHEIDSPAPIER
5. SPREIDING BIJ KANSVERDELINGEN                                                     41
6. DE NORMALE BENADERING VAN KANSEN                                                53
7. GEMENGDE OPGAVEN                                                                               67
-ocr page 5-
1
VERDELINGEN VAN LICHAAMSAFMETINGEN
In 1947 werd in opdracht van N.V. Magazijn 'De Bijenkorf een statis-
tisch onderzoek verricht naar de lichaamsafmetingen van de Nederlandse
vrouwen.
Dit onderzoek had ten doel de fabricage van damesconfectiekleding op
een hoger peil te brengen: beter passende kleding en minder geldver-
spilling aan vermaakkosten. Ten behoeve van dit onderzoek werden bij
een aantal willekeurig gekozen vrouwelijke klanten van De Bijenkorf
vijftien lichamelijke kenmerken gemeten, o.a. lichaamslengte en gewicht,
taille, bovenwijdte, heupbreedte, kniehoogte. De proefpersonen werkten
mee op vrijwillige basis en werden door De Bijenkorf na afloop van de
metingen onthaald op koffie en gebak.
-ocr page 6-
2
Gedurende twee weken werden zo de gegevens van 5001 vrouwen boven de 18
jaar verzameld, hoofdzakelijk afkomstig uit de drie grote steden.
Met betrekking tot de lichaamslengte werd de volgende frequentieverde-
ling vastgesteld:
Lmytz
ftuLqucwtld
Lmqtz
VfizqixHYvtie,
{cm)
{cm)
136
-
161
321
137
-
162
313
138
-
163
290
139
1
164
294
140
1
165
291
141
4
166
261
142
3
167
222
143
2
168
184
144
8
169
157
145
4
170
167
146
17
171
109
147
18
172
86
148
32
173
65
149
51
174
62
150
54
175
29
151
71
176
49
152
78
177
28
153
115
178
17
154
149
179
5
155
170
180
10
156
208
181
6
157
208
182
3
158
231
183
1
159
301
184
2
160
302
185
-
186
1
Totaal 5001
» 1. a. Wat is de mediaan van deze verdeling?
b. Waaraan kun je zien dat de gemiddelde lengte ongeveer gelijk
is aan de mediaan?
» 2. Er is vastgesteld dat ongeveer 2£% van die 5001 vrouwen een leng-
te heeft die meer dan twee keer de standaarddeviatie (2*S.D.)
groter is dan de gemiddelde lengte (de 'uitschieters' naar boven).
Hoe kun je uit dit gegeven de S.D. schatten?
-ocr page 7-
3
» 3. Controleer of het aantal 'uitschieters naar beneden' (d.w.z. vrou-
wen met een lengte die meer dan 2x S.D. onder het gemiddelde ligt)
ook 2|% van het totaal bedraagt.
Van de 5001 vrouwen werd ook het lichaamsgewicht gemeten.
Hieronder zie je de h.ztoutLQVZ-^h.Q.qa.ZYltizpotijQOnzn van lengte en gewicht
van de betrokken personen. De horizontale streepjeslijnen geven het 10%-
resp. 20%-niveau aan.
——r—i------] i
20%
■ i........<—r
GEWICHT
'90 cm
ISO kq
» 4. Wat is een opmerkelijk verschil tussen de beide grafieken?
» 5. a. Bij de frequentiecurve van de lengte is de klassebreedte niet,
zoals in de tabel, 1 cm. Hoe kun je dat zien aan die grafiek?
b. Uit de hoogte van de top kun je afleiden hoeveel cm de klasse-
breedte is. Hoe?
» 6. In de tweede grafiek kun je aflezen dat de modus van de gewichts-
verdeling in de steekproef rond de 62 kg ligt. (Eigenlijk moet je
spreken van 'modale klasse').
Hoeveel % van de vrouwen waren naar schatting zwaarder dan het mo-
dale gewicht van 62 kg?
» 7. Voor het gemiddelde gewicht werd gevonden 66,80 kg en de S.D. be~
droeg 10,91 kg.
Schat uit de grafiek hoeveel % van de vrouwen meer dan 1 S.D.
zwaarder of lichter was dan het gemiddelde gewicht.
-ocr page 8-
4
De vorm van een frequentiepolygoon bij een gevonden verdeling hangt af
van de gekozen klassebreedte! Bij de frequentiepolygonen op biz. 3 is
een klassebreedte van resp. 3 cm en 4 kg genomen.
Als je de grafiek van de lichaamslengte op basis van een klassebreedte
van 1 cm tekent, wordt het verloop wat grilliger. Ook wordt de symmetrie
wat minder duidelijk.
»» 8-
■5
1 6
cr
2-
0          140                150              160               170               180
Neem je daarentegen een klassebreedte van 5 cm en zorg je ervoor dat de
gemiddelde lengte (162 cm) het midden van een klasse is, dan krijg je
een vrijwel volmaakt symmetrische grafiek.
» 8. Maak die grafiek. Vermeld langs de verticale as de frequentieper-
centages.
Bij een goed op elkaar afstemmen van steekproefomvang en klassebreedte
kun je een 'mooie' grafiek verwachten. Had men in 1947 de steekproef
flink uitgebreid (tot bijv. 50.000 vrouwen), dan zou de frequentiecurve
bij een klassebreedte van 1 cm er vermoedelijk 'glad' en symmetrisch heb-
ben uitgezien. In het algemeen kun je verwachten dat bij vergroting van
de steekproef en verkleining van de klassebreedte, de grafiek van de li-
chaamslengte zal gaan lijken op een 'klokvormige' kromme. (Zie pag. 5).
-ocr page 9-
5
S8t
Jeiig-te in cm
170
lt)0
De klokvormige kromme geeft een wiskundig model van de verdeling van de
Nederlandse vrouwen (anno 1947) naar lichaamslengte. Dit model noemt
men de
notimaJLd veAdnting.
De naam 'normale verdeling' is enigszins misleidend, omdat zij sugge-
reert dat elke verdeling die hiervan afwijkt abnormaal zou zijn, hetgeen
zeker niet het geval is. De verdeling van het gewicht van de 5001 vrou-
wen (figuur op biz. 3) ziet er vanwege de asymmetrie al aanzienlijk min-
der 'normaal' uit.
Bij het Bijenkorf-onderzoek werd ook
de voetlengte gemeten.
Resultaat:
»
vaztlengte.
fin.e.que.n£Le.
voeXlzngtz
iizquzntit
ui cm
-oi cm
20
4
25
848
20,5
6
25,5
532
21
11
26
303
21,5
33
26,5
179
22
68
27
76
22,5
213
27,5
20
23
419
28
13
23,5
582
28,5
7
24
718
29
1
24,5
968
5001
Onderzoek of deze verdeling lijkt op de normale verdeling.
-ocr page 10-
6
> 10. Dezelfde vraag voor de verdeling van de 5001 vrouwen naar leeftijd,
luzitijd
^nzqwrntiz
18- 27
1186
28-37
947
38- 47
1183
48-57
1048
58- 67
515
> 67
122
5001
» 11. De Nederlandse vrouw van 1983 is gemiddeld aanzienlijk langer dan
die van 1947.
Neem aan dat het verschil 8 cm is.
a. Schets in een figuur de (normale) verdeling van de Nederlandse
vrouwen naar lichaamslengte in de jaren 1947 en 1983. Neem aan
dat de spreiding in 1983 even groot is als in 1947.
b. Hoe zal de normale curve veranderen bij een meer gespreide ver-
deling van de lichaamslengte (bijv. met een twee keer zo grote
S.D.)?
In het voorbeeld van de lichaamslengte werd de normale kromme gevonden
door 'glad strijken' van de frequentiecurve. We hadden ook uit kunnen
gaan van het
hJJitOQKJXm van de relatieve frequenties.
■7ST3
30-
a
10
—,—>,,-.■„, i -,(
152 162
172
142
182
-ocr page 11-
7
Bij een grotere steekproef en een kleinere klassebreedte worden de tre-
den van de trap kleiner en benadert de kromme de contouren van het his-
togram.
18 •
-
r-
K
f4* rr
t
\
1
12 ■
£
*
6 -
1/
1
1
L
*■>»*"
1—t—
—+-
\
144
162 171
153
180
De oppervlakte van het gebied onder de kromme tussen X = 154,5 en X= 169,5
geeft de relatieve frequentie van het aantal vrouwen met lengte tussen
154,5 en 169,6 cm.
150 \ 160 /^*170
154,5 169,5
180
» 12. a. Uit de Bijenkorf-steekproef blijft dat ongeveer 75% van de
vrouwen een lengte heeft tussen 154,5 en 169,5 cm.
Hoe kun je zien dat die 75% aardig klopt met de laatste gra-
fiek?
b. WeIk frequentiepercentage komt overeen met de oppervlakte
van het
Qzhztd gebied onder de kromme?
-ocr page 12-
De standaarddeviatie (in het geval van de 5001 vrouwen bedroeg die 6,5
cm) kun je in de grafiek terugvinden als de afstand van de symmetrie-
as tot de punten op de kromme waar die kromme het steilst is. (De zgn.
buUgpunte.n van de grafiek).
punt meX hJL<Luit>tn
mgcutie-ve.) heZLuig
)xuit me,t g-xoo-t&tki
Ipui-Lticvz) lie,LLuig
» 13. Hieronder zie je de (fictieve) verdeling van Nederlandse, Franse
en Zweedse 18 jarige mannen naar lichaamslengte. De buigpunten
zijn aangegeven met een kruisje.
/■
"N
/r /
\
\
\*
//\ /
*
/ ' ' \
\
/ : i >
\ v
/ •' '
\ '•• N
/ * s
X '• s
--^ .-" -''
\^>.>.
—1 ■ «M..... "!■-""■ 1
. 7——,-_"•.,.-—.
a.
6--
^3
150 160 170 180 190 200
a. Lees uit de figuur af hoe groot de gemiddelde lengte van de
resp. Nederlandse, Franse en Zweedse man is.
b. Lees ook de S.D. voor elk van de drie verdelingen af.
c. Verklaar: hoe smaller de 'klok', hoe hoger de 'top'.
-ocr page 13-
9
Biometrische kenmerken van mensen (en ook van dieren en planten) beant-
woorden dikwijls aan de normale verdelingen. De Belgische wiskundige
Quetelet (1796- 1874) was de eerste die hierover gepubliceerd heeft
(L*anthropometric ou mesure de differentes facultes de l'homme).
Een voorwaarde voor het normaal zijn van de verdeling is wel dat de
groep waarvan je een bepaald kenmerk meet, redelijk 'homogeen' is.
» 14. Als je bijv. de lengte van alle brugklassers en eindexamenkandi-
daten van je school meet en de resultaten in een grafiek verwerkt,
heb je te maken met een niet-homogene groep.
Hoe zal de grafiek van die lengte-verdeling er globaal uitzien?
» 15. Bij het Bijenkorf-onderzoek bleken lichaamslengte, ruglengte,
mouwlengte, handomvang, lengte middelvinger, kniehoogte, voetleng-
te en - breedte redelijk normaal verdeeld te zijn.
Van de diktematen (gewicht, taille, heupomvang e.d.) gold het niet
of in veel mindere mate. Wat voor verklaring kun je hiervoor be-
denken?
» 16. De (globale) grafieken van de lengteverdeling van:
a. alle Nederlanders;
b. alle gehuwde Nederlanders;
c. alle standaard-matrassen (voor volwassenen);
d. alle leden van gezinnen waarvan de ouders jonger zijn dan 30
jaar.
Welke hoort bij weIke? Verklaar.
taigte
l&tgte
ttngte
lengte
-ocr page 14-
10
CONTINU EN DISCREET
Lichaamslengte, gewicht e.d. zijn voorbeelden van (stochastische)
variabelen.
In de statistiek kennen we zowel COnt-inue. variabelen als cLL&CJieXd
variabelen.
Vooibe.el.dm van continue.
Vooxbe.e2.dm van dibcieXe
\)OJvLa.beJLen:
- lichaamsgewicht;
- aantal bloembladen van een roos;
- bloeddruk;
- aantal korrels in een aar;
- voetlengte.
- schoenmaat.
Bij continue variabelen kan het
Discrete variabelen veranderen
verschil tussen twee waarden
sprongsgewijs.
'willekeurig' klein zijn.
Het 'bereik' van een continue
Het 'bereik' van een discrete va-
variabele is een -uiteXvaL.
riabele bestaat uit 'geisoleerde'
punten.
Voetlengte (volwassen mens):
Schoenmaat:
10 cm 40 cm
37J 38 38J 39 39j 40 40j
» 17. In onderstaande tekst is
sprake van de waarden van
een aantal variabele ken-
merken van een boom.
Welke van die variabelen
zou je continu, welke dis-
creet willen noemen?
Vczn VouglaiipaA uitAd In 13S1 gzplant
c» ui 1922 gcveld: hij tzldi. pie.cXu
S40 jaaAAsLngiLn,
wai ?6 m hoog, 2 m dik,
mog 26.000 Ivilo an laveMe. 40 m3 IwuX
up.
-ocr page 15-
11
De normale verdeling geeft een continu model dat vaak ook bij discrete
variabelen wordt gebruikt.
MoonhzoZd:
Het aantal vinnerven bij bot.
Van 703 vissen werd het aantal vinnerven geteld.
Het aantal varieerde van 47 tot 61. De verdelings-
grafiek benadert de normale kromme heel dicht.
bot
aantal vtnn&ivzn
6sLzquentU.e.
47
5
48
2
49
13
50
23
51
58
52
96
53
134
54
127
55
111
56
74
57
37
58
16
59
4
60
2
61
1
» 18. Schat uit de grafiek het gemiddelde en de S.D. van het aantal
vinnerven bij bot.
-ocr page 16-
12
SAMENVATTING
Voor de normale verdeling geldt:
- de verdelingscurve is symmetrisch en klokvormig;
- de as van symmetrie gaat door het gemiddelde (u);
- de afstand van symmetrie-as tot de punten waar de helling van de krom-
me het steilst is (de zgn. buigpunten) is gelijk aan de standaarddevi-
atie (a);
- de totale oppervlakte van het gebied onder de kromme is gelijk aan 1
(of 100%).
-ocr page 17-
13
gmlddeZdz = y
S.P. = a
totatz oppeAvZaktz
= 100%
-ocr page 18-
14
VoZautomati&che. InAtatlatiz voon. heX vaJLtzn van meZk^le^^en.
-ocr page 19-
15
DE STANDAARD-NORMALE VERDELING
103 104 inhoud cl
100 101
Een fles melk zal vrijwel nooit precies een liter melk bevatten. Als de
vulmachine 'eerlijk' is ingesteld, kun je hoogstens verwachten dat de ge-
middelde inhoud van de flessen (ongeveer) 1 liter is.
Bij een controle, waarbij de werkelijke inhoud in centiliters nauwkeurig
werd gemeten, werd inderdaad een gemiddelde van 100 cl gevonden. De ge-
meten inhouden bleken normaal verdeeld te zijn met een standaarddeviatie
van 1 cl. (Zie grafiek).
» 19. De controleur was alleen ge'interesseerd naar de afwijkingen van de
voorgeschreven inhoud. Daarom noteerde hij voor elke fles uit de
steekproef als meetresultaat het verschil met 100 cl (positief/ne-
gatief als de fles meer/minder bevatte).
a. Wat was het gemiddelde van zijn meetresultaten?
b. En hoe groot was de standaarddeviatie?
-ocr page 20-
16
De normale verdeling in opgave > 19 is een hele bijzondere.
Het bijzondere zit hem hierin dat het gzmLddoJLdz van alle meetresultaten
gelijk is aan nut en de A£andacUuide.VAXUtLe. gelijk is aan Hon.
Kortweg: y = 0 en a = 1 .
Men spreekt in dit geval van de SstandcicUid-noHmatz vnfideJLlng.
X
-4 -3 -2 -1 0
De bijbehorende standaard-normale kromme beantwoordt aan een 'keurige'
formule:
1 -b
y
/2TT
De 'constanten' n en e zijn bekende getallen in de wiskunde.
In 5 decimalen afgerond: tt = 3,14159
e = 2,71828
» 20. De standaard-normale kromme is symmetrisch t.o.v. de lijn x=0.
1 ~h
Hoe kun je dat 'zien' aan de formule y
/2tt
s>21. Bereken uit de formule een aantal punten van de standaard-normale
kromme (neem x=0, 1, 2, 3, 4) en controleer of je resultaat klopt
met het plaatje.
-ocr page 21-
17
OpmzhitinQ:
Bij toenemende positieve waarde van x wordt de bijbehorende y-waarde
kleiner en zelfs 'willekeurig klein'.
Voor x = 5 bijv. is y bij benadering 1| miljoenste.
De x-as is een CU>ymp£oot van de standaard-normale kromme.
De afstand van de kromme tot de x-as is rechts van x = 3,5 en links van
,x = -3,5
z.6 miniem, dat het lijkt of de grafiek daar samenvalt met de
x-as.
In hoofdstuk 1 heb je gezien dat een relatieve frequentie bij een nor-
male verdeling overeenkomt met de oppervlakte van een gebied 'tussen de
kromme en de x-as'.
1 _ix2
Met behulp van de formule y = ~7j= e kan de oppervlakte van zo'n ge-
bied in bijv. 3 decimalen nauwkeurig worden berekend. Het principe bij
zulke berekeningen is dat het gebied in smalle strookjes wordt ver-
deeld; elk van die strookjes kan worden benaderd door een rechthoekje.
De som van de oppervlakten van die rechthoekjes is bij benadering de
oppervlakte van het gebied.
Zo geldt: de oppervlakte van het gebied tussen x= 1 en x=2 is gelijk
aan 0,136 (of 13,6%).
-ocr page 22-
18
Omdat het toepassen van deze methode nogal bewerkelijk is, is er een
tabel gemaakt van oppervlakten onder de standaard-normale kromme.
Die tabel geeft de oppervlakte van het gebied links van de lijn 'x = z'
(z>0).
Die oppervlakte wordt meestal genoteerd als ^(z). (0 is de Griekse
hoofdletter 'phie').
X-04
z
opp. = $(z)
z
opp. = <J>(z)
z
opp. = 4>(z)
0,00
0,500
1,00
0,841
2,00
0,977
0,05
0,520
1,05
0,853
2,05
0,978
0,10
0,540
1,10
0,864
2,10
0,982
0,15
0,560
1,15
0,875
2,15
0,984
0,20
0,579
1,20
0,885
2,20
0,986
0,25
0,599
1,25
0,894
2,25
0,988
0,30
0,618
1,30
0,903
2,30
0,989
0,35
0,637
1,35
0,912
2,35
0,991
0,40
0,655
1,40
0,919
2,40
0,992
0,45
0,674
1,45
0,926
2,45
0,993
0,50
0,692
1,50
0,933
2,50
0,994
0,55
0,709
1,55
0,939
2,55
0,995
0,60
0,726
1,60
0,945
2,60
0,995
0,65
0,746
1,65
0,950
2,65
0,996
0,70
0,758
1,70
0,955
2,70
0,996
0,75
0,773
1,75
0,960
2,75
0,997
0,80
0,788
1,80
0,964
2,80
0,997
0,85
0,802
1,85
0,968
2,85
0,998
0,90
0,816
1,90
0,971
2,90
0,998
0,95
0,829
1,95
0,974
2,95
0,998
» 22. Hoe kun je uit de tabel vinden dat de oppervlakte 'tussen 1 en 2'
gelijk is aan 0,136?
-ocr page 23-
19
De tabel kan blijkens opgave » 22 ook worden gebruikt om de oppervlakte
te vinden van andere gebieden dan 'tussen -°° en z' (voor z>0).
Daarbij zul je dikwijls gebruik maken van twee eigenschappen van de stan-
daard-normale kromme:
- de kromme is symmetrisch t.o.v. de lijn x = 0;
- de totale oppervlakte van het gebied onder de kromme is 1.
VooKbudld:
Gevraagd: opp
ervlakte A.
A \M
i \ /
! \ c / '
/B
- 0,5 0,5
opp.
A = opp. B (spiegeling in de lijn x=0);
opp.
B = 1 - opp. C (overgang op het 'complement');
opp.
C = $(0,5) = 0,692 (tabel);
dus:
opp. A = 1 - 0,692 = 0,308.
»23. Vind de volgende oppervlakte uit de tabel van biz. 18).
b.
0 2
-ocr page 24-
20
» 24 . Even terug naar biz. 15.
Beantwoord de volgende vragen m.b.v. de $ - tabel.
a. Hoeveel % van de melkflessen bevatte meer dan 99 cl en minder
dan 101 cl?
b. En van hoeveel % lag de inhoud tussen 98 en 102 cl?
»25. Terugzoeken in de tabel: vind de grenspunten van de volgende ge-
bieden.
» 26 . De controleur van de melkflessen beschouwde de 90% van de flessen,
waarvan de inhoud het minst van het gemiddelde afweek, als 'nor-
maal' en de overige 10% als 'uitschieters' (hetzij naar boven, het-
zij naar beneden).
Bij welke gemeten inhouden kun je van een uitschieter spreken?
»27. De melkfabrikant wil dat niet meer dan 5% van de door hem geleverde
flessen minder dan 99 cl melk bevatten.
Op welk gemiddelde moet de vulmachine worden ingesteld?
-ocr page 25-
/
21
Achterin dit boek is een meer uitgebreide tabel van $-waarden (in 4
decimalen) afgedrukt.
In de tabel vind je bijvoorbeeld:
$(0,34) w 0,6331
5675
6064
644.1
6K08
7157
5714
6103
6480
6844
7190
5753
6141
6517
6879
7224
Terugzoeken:
$(z) w 0,719 =* z fa 0,58,
5753
6141
6517
6879
7224
»28. Zoek op in de uitgebreide tabel (biz. 71):
a. $(1,96) b. $(2)                       c. $(-1,96) d. $(-0,04)
» 29. Voor welke z geldt:
a.   $(z) fa 0,96?
b.   $(z) fa 0,50?
c.   $(z) fa 0,25?
d.   $(z) fa 0,04?
» 30. In een fabriek wordt frisdrank in halve-liter pakken verpakt. De
werkelijke inhoud van de pakken is normaal verdeeld met een S.D.
van 1 cl.
De fabrikant wil dat ten hoogste 2£% van de pakken meer dan 52 cl
bevatten.
Op welk gemiddelde moet de vulmachine worden ingesteld?
-ocr page 26-
22
Cafiz Hoppz  op kzt Spui In AmAtzAdam bzAtaat at zzuuizn. Vz dxzmpzJUtzzn
dtz tu66zn   1670 en 79?7 mozit wotidzn bz&izdzn om tozgang tot dz ta.vzzn.nz
tz kftljgzn  -Its uitgz&tztzn votgzm zzn wvijwzl nonmatz knommz, zocdii> dz
dztaJX^oto  op btz. 23 laat ztzn.
-ocr page 27-
23
3
STANDAARDISEREN
Een normale verdeling met 'gemiddelde=0' en 'S.D. = 1' kom je in de
praktijk niet dagelijks tegen.
Toch is de standaard-normale verdeling van groot belang in de statistiek.
De clou zit hem in het feit dat elke normale verdeling via een
Achaal-
tfuxm^Ohmoutiz
teruggebracht kan worden tot de standaard-normale verdeling.
Met behulp van een
XahoJL (de $-tabel) kunnen allerlei problemen worden
opgelost die betrekking hebben op een normale verdeling met S.D.
± 1!
-ocr page 28-
24
In het voorbeeld van de literflessen melk (zie biz. 15) hebben we via
een voor de hand liggende ingreep het gemiddelde op nul gebracht. Die
ingreep was: neem de
il^LC^ijkA^ng van keX QQjni.dd&td(L als nieuwe variabele.
Het 'nomogram' laat dat duidelijk zien:
gem.
II
97 98 99 100 101 102 103 Inhoud [cX]
!              "               '!
2 3 a&MLjking (c£)
van 100
-3 -2 -1          0
Anders gezegd: je kiest een nieuwe schaalverdeling met de 'oorsprong' in
100.
lets dergelijks kun je doen bij de lengte-verdeling van de Nederlandse
vrouwen anno 1947.
Op grond van de Bijenkorf-steekproef is geschat: u= 162 cm en a = 6,5 cm.
68,5           175 ImqtZ [cm]
149________155,5
162
13 afaiaijking (cm)
van \i
-6,5
-13
6,5
»31. Deze afwijkingen zijn wel normaal-, maar niet itOLndaaJid-normaal ver-
deeld. Waarom niet?
De grootte van de standaarddeviatie a wordt hier uitgedrukt in cm.
Door een andere keuze van de lengte-eenheid kun je een andere a vinden,
bijv. a = 65 (in mm) of
0 = 0,065 (in m).
Een listige keuze van de lengte-eenheid is nu: 6,5 cm.
-13
-6,5
13 afauicjliing
van \i [In cm]
6,5
2 aj5HU.yfex.ng
van \i (in S.V.
-2
Hiermee bereiken we dat de standaarddeviatie van de lengte-afwijkingen
(gemeten in de nieuwe eenheid) gelijk is aan 1.
-ocr page 29-
25
Door de keuze van de nieuwe eenheid is de lengte-verdeling van de Neder-
landse vrouwen QUtdndcXJXAcLi&zeAd.
Lmgte.
1<.2,5 119 155,5         162 166,5 175 161,5 Cm
■3           -2           -1
» 32. a. Hoe kun je in de 0-tabel vinden dat 68,26% van de vrouwen een
lengte heeft tussen 155,5 en 168,5 cm?
b. Komt dat percentage overeen met dat in de steekproef van 5001
vrouwen? (Zie tabel op biz. 2).
c. Hoeveel % van de vrouwen heeft volgens de $-tabel een lengte
tussen 149 en 175 cm?
In de steekproef van 5001 vrouwen waren er 290 met een lengte van
163 cm; dat is een fractie van ongeveer 5,8%. We kunnen nu narekenen
of dit percentage in overeenstemming is met het theoretische (d.w.z.
normale) model:
- de 'klasse 163' bevat de vrouwen met een lengte tussen 162,5 en
163,5 cm;
- de klassegrenzen wijken resp. 0,5 en 1,5 cm af van het gemiddelde
(= 162 cm);
- die afwijkingen druk je uit in S.D.'s:
6,5 cm = 1
S.D.
0,5 cm = T-^| S.D. w 0,08 S.D.
6,5
1,5 cm = -li| S.D. w 0,23 S.D.
6,5
de oppervlakte (= relatieve frequentie) onder de normale kromme,
vind je nu uit de 0-tabel:
$(0,23) - 0(0,08) = 0,5910 - 0,5319 = 0,059 (ofwel 5,9%).
-ocr page 30-
26
»33. Hoeveel vrouwen (van de 5001) zou je volgens de $-tabel verwach-
ten in de klasse van 155 cm? (De klassebreedte is weer 1 cm).
Klopt dit met het resultaat in de Bijenkorf-steekproef?
» 34. In een zeker land is de gemiddelde lengte van dienstplichtige man-
nen gelijk aan 180 emmet een standaarddeviatie van 10 cm.
Bij een militaire keuring worden er 10.000 mannen gekeurd.
a. Hoeveel van die mannen kun je verwachten met een lengte tussen
1.75 en 1.85m? (teken een normale kromme met twee schalen).
b. Een dienstplichtige wordt afgekeurd op lengte als hij langer dan
2.00 m en kleiner dan 1.60m is.
Hoeveel afkeuringen op lengte kun je verwachten?
c. Door de minister van defensie wordt beslist dat in het vervolg
5% van de dienstplichtigen zal worden afgekeurd omdat ze te
lang zijn en 5% omdat ze te klein zijn.
Waar komen de grenzen van afkeuring te liggen?
»35. De j aarproduktie aan eieren van een pluimveehouder is normaal ver-
deeld (naar gewicht) met een gemiddelde van 56,3 gram en S.D. van
7,6 gram.
a. Hoeveel % van de eieren is zwaarder dan 60 gram?
b. De eieren worden in acht gewichtsklassen verdeeld:
kiaAiZ
geuilcht (g^i)
0
> 68j
1
64 - 68i
2
59J - 64
3
544 - 594
4
494 " 494
5
444 " 444
6
394 394
7
< 39J
Teken de normale kromme bij de gewichtsverdeling en geef in
je tekening de acht gewichtsklassen aan als gebieden onder
de kromme. Schrijf in elk gebied het percentage eieren dat
tot die klasse behoort.
-ocr page 31-
27
»36. Een postorderbedrijf verkoopt o.a. bouwpakketten die een normaal
verdeeld brutogewicht hebben (d.w.z. inclusief verpakking) met
een gemiddelde van 4,2 kg en een S.D. van 0,8 kg.
Men verwacht in het volgende jaar 20.000 van die pakketten te
verkopen.
De geldende PTT-tarieven van de verzending van pakjes:
gtMiiclit
(gi)
ptUji
250 -
500
4,25
500 -
1000
5,25
1000 -
3000
6,50
3000 -
5000
8,00
5000 -
7000
10,--
7000 -
10000
12,--
Welk totaalbedrag aan portokosten kan het postorderbedrijf voor
de verzending van de bouwpakketten verwachten?
» 37. Een droog korrelig  poeder bevat deeltjes die zuiver bolvormig
zijn en waarvan de  diameter normaal verdeeld is met u= 170 mikron
en a=11,6 mikron.
Men wil dit poeder  verdelen in drie soorten, namelijk: grof, mid-
del en fijn en wel
  zd dat deze drie klassen gelijke aantallen
korrels bevatten.
a. Hoe groot moeten de diameters van de gaten van de benodigde
zeven zijn waarmee je de gewenste verdeling kunt krijgen?
b. Zal de diameter van de fijne korrels ook normaal verdeeld zijn?
»38. De straatlantaarns in een zekere stad worden door de gemeente van
nieuwe gloeilampen voorzien: in totaal 2000 stuks.
De levensduur van deze lampen is normaal verdeeld met een gemid-
delde levensduur van 2500 uur en een standaarddeviatie van 500
uur. Om economische redenen is de gemeente van plan
OlZZq. lampen
door nieuwe te vervangen op het moment dat 20% van de geplaatste
lampen stuk is (en dus niet tussentijds lampen te vervangen).
Na hoeveel tijd zal dit het geval zijn?
-ocr page 32-
28
»39. In een fabriek worden pakken suiker gevuld waarvan het nettoge-
wicht 1 kg behoort te zijn.
Uit steekproeven is gebleken dat dit nettogewicht normaal is ver-
deeld met (inderdaad) een gemiddelde van 1 kg en een standaardaf-
wijking van 15 gram.
De fabrikant wil dat 95% van de te produceren pakken suiker ten-
minste 1 kg suiker bevatten. Op welk gemiddeld nettogewicht (af-
gerond in g.) zal de vulmachine moeten worden ingesteld?
TRANSFORMATIEFORMULES
De voorafgaande vraagstukken heb je steeds opgelost door overgang van
'gewone eenheden' (cm, kg, ...) op nieuwe-eenheden (S.D.).
Wiskundig gezegd: je hebt steeds een 'schaaltransformatie' toegepast.
149 155,5 162 168,5 175
-13
-6,5
6,5
13
X = lichaamslengte (in cm).
V = afwijking van de gemiddelde lichaamslengte (in cm)
Z = afwijking van het gemiddelde in S.D.'s.
Er geldt: V = X - 162
1/
6,5
X- 162
6,5
(*)
Dus:                     Z =
»40. In (*) is Z uitgedrukt in X.
Omgekeerd kun je ook X uitdrukken in Z. Hoe?
-ocr page 33-
29
»41. Bekijk de schaaltransformatie:
20
25
30
35
V
I
V
r
a. Druk Z uit in X
b. Druk X uit in Z,
ALGEMEEN:
Laat X een variabele zijn met gemiddelde u en standaarddeviatie o.
De overgang op de 'standaardvariabele' Z met gemiddelde 0 en stan-
daarddeviatie 1 :
U - 2o u- a
y + a y + 2c
-2
wordt gekenschetst door de formule:
Z =
X - u
ofwel door:
X = ol + u
Schaaltransformaties zoals bij het standaardiseren kom je ook in andere
situaties tegen. Bekend is het voorbeeld van de temperatuurschalen Celsius-
Fahrenheit. De laatste eenheid wordt nog steeds vaak gebruikt in Angelsak-
sische landen.
14
50
32
h8
-20
10 20
-ocr page 34-
30
»42. Bekijk het plaatje onderaan biz. 29.
Je ziet daarin o.a. dat 32° F overeenkomt met 0° C.
a. Druk T uit in T.
0                      r
b. Druk T uit in T .
r                   L
» 43. In 1983 beleefde men in Engeland een ongekend mooie zomer. In de
maand juli werd op zekere plaats een gemiddelde maximum tempera-
tuur van liefst 76°F gemeten met een standaarddeviatie van 6,3° F.
a. Hoeveel °C bedroeg de gemiddelde maximum temperatuur in juli
1983 in die plaats?
b. En hoeveel °C bedroeg de S.D.? (Pas op!).
»44. Een variabele X is normaal verdeeld met u = 30 en a = 5.
De variabelen Xi, ..., X5 zijn op de volgende wijze van X afge-
leid.
Xx=X + 20; X3=|X; X2=X-15; X4 = 2X - 60; X5 = 0,2(X - 30).
De variabelen Xi, ..., X5 zijn elk 00k weer normaal verdeeld.
/ V / \ X + 20
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75
a. De grafieken van X en Xi (= X+20) zijn in een figuur getekend.
Wat is de waarde van u en
O voor de variabele Xi?
b. Teken ook de grafieken van X2, X3, Xi>, X5 samen met X in een
figuur. (N.B. De totale oppervlakte onder de kromme moet steeds
hetzelfde blijven!).
Geef bij elke kromme de waarde van y en a.
-ocr page 35-
31
4
STATISTISCHE VUISTREGELS/
NORMAAL WAARSCHIJNLIJKHEIDSPAPIER
y
+
a
M
y
_
o //
Twee van de drie volwassen Nederlandse vrouwen zal een lichaamslengte
hebben die ten hoogste een keer de standaarddeviatie afwijkt van de ge-
middelde lengte.
»45. Controleer of deze slogan opgaat voor de 'Bijenkorf-vrouwen'.
(y= 162; a = 6,5).
»46. Een uitspraak als hierboven kun je voor elke normaal-verdeelde po-
pulatie doen!
Hoe kun je deze vuistregel 'bewijzen' met behulp van de •I'-tabel?
-ocr page 36-
32
Twee bekende statistische vuistregels in beeld en woord gebracht:
u-2a
\j+2o
u-a y y+a
Btj een Ktph.U2.ntcuU.nvt i>te.ekph.oeh utt een notimaa.l-vzh.de.e2de. popa-
latle, kan je veAwaakten dot:
-   ongeveeh. 2/3 van de im.ah,neming6attkombte.n nteX mzeh. dan 7 keeh.
de. S.V. aftwtjkt van het
ge.nu.ddel.de;
-   onge.ve.eh. 951 van de waaxnzmtngi>aiXkom^ten ntet mzeh. dan 1 keeh
de. S.V. afiwtjkt van het ge.middeZde.
Deze vuistregels zijn een gevolg van:
de oppervlakte van het gebied tussen -1 en 1 onder de standaard-normale
krorame is 0,6826 en de oppervlakte van het gebied tussen -2 en 2 is
0,9544.
Je ziet dat 'j' en '95%' tamelijk ruwe benaderingen zijn.
»47. 'Dit blik verf is goed voor 9 tot 12 m2 ' staat er op het etiket.
Neem aan dat de oppervlakte (in m2) die je met de inhoud van een
zo'n blik kunt verven een normaal-verdeelde variabele is. De fa-
brikant bedoelt met zijn 'garantie' dat ongeveer 95% van zijn
blikken aan de gestelde eisen voldoen.
a. Met welk gemiddelde oppervlakte en met welke S.D. heeft de fa-
brikant (vermoedelijk) gerekend?
b. Hoe groot schat je de kans dat je met een blik verf niet meer
dan 9,75 m2 kunt verven?
-ocr page 37-
33
»48. Bekijk nog eens de frequentie-tabel van het aantal vinnerven bij
bot:
aantal v-lnneAvtin
(,/izquejitiz
47
5
48
2
49
13
50
23
51
58
52
96
53
134
54
127
55
1 1 1
56
74
57
37
58
16
59
4
60
2
61
1
a. Maak een cumiZa£ie.V£-{i?ie.qu.&n£Le.-.tcLbeZ bij deze gegevens.
b. Hoe kun je uit die tabel snel (bij benadering) het gemiddelde
vinden?
c. En hoe de S.D.? (Gebruik een van de vuistregels).
Bij opgave » 48 had je ook met frequentiepercentages of relatieve fre-
quenties kunnen werken.
Hieronder zie je de cumulatieve relatieve-frequentiecurve op grond van
de 703 gegevens:
47 48 49 50 51 52 53 /*54 55 56 57 58 59 60 61
y                                     aantal v-tnneAvan
-ocr page 38-
34
^49. In de figuur op biz. 33 zie je hoe je de plaats van het gemiddel-
de (u) op de horizontale as met behulp van de grafiek kunt bepa-
len. Gebruik de vuistregels om de plaatsen van u ± a, u ± 2a op
de horizontale as te vinden.
De grafiek op biz. 33 benadert de 'cumulatieve normale curve'.
Hieronder rechts zie je de cumulatieve grafiek bij de standaardnormale
curve (in feite de grafiek van de functie $):
: 1
^^>^^^^^mm
....._j......
"^ ; ill i
i '- ■'
0,8
0,6
0,4
0 i 1
0,5
-1
-3 -2
» 50. Het aflezen uit de cumulatieve grafiek gaat gemakkelijker dan
uit de gewone klok-kromme. (Zie bijv.: $(0,5) w 0,7).
Hoe kun je uit de cumulatieve grafiek de beide vuistregels voor
Tiale verdeling aflezen?
»51. a. Jie grafiek van $ (de 'S-kromme') heeft twee horizontale
asymptoten, namelijk: y = 0 en y=1.
Hoe kun je dit verklaren?
b. Laat 0. een positief getal zijn.
In de 'klok-grafiek' kun je zien: $(-a) = 1 - $(a).
Hoe kun je die eigenschap uit de 'S-kromme' aflezen?
-ocr page 39-
35
Het werken met de cumulatieve normaalkromme (de S-kromme) heeft zekere
voordelen, zoals het direct kunnen aflezen van het gemiddelde, en, met
gebruikmaking van de vuistregel(s) van de standaarddeviatie.
Je moet daarbij natuurlijk wel weten of je inderdaad met een normale ver-
deling te doen hebt.
Er is papier ontworpen met een speciale schaalverdeling, waarop je dit
laatste gemakkelijk kunt aflezen. Dit zgn.
nohmaaJL waa/it>ckijnJU.jk&pap.iQA
heeft langs een zijde (de horizontale as) een gewone ('lineaire') schaal-
verdeling en langs de andere zijde (verticale as) een schaalverdeling die
zodanig is, dat een cumulatieve normale-verdelingskromme er uitziet als
een rechte lijn.
IWU/o
1 1 ^-^
yT
/ i i
50%
A
0%
90%
2
1 0
1 1 2
70%
50%
/\
30%
10%
/
/
\
Cumulati.e.ve ■itandaajid-non.male. kfiommz
[gm&Lek van
$) :
GhjCL^luk van $ op nonmaat-waah^cKLjn-
-LLj kh<u.cU papi-QJi:
-2
-1
»52. De schaalverdeling op het normaal waarschijnlijkheidspapier is
zo opgerekt, dat de S-kromme een rechte lijn wordt.
a. Hoe kun je verklaren dat de 'mazen' in het rooster naar boven
toe en naar beneden verticaal steeds wijder worden?
b. De onderste grafiek kun je niet zo ver uitbreiden dat de 100%-
lijn (en de 0%-lijn) te zien is. Verklaar.
-ocr page 40-
36
Het normaal waarschijnlijkheidspapier gebruik je als volgt:
- langs de horizontale as is de schaalverdeling lineair en kun je de
getallen bijplaatsen afhankelijk van de gegevens waarover je beschikt;
- langs de verticale as zijn cumulatieve frequentiepercentages volgens
de normale verdeling geplaatst; het papier is dan ook uitsluitend ge-
schikt voor cumulatieve grafieken;
- als de gegevens van een steekproef een normale verdeling represente-
ren zullen de bijbehorende punten in de grafiek (nagenoeg) op een
rechte lijn moeten liggen;
- is dat laatste het geval, dan kun je via de 50%-lijn het gemiddelde
van de verdeling schatten;
- de standaarddeviatie bij een normaal verdeelde steekproef vind je bijv.
door de 84%-lijn (of 16%-lijn) te tekenen; je kunt dan de waarnemings-
uitkomst aflezen die 1 keer de S.D. van het gemiddelde afligt.
Op biz. 37 is dit toegepast op de verdeling van het aantal vinnerven.
De meetpunten zijn uitgezet bij 47,5; 48,5; enz. zoals te doen gebruike-
lijk bij een cumulatieve frequentie-curve.
De 'meetpunten' blijken inderdaad nagenoeg op een rechte lijn te liggen;
de verdeling van het aantal vinnerven kan goed benaderd worden door de
normale verdeling.
De afwijkingen zitten vooral in het begin en de staart. Zie ook de gra-
fiek in hoofdstuk 1 (biz. 11).
De afgelezen S.D. is 55,65 - 53,6 = 2,05.
Ter controle hebben we het gemiddelde en de S.D. ook berekend in 1 dec.
nauwkeurig. Resultaten: 53,7 en 2,1!
-ocr page 41-
37
0
■" 1 ......"
1 / &
/^
T J
j
■-----------------------------------------------------------±----------------------------
,---------------------L----1-------1_ J----1—£_------XZtTff
.-^EEHEE--------zz-~-z~-zz---z-:~- =
::::::::::::::i:I:::I::::zl!][:::':":'«
tti ii/- »
I 7 &
1 /
*
/'*. j- - -+-
1 hV
1 /
/l
" - -.....-+-- -X tr^q: _ ^
3: " " "3; ^
-+- -H—M—M- ■ ' j | j F--}— + -'-'—*- M 1 1 g:
■ / >
i
!/ i 1
1-------------------------------_-------i 1/1—i-i—|----------------.---------------------_
- ^ - - "/TTT'T""""" -J~l-s
■ /I 1
<Nl 1
/III
i
!/ 1 "*
/ M 1 1 ........
/
/ :
I *){ 1 ' ! M 1 1 I
7 : 1 !' "0
j__^_^^„n___ n j a
/ : 1 i °*
/ ■ I
/ ' ' '
——-_=---:^-_Ji-_-=fc--_-j-i------_--.H
1 :::: : _ :: 3:: : X : xt
- = = E-=M--==&J=^-^=- = = - = = = = = = = = = = = = = = = h
,!«;, 1 i 1 1 , 1 ' --■ - --■ co
1/ I11 ! 1 ! 1 ! :
T
/I !
t ii it
/ 1 °
Ml! 1
j ' '1 **
1 i
L / 1 ill l
/'I
/
j
Q
' | ^
J\
1 L. 1 1 i 1 1 1
J
' ' 1
/
, ~i----------------1—i—i-------------1-----------------H--------------*~—'-------------7 ■ i
-- —t~- i if" 1 1 | 1 1 ■ 1 ' »■ ■[ 1^ '"T f"T' 1 " »-"■-■■ **~"",T'~f" T=ar- — - £^
' it
7
1 1
] . f ... ...
1 ' ■ '! ' , ! "" Q
'
1 *
Z i—
1
1 '
7
1 U
.
■ i °
f
■ I : 1 1 , 1 I <">
/'
1 i T 1 T
'
/
I I I I I i I I
|—1—1—1—1—|—1—j- fl4t7ftHWtTTTT1
: ' ! I ! r~%
---------?--TTT"x"r jl—--------=§—
=P=—p-=lz"nT ;' t |^^S=^TTt~~~T~~
M
i ' , ■ °
r
: i i i i *-
/
I ! ? i I I
j
.......' ■ i | .......
£
I I l I i
r
, | I I
A
• I I "
/
| I
?
-i^l^-^+^^t^^luH^1"
-------------------^------1-------1—|—|--------(_J—|
2
= |j = = =----ill------ --------------^^-
p======^========^===========|=======-
/
1 1 E i zE-, "i
7
1 °
/
: : it-i -- - ___ -
-+- jL
i ri-
'
_„___[ __± __± _ ±°
_i__ .___ ___ |.Lt _ _ X -
rE 1= =t ~ ~ i-"
1 III lil] 11 1 Mil 11441+ III 111 In lll4fft.
1 3
1 1
1
1 1
'i
1
1 II
v 11 !
4ls 4S>.s 44.5 i.3- 5£* 5"Z5 53.V 5"i5 ff'ar Si.5 '57.,- 5^5- 5Jy to'r 6/.j
aatitoX vi.nneAvtn
-ocr page 42-
Via een gej>chikte. AckaalXAanA^oswatie iangi, de o6-6en, Izirn je. in fani-
te, eJtke. gnja^tek omvoHjmzn tot
een fie.ckte. tijn.
AJU
voon.be.eJLd nemen we y = x2 [vooti xZ 0).
0 5
I
t J
f S
;6
1
Vz vextiaale AchxalveAdeLing in net ftzckteA plaatje. i6 nizt-limain.,
d.ui.z. bij geLijke. afatandzn kofien ongeJLijke. getalveAAckilZe.n:
afatand 0 tot I = afatand I tot 4 = afatand 4 tot 9 = ....
Mze&taZ wohdm bij zo'n a&wijkende i>ckaat de. geXaZvex6ckiIZe.n geLijk
ge.nomen, waa/idoosi de v eA.de,eJLi>th.e.pe.n op ongeJLijkz a^tanden van eJLkaan.
kome.n te. tiggen.
Bovzmtaande. ghn^iek. komt ex dan, [xiXvexgnoot, zo ait te. zien:
J
s
{
s
3
2
i
» Hoe. kun je. de. plaatA van het getat 1 op de vexticatz aj> p?ie.cieJ> be-
paJLe.nl
-ocr page 43-
39
»53. De Belg A. Quetelet verzamelde veel gegevens om zijn ontdekkingen
over het normaal verdeeld zijn van biometrische gegevens te sta-
ven. Zo mat hij de borstomvang van 1516 soldaten ('the Army of
Potomac') in inches.
Resultaat:
Sun&tomvcuig
F/iequeiitie
-ch itickti
28
2
29
4
30
17
31
55
32
102
33
180
34
242
35
310
36
251
37
181
38
103
39
42
40
19
41
6
42
2
Verwerk deze gegevens op normaal waarschijnlijkheidspapier en
lees af hoeveel inches de gemiddelde borstomvang en hoeveel
inches de S.D. is.
»54. Van 300 gloeilampen van een zeker type werd de levensduur (in
uren) bepaald:
Lzvejuduwi
Fwquentie.
\an.e.n)
950- 1050
4
1050-1150
9
1150- 1250
19
1250- 1350
36
1350- 1450
51
1450- 1550
58
1550- 1650
53
1650- 1750
37
1750- 1850
20
1850- 1950
9
1950- 2050
3
2050- 2150
1
Ga na of de levensduur van deze gloeilampen normaal verdeeld is
en geef (m.b.v. normaal waarschijnlijkheidspapier) een schatting
van gemiddelde en S.D.
-ocr page 44-
40
»55. In de Volkskrant van dinsdag 1 november 1983 schreef Machteld
Roede onder de titel 'Blijven de Nederlanders maar groeien?'
onder andere:
De Nederlanders zijn ianger gcwor-
den. Kinderen van nu zijn Ianger dan
leeftijdgenootjes van vroeger. De li-
chaamslengte bij het bereiken van de
volwassen leeftijd verschilt aanzienlijk
van die van jonge mensen een eeuw
geleden. In 1865 was de helft van de
keurlingen kleiner dan 1,65 m. Ruim
een kwart werd afgekeurd vanwege een
lengte minder dan 1,57 m. Extreem was
de lengte van 1,80 m, bereikt door min-
der dan twee percent. Groei bij mannen
kwam toen omstreeks het 25ste jaar tot
stilstand; na de keuring kon nog een
doorgroei van enkele centimeters optre-
den. Thans zijn mannen in hun twintig-
ste jaar of eerder uitgegroeid.
Sinds 1975 is meer dan de helft van de
keurlingen groter dan 1,80 m. Bij een
landelijk groei-onderzoek van 1980
Week drie percent van 14,0 jaar oude
jongens, tien percent van 14,5-jarigen
en meer dan de helft van 17,5-jarigen de
grens van 1,80 m reeds te zyn gepas-
seerd. Ook bij vrouwen zijn verschuivin-
gen in het groeipatroon opgetreden. In
1980 Week drie percent van de 18/20-
jarige vrouwen 1,80 m of Ianger te zjjn.
Extreem is nu te noemen de lengte van
1,95 m, bereikt door drie percent van de
twintigjarige mannen. In 1-980 was een
op elke duizend twintigjarige mannen
2,02 m en een op elke duizend twintigja-
rige vrouwen 1,87 m.
Verschuivingen in de lichaamslengte
van de bevolking over verloop van tyd
zijn waargenomen in alle westerse lan-
den, terwyl nu ook in ontwikkelings-
landen dit verschijnsel op gaat treden.
De verklaring ligt in veranderingen in
het milieu rond het opgroeiend kind.
Lengte-groei is lmmers slechts ten dele
erfelijk bepaald. Gedurende de gehele
periode is het proces milieugevoelig. Tot
nu toe zijn alleen maar remmende in-
vloeden aangetoond. Een kind dat
steeds weer ernstig ziek is, regelmatig
hoge koorts heeft en/of over langere tijd
te weinig en te eenzijdig eet; bhjft steeds
meer achter bij het erfelijk uitgestippel-
de groeipatroon. Bij een algehele verbe-
tering van de omgeving neemt Klaaren-
tegen de gezondheidstoestand van de
bevolking toe, ziekte en sterfte-percen-
tages bij kinderen nemen af, en de ge-
middelde lengte neemt toe.
Midden vorige eeuw waren de om-
standigheden in Nederland evenals in
de rest van Europa erbarmelijk. Epide-
mieen en ernstige infectieziekten kwa-
men veel voor. De hygiene was zeer
slecht: nauwelijks of geen watervoorzie-
ning, geen riool, de kinderen speelden
op afvalhopen. De behuizing was slecht
en het voedselpakket schaars.
Het is navrant te noemen dat de eer-
ste gerichte aandacht voor de slechte
gezondheidstoestand en inzicht in de in-
vloed van het milieu voortkwam uit de
zorg voor een goed, gezond leger. Viller-
me toonde in 1829 aan dat in Frankrijk
de lengte van de keurlingen uit de arm-
ste departementen geringer was en het
afkeuringspercentage hoger. In Neder-
land start omstreeks 1850 een soortge-
lijk onderzoek. Zeeman wees er in 1861
op hoe de jaarlijkse schommelingen in
het afkeuringspercentage van keurlin-
gen een relatie vertoonde met de
schommelingen in de prys van het
graan.
a. Uit de gegevens over de ter militaire keuring opgeroepen man-
nen in 1865 kun je afleiden dat de lengte-verdeling van de 20-
jarige mannen in dat jaar
H-teX normaal verdeeld was. Hoe?
b. Welke verklaring kun je voor die afwijking bedenken?
c. Geef een schatting van de gemiddelde lengte en de S.D. (beide
in cm) van de Nederlandse twintigjarige mannen en vrouwen in
1980.
-ocr page 45-
41
s
SPREIDING BIJ KANSVERDELINGEN
tf
g^
0.15
o.isr -
0.1 ,
0.1
O.o$ .
6.0?
23-4S-67<?g
fo 7f fi
3 -4 s- 6
£3i
0.1
• 9
j
of
0.OS-
0,05 ■
"1
-
X
CL
~L
J_i
3 1 5 b 7 5 3
13 H <y i fa 17 (7
4 f 4 T ? J to » l» 15 '1 >$"'(. n iSijZoliii »5 *1
IO II II
Kanshistogrammen voor het werpen met resp. 1, 2, 3, 4 dobbelstenen,
waarbij gelet wordt op de som van de aantallen ogen.
-ocr page 46-
42
»56. Er wordt geworpen met hoogstens vier (van elkaar te onderschei-
den) dobbelstenen. De ogenaantallen die boven komen zijn resp.
a. Bereken: P(XX=6), P(X1+X2 = 12), P(XX + X2 + X3 = 18) ,
P(X1+X2+X3 +X4 = 24).
b. Bereken ook: P(X1+X2=6), P(X1 + X2 + X3 = 6) ,
PCX. + X2 + X3+X, =6).
Op biz. 41 zie je de kanshistogrammen van Xi, Xi + X2 (=5),
X1+X2+X3(=T) en X1+X2+X3+Xlt (=U) .
Net als bij steekproefverdelingen zijn 'gemiddelde' en 'spreiding' bij
zo'n kansverdeling belangrijke grootheden.
Voor wat betreft 'gemiddelde' is het een oud verhaal. Als je een groot
aantal keren met een dobbelsteen werpt, kun je verwachten dat je in g
van het aantal beurten 1, in f van het aantal beurten 2, enz. werpt.
Het 'verwachte gemiddelde' is dus:
1 •£ + 2-1 + 3-i + 4-f + 5-£ + 6-i = 3,5
Bij dit experiment heb je natuurlijk ook een zekere verwachting met
betrekking tot de standaarddeviatie van de uitkomsten.
Immers: in §■ van het aantal beurten kun je een 'zes', dus een afwijking
van 2| van het gemiddelde verwachten, in f van het aantal beurten een
afwijking van 1|, enz.
-ocr page 47-
43
In tabelvorm:
LuXkomAt
afauiijking van
gemiddelde {=3i)
g ekwadAateeA.de
afawijkA.ng
featti
1
-21
6*
i
t
2
1 2
2^
i
IT
3
J.
2
l
4
i
6
4
1
1
4
1
6
5
1 2
2^
1
6
6
21
Z2
6*
1
6
»57. Reken na dat de verwachte gemiddelde ge.kwadJuvte.eAdz afawi.jkA.ng ge-
lijk is aan 2 j\ .
Hoe groot is de verwachte 6tandaaAddevi.ati.e (in 3 dec.)?
AFSPRAKEN:
- Het 'verwachte gemiddelde' van een stochast X noemt met de
veAwachting^waaAde van X.
Notatie: E(X) of y.,.
- De 'verwachte gemiddelde gekwadrateerde afwijking' van X, dus
het verwachte gemiddelde van (X-y.,)2, noemt men de
VOAcantXe
van X.
Notatie: Var(X).
- De 'verwachte standaarddeviatie' van X, dus de vierkantswortel
uit de variantie, noemt men kortweg de
&tandaaAddev<La£ie van X.
Notatie: SD(X) of 0,,.
OpmeAking:
De 'variantie' wordt niet als spreidingsmaat gebruikt, maar als tussen-
stap bij het berekenen van de S.D.
-ocr page 48-
44
Voor Xx (= aantal ogen bij werpen met een dobbelsteen) geldt dus:
E(X.) = § =3,5
Var(Xj) = ff « 2,917
SD(XX) = /ff « 1,708
» 58. Werpen met twee dobbelstenen.
Bekijk r.u de stochast X + X, (=5).
a. Verklaar: E(5) = 7.
b. Maak een tabel als bovenaan biz. 43 en bereken Var(S).
c. Bereken ook: SD(S).
De verwachtingswaarde van Xj +K? kun je op drie manieren vinden:
- Recht toe, recht aan berekenen:
E(X1+X2) = 2-^ + 3-£ + 4-& + .... + 12.^ = 7.
- Toepassing van de 'somregel' van verwachtingswaarden:
het verwachte aantal ogen is voor de eerste, zowel als de tweede
steen 3j, de verwachte gemiddelde som is dan 3? +3| =7.
Of in formule: E(X1+X2) =
E(K%) + E(X2) .
- Gebruikmaking van de symmetric van de kansverdeling:
7 is het middelste getal tussen 2 en 12 (zie het histogram op biz. 41).
De vraag is nu of je ook de variantie handig had kunnen vinden.
Als je opgave » 58b goed hebt berekend, kun je inzien dat geldt:
Var(X1+X2) = VarCXj) +Var(X2). (5f = 2^ + 2#) .
De verklaring hiervoor is veel minder eenvoudig dan bij de 'somregel' voor
het gemiddelde.
Sterker: de regel gaat niet altijd op!
De volgende opgave levert een tegenvoorbeeld.
-ocr page 49-
45
» 59. Noem het aantal ogen dat bovzn komt bij een dobbelsteen: X en het
aantal ogen dat
ond&i komt: y\
a. Wat weet je (zeker) van X+ VI
b. Verklaar: Var(X+V)=0.
c. Hoe groot is Var(X) +Var(yO ?
In het voorbeeld van opgave » 59 zijn de stochasten X en V duidelijk niet
onafhanke1ij k.
Dat wil zeggen: de kans op een uitkomst van V wordt beinvloed door de uit-
komst van X.
P(y=l)=f, maar bijvoorbeeld: P(y'=l|X = 5) =0.
Voor afhankelijke stochasten hoeft de somregel voor varianties dus niet
*)
te gelden; voor onafhankelijke stochasten echter wel!
Als
A en B onaf hanke 1
ijke
stochasten
zijn,
dan
Var(A + 8)
= Var(A)
+ Var(B).
De
somregel gt
:ldt ook
voor
drie
of
meer ona
fhankelijke
stochasten!
»60. In opgave » 58 heb je SD(X1+X2) uitgerekend.
Geldt: SD(XX+X2) - SDCX^ + SD(X2)?
»61. Werpen met drie dobbelstenen. T = Xi + X2 + X3.
Bereken (zo handig mogelijk): E(T), Var(T), SD(T).
*)
Twee stochasten A en B noem je onafhankelijk als de kans op een uitkomst van A niet beinvloed wordt
door de uitkomst van B.
In formule: P(A = k|8 = m) = P(A = k) voor alle uitkomsten k en m van resp. A en 8.
-ocr page 50-
46
»62. Vier dobbelstenen. U = Kx + X2 + X3 + X^ .
Bereken E(U), Var(U), SD(U).
»63. Vergelijk de kanshistogrammen van Xi, Xi+X2, Xi + X2 + X3 en
Xi+X2+ X3 +X4. (Zieblz.41).
De standaarddeviatie is een maat voor de spreiding van de uitkoms-
ten. Dat deze spreiding groter wordt bij toename van het aantal
dobbelstenen is niet geheel onverwacht. Het aantal mogelijke uit-
komsten neemt immers toe, als je met meer dobbelstenen werpt.
Sto cheat
BeAe^fe
' SpfioMUviQi, bn.o.e,d£<L'
Xi
{1,2,...,6}
5
Xi+X2
{2,3,...,12}
10
X1 +X2 +X3
{3,4,...,18}
15
X3. +X2 + X 3
+ x4
{4,5.....24}
20
De spreidingsbreedten verhouden zich als 1, 2, 3 en 4.
Hoe verhouden de respectievelijke S.D.'s zich?
»64. Het maakt een groot verschil of je te maken hebt met de stochas-
ten Xi, Xi+X2, Xx+X2+X3, enz. of met Xx, 2X1, 3Xi, enz. !
Xi +X2 = 8
2Xi = 10
a. Teken het kanshistogram voor 2X1.
b. Ga na dat 2Xi, 3X1 en 4Xi dezelfde verwachtingswaarden hebben
als Xi + X2, Xi+X2+X3, X1 + X2+X3 +X4.
c. Hoe verhouden de S.D.'s van Xi, 2Xi, 3Xi en 4Xi zich?
-ocr page 51-
47
»65. X is een stochast waarvan bekend is: E(X) = 10, Var(X) = 4 en
SD(X) = 2.
---------------1—i—I—i i—i—i—i—i—i—i—i—I—i—i—i—i—i—i—
6 7 8 9 10 11 12 13 14
Bereken E(i0, Var(^) en SD(V0 in het geval:
a.    V = X + 2                                            c. V = -X
b.    V = 3X                                                  d. V = X - 3
»66. In een vaas zitten balletjes met nummer 1 tot en met 5.
Iemand trekt zonder teruglegging twee balletjes
uit de vaas.
Het nummer op het eerste balletje noemen we
Xi, dat op het tweede X2.
a. Hoeveel verschillende trekkingen zijn er
mogelijk? Schrijf alle mogelijkheden op.
b. Bereken VarCXJ, Var(X2) en Var(X!+X2).
c. Waarom geldt hier niet: Var(Xi+X2) =Var(Xi) +Var(X2)?
d. K. is het kleinste nummer van de twee getrokken balletje.
Bereken E(K) en SD(K).
»67. Nog een keer twee dobbelstenen. We letten nu op het verschil van
de aantallen ogen van de eerste en de tweede steen: l/ = Xi-X2.
a. Geef de complete kansverdeling van V.
b. Bereken E(l/) , Var((/) en SD(l/) .
c. Welk verband bestaat er tussen Var(Xi-X2), Var(Xi) en Var(X2)?
d. Kun je dat verklaren zonder dat je die varianties stuk voor
stuk hebt uitgerekend? (Aanwijzing: Xi - X2=Xi+ (-X2)).
-ocr page 52-
48
»68. Asterix werpt tien Romeinse geldstukken omhoog en telt het aantal
'koppen' dat boven komt (=X).
Stel je voor dat hij dit experiment een groot aantal keren uit-
voert. Wat is het gemiddelde aantal 'koppen' dat hij kan verwach-
ten, m.a.w. hoe groot is E(X)?
De vraag is nu: welke spreiding kan Asterix verwachten in de aantallen
'kop', m.a.w. hoe groot is SD(X)?
Er staan verschillende wegen open om die standaarddeviatie te bepalen:
- Je voert het experiment een groot aantal keren uit, bijv. door middel
van een computersimulatie en berekent de S.D. (Zie biz. 49).
- Je gebruikt de binomiale tabel voor n= 10 en p = 0,5 voor de kansen
P(X=0), P(X=1), enz. te vinden.
Daarmee bereken je dan de S.D.
- In plaats van de tabel, gebruik je de kansformule: P(X=k)= C?)'^10
»69. Welk van die drie methoden levert het meest exacte antwoord op?
Welke zal het minst nauwkeurig zijn?
Alle drie de methoden zijn nogal bewerkelijk.
Gelukkig is er een veel kortere.
Net als bij de dobbelstenen kun je handig gebruik maken van de 'somregel'
bij varianties. Daartoe voer je de stochasten Xls X2, ..., Kx in.
Door alle 'enen' en 'nullen' in een reeks-van-tien op te tellen, vind
je X. De stochasten Xx, X2.....X10 hebben allemaal dezelfde verwach-
tingswaarde (nl. J»0+|»1=0,5) en dezelfde variantie (nl. i • (-0,5)2 +
WO,5)= =0,25).
» 70. Bereken nu: Var(X) en SD(X). Klopt dat met het resultaat van de
computersimulatie?
-ocr page 53-
49
COMPUTEROUTPUT
Reeks
Waarde van
X
1011000001
4
1000111011
6
0110100101
5
101OOOOO10
y,
0111001001
5
111OOOO110
5
1010001001
4
0101010100
4
0001100000
.2
0000001010
*■■)
0100010100
.\
1110110101
7
1OOOO11010
4
1111100010
6
0000001011
y>
1010111001
6
1000111100
5
1001010010
4
1110110011
7
0111111101
8
1011010111
7
01000 111 00
4
1101000010
4
11111OOOO1
6
1111101111
9
100111OOOO
4
0110111010
6
0100000111
4
1110010110
6
0010100111
5
011011OOOO
4
1100100101
5
1100100101
5
1101011100
6
1101001010
5
0101000000
/■-j
0000101111
5
1 110011001
6
1010110111
7
0111101011
7
0011101100
5
0100010111
5
1010011000
4
0101011100
5
0111011111
S
10101OOOO1
4
1001111011
7
1 100000001
,^>
0011010010
4
0111111101
a
Reeks
Waarde van
X
1001011101
6
0100000010
'">
111OOOO101
5
00011OOOO1
•3
0101111111
s
0010011011
5
1110010110
6
011101OOOO
4
OOOOO111 00
r**i
1111001010
6
1OOOOO1010
r^i
Oil 1100000
4
0011100000
■3
0111101111
8
1000011111
6
0 111000100
4
1000101011
5
0001111010
5
0000101101
4
1101110010
6
1101010111
7
1110100111
7
0011100111
6
1100110100
5
1001010100
4
0111110111
8
0001101110
in
0110100110
5
00111 00100
4
0011110010
5
01 11010001
5
1001111100
6
0010000001
O
0101110001
5
1101000101
5
1100101110
6
0000010010
OOOOO11110
4
1100101110
6
0000001101
■ll
1111000101
6
0100101100
4
0111001110
6
1011101100
6
1100000110
4
1110110010
6
0001101011
5
0001000111
4
11011OOOO1
5
1011011111
8
gemi ddelde:
st.devi ati e:
5. 03
1.56496
-ocr page 54-
50
s>71. Bereken de S.D. van het aantal keren 'kop' (=U) bij het werpen
met 100 muntstukken.
» 72. a. Druk de standaarddeviatie van X (opgave » 70) en U (opgave
» 71) uit in % van het aantal munten dat je werpt.
b. Doe hetzelfde ook voor het werpen met 1000 muntstukken.
c. Is het 'logisch' dat de procentuele spreiding afneemt bij toe-
name van het aantal muntstukken?
» 73. Bij een vierkeuzewerk worden 40 vragen op de gok beantwoord.
X is het totaal aantal goede antwoorden (de 'score').
a. Xi is de serie bij de eerste vraag.
Laat door berekening zien dat: E(Xi) =0,25 en Var(Xi) =0,1875.
(Maak een tabel als op biz. 43).
b. Bereken E(X) en SD(X).
We letten
op een binomiaal
experiment
met parameters
n
en p.
Dat wil zeggen:
- een uitkomstenreeks bestaat uit n onafhankelijke ui
.tkomsten
'sue-
ces' of
'mislukking';
- de kans
op 'succes' is p
en de kans
op 'mislukking'
1
-P ( =
q).
We noemen
het aantal successen: X.
Voor het
gemiddelde' en de
'spreiding' van de stochast
X gelden
de
volgende formules:
E(X) =
Var(X) =
SD(X) =
np
npq
/npq
» 74. Controleer of deze formules kloppen met je uitkomsten bij opgave
» 71 en » 73.
-ocr page 55-
".1
AFLEIDING VAN DE n-p-q-FO'RMULES
We voeren de hulpstochasten Xi, X2, ..... X in met;
~\-'
k uuitkomt
(k = 1, 2, ..., n)
mLbiukkisfiQ
\-°
X =Xi+X2 + ...+X = totale aantal successen.
n
Kijk nu eerst naar Xi
E(Xi) = q-0 +p«1 = p
0 1
We berekenen nu de gemiddelde gekwadrateerde afwijking van Xi:
iUXkomit
afawl jiving
van gem.
gekwadsi.
a^M-ijk-lng
kam
0
1
~P
1 - p = q
P2
q2
p
q
Dus: Var(Xi) = q*p2 +p*q2 = pq(p + q) = pq*1 = pq
Hetzelfde geldt natuurliik voor X2, ... X .
Uit de somregel voor verwachtingswaarde en variantie volgt nu:
E(X) =p + p+...+p=npen Var (X) = pq + pq + ... + pq = npq.
-ocr page 56-
52
SAMENVATTING
Bij het berekenen van de (verwachte) 6tandaaxdddVAXutLe. van de stochast
X is het vaak handig om als tussenstap de VClAAJlYVtie. te berekenen.
Kan X de waarden Xi,X2, . ..,X aannemen, resp. met kansen pi,p2, ....,
p en geldt: E(X) = y, dan:
Var(X) = pi«(Xi - y)2 + p2'(x2 - y)2 + ... + p • (x - y)2
ofwel:
n
Var(X) = I p.(x. -y)2
i = 1 x L
De standaarddeviatie van X wordt dan gevonden uit:
SD(X) =/Var(X)
Zijn X en V onCLfahankeJLijk.il stochasten, dan kan behalve de verwachtings-
waarde van X +
V ook de variantie van X+ V met behulp van de zgn. somre-
gel worden gevonden:
Var(X+ V) =Var(X) + VarCV)
Tussen de standaarddeviaties van X, Y en X + Y bestaat een wat ingewikkel-
der verband:
SD(X + V) = /SD2(X) +SD2(V)
Deze regels gelden i.h.a. niet in het geval dat X en Y afhankelijk zijn!
Voor een binomiale stochast X met parameters n( =aantal 'beurten'),
p(=kans op succes) en q(=kans op mislukking) geldt:
E(X) = np en SD(X) = /npq
-ocr page 57-
53
6
DE NORMALE BENADERING VAN KANSEN
              
                     
*0.....
       ••••••
       ••••*•«
o
oo
oo
ooooooooooooo
oooooooooooooo
oooooooooooooooo
ooooooooooooooo
ooooooooooo
ooooooooooo
ooooo
oooo
oo
oo
oo
oo
oo
o
o
oo
oo
oo
oo
oo
oo
oo
oo
oo
oo
oo
oo
oo
OO
oo
oo
oo
oo
oo
oo
oo
o
o
Sir Francis Galton (England. 1822-1911)
Biometrika, \W1.
De kogeltjes op het bord van Galton verdelen zich, na een zig-zag-weg
tussen de pinnen, volgens een bijkans normale kromme. Hoe meer pinnen-
rijen er worden aangebracht hoe 'normaler' die verdeling gaat lijken ..
» 75. Het bord van Galton demonstreert een binomiaal kansexperiment.
Wat zijn de parameters (p en n) in de situatie op het plaatje?
-ocr page 58-
54
In een vaas zitten drie balletjes met daarop de nummers
1, 2 en 9. Er wordt,
moX teMiglo.ggi.ng, een aantal keren
(zeg n) een balletje uit de vaas getrokken. Het nummer
van het eerste balletje noemen we Xi, van het tweede bal-
letje X2, enz.
De getrokken nummers worden opgeteld. De som van die nummers is een sto-
chast 5 .
n
Dus:
Xi + X2 + ... + X .
n
Hieronder zie je de kanshistogrammen van S25, S50 en Si
00
120 130 MO 150 1G0
waarde van de som (S25)
n = 50
125
150
200
225                     250                    275
waarde van de som (S50)
175
n= 100
275 300 325 350 37S 100 125 ->50 175 500 525
waarde van de som (Sioo)
Je ziet dat bij een toenemend aantal balletjes de verdeling van de som
S steeds beter gaat lijken op de normale verdeling!
-ocr page 59-
5 3
» 76. a. Geef de kansverdeling van S2 ( = som van de nummers bij trek-
ken van twee balletjes) en teken het bijbehorende kanshisto-
gram.
b. Dezelfde opdracht voor S3.
» 77. Bekijk de figuren op biz. 54.
a. Behalve de normale 'trend' vertonen de histogrammen voor n=25
en n=50 een bijna periodiek beeld.
Hoe groot schat je de 'periode'?
Kun je dat verklaren uit de samenstelling van de vaas?
b. De histogrammen van Sz en S3 bestaan uit geisoleerde 'bergjes'.
Die van S25 lijkt een aaneengesloten 'bergketen' te zijn. Al
zie je dat niet in de figuur, toch kun je weten dat het histo-
gram van S25 00k geisoleerde bergjes bevat!
Waarom?
c. Enig idee waarom die losse bergjes niet getekend zijn?
» 78. a. Bereken de verwachtingswaarde en de standaarddeviatie in het
geval je een nummertje uit de vaas {1,2,9} trekt. (We noemen
dit wel: de verwachtingswaarde en de SD van die vaas).
b. Bereken hieruit de verwachtingswaarde en de standaarddeviatie
van 525, 550 en Si 00•
c. Controleer je antwoorden op vraag b. in de drie histogrammen.
» 79. We vervangen het nummer 9 in de vaas {1,2,9} door het nummer 3.
a. Welke invloed zal dat hebben op het histogram van S25 denk
je?
b. Schets de normale kromme die de verdeling van S25 in dat geval
benadert. (Denk aan de getallen bij de horizontale as!).
-ocr page 60-
56
Kansexperimenten laten zich meestal gemakkelijk 'vertalen' in het zgn,
vacumoddL.
Neem bijv. het werpen met een aantal dobbelstenen.
Je trekt een aantal keren (met teruglegging) een
balletje uit een vaas, gevuld met de nummers 1 tot
en met 6.
S is opnieuw de som van de getrokken nummers bij het trekken van n
balletjes.
jn
1
r
LL
r*
JM> .III                     itl .ll. ,1.1 I I ll l.ll          I
3 1 5 t> -j 8 ^ io ii ii
rmt
3 4 5" t, 7 8 31011
12
MeAfe op:
De histogrammen van Sz, S3, Sit, ... vertonen in het geval er getrokken
wordt uit de vaas {1,2,3,4,5,6} heel wat eerder gelijkenis met de nor-
male verdeling dan bij de vaas {1,2,9}.
Het histogram voor n = 4 ziet er al aardig klokvormig uit, terwijl in
het geval van de vaas {1,2,9} je in het histogram voor n=50 nog dui-
delijke afwijkingen van de normale kromme kunt constateren!
35
»80.
1296 '
b. Verwachtingswaarde en S.D. van de vaas {1,2,3,4,5,6} zijn resp,
3,5 en
/I x 2^ =3,42.
Op grond hiervan had je de kans P(Si| i 7) kunnen schatten op
2^%. Leg dat uit.
-ocr page 61-
57
»81. Nu het bord van Galton, ofwel de binomiale verdeling met n= 10
en p = |. Hieronder is de cumulatieve tabel van deze kansverdeling
afgedrukt.
n =
10, p= J
k
P(XS k)
0
0,0010
1
0,0107
2
0,0547
3
0,1719
4
0,3770
5
0,6230
6
0,8281
7
0,9453
8
0,9893
9
0,9990
10
1
a. Maak een cumulatieve grafiek van deze kansverdeling op normaal-
waarschijnlijkheidspapier.
(N.B. Schrijf bij de 'meetpunten' op de horizontale as niet 0,
1, 2, 3, enz. maar 0,5; 1,5; 2,5; enz.
b. Lees uit die grafiek de verwachtingswaarde en de standaardde-
viatie van de verdeling af.
c. Controleer je antwoorden bij b met behulp van de n-p-q-for-
mules.
Ook de binomiale verdeling met n = 10 en p =| kun je vertalen in het vaas-
model: 'trek tien keer (met teruglegging) een balletje
uit de vaas {0,1} en tel de nummers op'.
In opgave > 81 is gebleken dat ook in dit geval de verdeling van de 'som'
goed lijkt op de normale verdeling.
»82. Ook een binomiaal experiment met bijv. n = 50 en p = 0,2 kan worden
vertaald in het trekken van nummertjes uit een vaas.
a. Hoe zou je die vaas samenstellen?
b. Ga met behulp van de binomiale tabel na of de kans dat het
aantal successen minder dan 2 S.D. afwijkt van de verwachtings-
waarde ongeveer 95% is.
-ocr page 62-
58
DE CENTRALE LIMIETSTELLING
Er geldt:
Bij het aselect trekken (met teruglegging) van een aantal nummertjes
uit een vaas, zal de 6om van de. nummeAXjeA een verdeling hebben die
lijkt op de normale verdeling.
Die gelijkenis wordt sterker naarmate het aantal nummers dat getrokken
wordt groter is!
Deze regel staat in de statistiek bekend als de ce.ntH.atz limietitettlng,
S = Xi+X2+ ... +X
Nog wat algemener geformuleerd luidt de stelling:
Wanne.eA een aantal ona&kankeZijke Atockaiten btj eZkaaft wohxit opge-
teZd, dan goat
de vexdeLLng van de £>om beteA Lijken op een nohmate
veA.deZi.ng, naanmate het aantal tenmen gfioteA wohdt.
OpmeAkingen:
1. Behalve het aantal balletjes heeft ook de samenstelling van de vaas
invloed op de mate van gelijkenis met de normale verdeling.
Bij een 'onregelmatige samenstelling' (zoals {1,2,9}) zal het aan-
tal te trekken balletjes groot moeten zijn om de normale verdeling
redelijk te benaderen.
-ocr page 63-
59
2. Met de centrale limietstelling kan ook worden verklaard waarom de
normale verdeling zo vaak in de natuur voorkomt.
Neem bijv. de lichaamslengte. Die wordt beinvloed door een groot aan-
tal 'kansfactoren' tengevolge van erfelijkheid en milieu.
De lichaamslengte kan worden opgevat als de som van een aantal min
of meer onafhankelijke stochasten en is dan volgens de centrale li-
mietstelling normaal verdeeld.
Als gevolg van de centrale limietstelling zijn binomiale kansen te bere-
kenen (eigenlijk: te benaderen) via de normale tabel.
Voor p=i is die benadering al gauw nauwkeurig.
Voor p ^ I, bijv. p = 0,2, is de binomiale verdeling voor kleine waarden
van n nog 'scheef' en moet n tamelijk groot zijn, wil de normale bena-
dering enige nauwkeurigheid hebben.
(De vaas met twee 'enen' en acht 'nullen' is niet erg regelmatig samen-
gesteld!).
Vergelijk de histogrammen:
P = 0,5
o.s
0.4
0.3
0.2
0.1
0
0.4
0.3
0.2
0 1
0
0.4
0.3
0.2
0.1
0
n = 2
n=16
Pill.
m
0 2 4 8 8 101214
0 2
0 2 4
0 2 4 6 8
P = 0,2
0.5
0.4
0.3
(1.2
0.1
0
0.4
0.3
0.2
0.1
0.4
0.3
02
0.1
0.4
0.3
n-40
n = 20
n-5
02
Ir
0 2 4
0.1
lllllllll...
TTTff^
0 2 4 6
0 2 4 6 8 10
0 2 4 6 8 10121416
-ocr page 64-
60
Tot 'op zekere hoogte' kun je binomiale kansen berekenen met de normal
verdeling.
Dat is een groot voordeel, omdat je nu eenmaal niet over binomiale ta-
bellen voor alle waarden van n en p kunt beschikken, terwij1 je voor
alle normale verdelingen met een standaard-tabel (de 0-tabel) kunt vol
staan!
Als voorbeeld nemen we een geval dat in onze binomiale tabel te vin-
den is: n=100, p = 0,2.
Volgens de binomiale tabel geldt: P(Xi 25) = 0,9125.
Om deze kans met de 0-tabel te kunnen berekenen, moet er eerst wor-
den gestandaardiseerd! Daartoe berekenen we p( =E(X) en a ( =SD(X)).
12
24
20
u = n«p = 20
a = /npq = / 16 = 4.
„ . , X - y X-20
S
a 4 -2 -1 c
Z is bij benadering standaard normaal verdeeld,
P(XS 25) = P(XS 25,5) -«------
= P(Z<^*)
= 0(1,375)
w 0,91545 -«-
Je ziet: een afwijking van niet meer dan 0,003 met 0,9125!
OpmoAk-LYiQ :
Bij vervanging van 25 door 25,5 spreekt men wel van een contA.nuZZe.-iXA-
C0HJ12.CJU.Q..
-ocr page 65-
61
Aan de hand van onderstaand plaatje kun je gemakkelijk verklaren waarom
die continuiteitscorrectie een nauwkeuriger antwoord oplevert.
P(X ^ 25) is gelijk aan de oppervlakte van het histogram tot en met de
'balk' bij 25 en dit komt overeen met de oppervlakte onder de normale
kromme tot 25,5.
Voor erg grote waarden van n is de invloed van de continuiteitscorrectie
gering. In zulke gevallen laat men het toepassen van de continuiteits-
correctie soms achterwege. In het algemeen is het veiliger om de correc-
tie wel toe te passen.
»83. Ga na welk resultaat je met de $-tabel had gekregen zonder toepas-
sing van de continuiteitscorrectie.
» 84. Bereken m.b.v. de standaard-normale tabel:
a. P(X^20) in het geval: p = 0,4; n = 50.
b. P(XS320) in het geval: p = 0,75; n= 400.
c. P(X= 12) in het geval: p = 0,5; n = 25.
»85. Volgens de politie is bij een van de vier fietsen het achterlicht
niet in orde. Bij een steekproef worden 60 fietsen gecontroleerd.
Hoe groot is de kans dat van tenminste 20 fietsen het achterlicht
niet goed functioneert?
-ocr page 66-
62
»86. Het trekken van tien balletjes (met teruglegging) uit een vaas
met een wit en een zwart balletje werd met de computer 10000 keer
gesimuleerd.
Dit leverde de volgende frequentie-tabel op:
simulatie balletjes trekken
gemiddelde: 5.0041
st.deviatie: 1.575272
frekwentie tabel bij het 10OOO keer trekken van lOballetjes uit een vaas met 1
witte balletjes en
1 zwarte balletjes
o
i
6
78
453
1231
1997
4
5
6
7
B
9
10
Welke frequentie had je volgens de normale tabel bij '5 witte
bqiT-tjes' kunnen verwachten? En volgens de binomiale tabel?
eerste 3000 geboorten in 1962 in Graz (Oostenrijk) waren
er 1578 jongens.
Hoe groot is de kans op tenminste 1578 jongens bij 3000 geboor-
ten, als je aanneemt dat er gemiddeld evenveel jongens als meis-
jes worden geboren?
» 88. In 1976 werden er in Nederland ca 177.000 kinderen geboren. Vol-
gens statistieken is de kans op een jongensgeboorte in ons land
51,5%.
a. Welk aantal jongensgeboorten had men in dat jaar kunnen ver-
wachten?
b. In werkelijkheid waren er ongeveer 91.000 jongens- en 86.000
meisjesgeboorten. Hoe bijzonder is dit, m.a.w. hoe groot had
je bij voorbaat de kans op
n-ieX mceA dan 91.000 jongensgeboor-
ten kunnen schatten?
-ocr page 67-
63
»89. Een bedrijf koopt zekeringen in partijen van 8000 stuks. Bij aan-
komst van zo'n partij wordt een aselecte steekproef van 50 stuks
aan keuring onderworpen.
Als alle 50 exemplaren van de steekproef deugdelijk zijn, wordt
de partij geaccepteerd, anders niet.
Aan het bedrijf wordt een partij toegestuurd, waarvan 5% niet aan
de eisen voldoen.
a. Hoewel er hier zonder teruglegging wordt getrokken, maak je
slechts een kleine fout als je doet alsof er met teruglegging
wordt gekozen. Waarom?
b. Bereken de kans dat zo'n partij van 8000 stuks wordt geaccep-
teerd.
» 90. Iemand werpt 200 dobbelstenen.
a. Hoe groot is de kans dat hij een totaal van ten hoogste 675 ogen
gooit?
b. Bij 50 van de 200 stenen is het resultaat een zes.
Vind je dit resultaat erg toevallig?
(Aanwijzing: bereken de kans op tenminste 50 zessen).
»91. Een basketballspeler zegt dat hij bij 80% van zijn af standschoten
doel treft. Zijn trainer beweert dat het schotpercentage van de be-
wuste speler 60% is. Ze spreken af dat, als de speler kans ziet met
tenminste 70% van zijn schoten tijdens de eerstvolgende tien wedstrij-
den te scoren, hij van zijn trainer gelijk krijgt. Scoort hij minder
dan wordt de trainer in het gelijk gesteld.
Hij blijkt in die tien wedstrijden 90 keer van afstand te hebben
geschoten.
a. Hoe groot is de kans dat de speler gelijk krijgt, terwij1 de
trainer het bij het rechte eind had?
b. Hoe groot is de kans dat de trainer ten onrechte gelijk krijgt?
-ocr page 68-
64
»92. Experiment: n keer werpen met een geldstuk.
Uitkomst waar op gelet wordt: het aantal keren 'kop' (=X ).
a. Ga na: E(X) = ^n en SD(X) = ^.
b. Met behulp van een bekende vuistregel kun je schatten dat de
kans op een resultaat tussen 40 en 60 keer 'kop' bij 100 wor-
pen ongeveer 95% zal zijn.
Leg dat uit.
c. Hoe groot schat je bij honderd worpen de kans op een resultaat
tussen 45 en 55 keer 'kop'?
»93. Experiment als in opgave »92,
Iemand beweert: de kans dat het aantal keer 'kop' tussen 49% en
51% van het totale aantal (=n) worpen ligt, is gelijk aan 0,95.
Hoe groot is n? (Gebruik de vuistregel).
John Kerrick bracht zijn tijd van gevangenschap in de Tweede Wereld-
oorlog door met het uitvoeren van een kansexperiment: hij toste tien-
duizend keer met een geldstuk en noteerde regelmatig het aantal keren
'kop'.
htumb&n
UumbeA
oi
oi
to&bQA
huad-i,
10
4
20
10
30
17
40
21
50
25
60
29
70
32
80
35
90
40
100
44
200
98
300
146
400
199
500
255
600
312
700
368
800
413
900
458
1000
502
2000
1013
3000
1510
4000
2029
5000
2533
6000
3009
7000
3516
8000
4034
9000
4538
10000
5067
Resultaat:
~ -s
100                                           1000
NunBER OF TOSSES
10000
De grafiek van het experiment van John Kerrick
illustreert prachtig de 'wet van de grote ge-
tallen': als je een kansexperiment erg vaak uit-
voert, zal het gemiddelde aantal 'successen' in
de buurt komen van de theoretische kans.
-ocr page 69-
65
De sterke invloed van het aantal kan worden verklaard uit het feit dat
de S.D. van het aantal successen bij toenemende n niet evenredig is
met n, maar met vn.
Bij 10000 worpen betekent dit het volgende.
Stel X = het aantal keer 'kop' en V = rK7>K7\ (= de relatieve frequentie
van het aantal keer 'kop').
Er geldt: E(X) = 10000 • \ = 5000
SD(X) = 100 • | = 50
En dus: E(!0 = ~~        = 0,5 (50%)
SD(/) = imo = °'005 (0»5%)
Volgens de statistische vuistregel is er een kans van ongeveer 95% dat
het resultaat niet meer dan 0,01 (= 2 SD) van 0,5 afwijkt.
Kerricks resultaat voldeed hier ruimschoots aan.
»94. Hoe groot is de 95%-marge bij 5000 keer uitvoeren van het expe-
riment.
Vergelijk Kerrick's resultaat met je antwoord.
In bovenstaand voorbeeld heb je gezien dat bij toenemende n de spreiding
van het gemiddelde aantal successen afneemt.
lets preciezer:
de SD van het gemiddelde aantal successen is omgg.ke.eAd eve.Ylh.e.di.Q met de
wortel uit het aantal beurten.
In het voorbeeld:
De SD van het gemidd. aantal successen bij 1 beurt = 0,5.
De SD van het gemidd. aantal successen bij 10000 beurten = ' = 0,005,
/Toooo
0 5
De SD van het gemidd. aantal successen bij 5000 beurten =
' = 0,007.
/5000
-ocr page 70-
66
SAMENVATTING
Centnate. llmZeXAteltlng:
De kansverdeling van de som van een aantal onafhankelijke stochasten
kan worden benaderd met de normale verdeling.
KinomlaZe veAde-tlng be.nad.eAd doon iitandaaxd-nonxnate ve/tdeZing:
Binomiale kansen kunnen dus met de $-tabel worden benaderd.
Daarbij moet je de stochast X met parameters n en p eerst standaardi-
seren:
X - np
(q = 1 - p)
/npq
Bij gebruikmaking van de continuiteitscorrectie geldt dan bijvoorbeeld:
P(X<k) = $(Mi3P)
\ /npq /
P(X^m) = 1 -^(m^~np
s v^pq
S. - uieX:
Bij toename van het aantal beurten (=n) bij een binomiaal experiment
neemt de SD van het aantal successen evenredig toe met
/n.
De SD van het gemiddelde aantal successen per beurt is dan omgekeerd
evenredig met
/a.
-ocr page 71-
67
/
GEMENGDE OPGAVEN
»95. Van de 20-jarige inwoners van een zeker land behoort 48% tot het
vrouwelijk geslacht.
De gemiddelde lengte van de 20-jarige vrouwen is 170 cm met een
S.D. van 6 cm.
Voor de 20-jarige mannen zijn die gegevens resp. 180 cm en 8 cm.
a. Hoeveel % van alle 20-jarige inwoners van dat land zal langer
zijn dan 1,76 cm?
b. Laat het getal L (in cm) een lichaamslengte voorstellen.
De kans dat een willekeurig gekozen 20-jarige man \iL<LLYi2A is
dan L is even groot als de kans dat een willekeurig gekozen
vrouw (van 20 jaar)
QK.ot.QJt is dan L.
Bereken L.
» 96. Dezelfde gegevens als in opgave » 95.
Hoe groot is de kans dat een willekeurig gekozen 20-jarige man
langer is dan een willekeurig gekozen vrouw van 20 jaar?
Aanwijzing:
De lengte van een 20-jarige man is een stochast X, die van een
dito vrouw V.
Het lengteverschil X - V ( = I/) is ook een normaal verdeelde sto-
chast.
a. Hoe groot is E(l/)?
b. Verklaar: SD(l/) = 10 cm.
c. Bereken P(l/> 0).
d. Wat is dus de gevraagde kans?
-ocr page 72-
68
» 97. Gegeven zijn de vazen:
X is het nummer van een willekeurig gekozen balletje uit vaas I;
V is de som van twee willekeurig gekozen balletjes uit vaas II.
Hebben X en
V dezelfde kansverdeling? Verklaar je antwoord.
» 98. Volgens een NIPO-enquete bedroeg het aantal aanhangers van een
politieke partij in een zekere stad 20%.
Een NOS-raedewerker vroeg 81 aselect gekozen stemgerechtigden in
die stad naar hun politieke voorkeur.
In zijn steekproef bleken niet meer dan 12 mensen voorkeur voor
genoerade partij te hebben.
De NOS-medewerker trok de uitslag van de NIPO-enquete in twijfel.
Volgens hem zou bij aanname van de juistheid van die 20% de kans
op niet meer dan 12 aanhangers in zijn steekproef kleiner zijn
dan 5%. Had hij gelijk?
»99. Van het Station Utrecht C.S. vertrekken van twee kanten busdiens-
ten (resp. stadsvervoer en streekvervoer) naar het buiten de stad
gelegen universiteitscentrum 'de Uithof. Tussen 09.00 en 09.15
uur komen er 92 mensen per trein aan die van een van beide bus-
diensten gebruik willen maken om een congres in de Uithof te be-
zoeken. Bij beide maatschappijen is voor dat doel een bus met 52
zitplaatsen gereserveerd. Om 09.00 uur vertrekken beide bussen.
Veronderstel dat die 92 mensen elk met kans £ voor een van beide
busdiensten kiezen.
Hoe groot is de kans dat er in een van de twee bussen mensen moe-
ten staan?
-ocr page 73-
69
» 100. Op de veiling van Delft werden ook deze zomer weer veel komkom-
mers aangevoerd. Eigenlijk teveel en op een gegeven moment was
het overschot zelfs 25% van de aanvoer. Het bestuur van de vei-
ling besloot toen, na overleg met de kwekers, de wat kleinere
komkommers niet te laten veilen.
Ga er bij deze opgave vanuit dat de lengte van de aangevoerde
komkommers normaal is verdeeld met een gemiddelde lengte van
50 cm en een standaarddeviatie van 5 cm.
a. Welk percentage komkommers zal een lengte van meer dan 57 cm
hebben?
b. De 25% kleinste komkommers zullen niet worden geveild. Vanaf
welke lengte worden de komkommers geveild?
c. Hoe groot is de kans dat van een aselecte partij van 100 kom-
kommers er tenminste 80 zullen worden geveild?
d. In een kist met 25 komkommers zijn er 7 'onder de maat'.
Iemand pakt aselect 10 komkommers uit de kist.
Hoe groot is de kans dat daar 3 te kleine komkommers bij zijn?
e. Iemand haalt een komkommer uit een kist met geveilde komkom-
mers. In de kans dat die komkommers groter dan 50 cm is klei-
ner dan
\, gelijk aan \, of groter dan |? Licht je antwoord
toe. Hoe groot is die kans precies?
f. Schets in de figuur op het grafiekenblad de lengteverdeling
van de geveilde komkommers. (Gebruik de aangegeven schaalver-
deling).
GKotYitzvzAJLlnQ In 1961 [VeZfit).
____i
-ocr page 74-
70
-ocr page 75-
71
DE VERDELINGSFUNCTIE <P
van de standaardnormale stochast Z, vermenigvuldigd met 10 000.
z
0
1
2
3
4
5
6
7
8
0,0
5000
5040
5080
5120
5160
5199
5239
5279
5319
0,1
5398
5438
5478
5517
5557
5596
5636
5675
5714
0,2
5793
5832
5871
5910
5948
5987
6026
6064
6103
0,3
6179
6217
6255
6293
6331
6368
6406
6443
6480
0,4
6554
6591
6628
6664
6700
6736
6772
6808
6844
0,5
6915
6950
6985
7019
7054
7088
7123
7157
7190
0,6
7257
7291
7324
7357
7389
7422
7454
7486
7517
0,7
7580
7611
7642
7673
7704
7734
7764
7794
7823
0,8
7881
7910
7939
7967
7995
8023
8051
8078
8106
0,9
8159
8186
8212
8238
8264
8289
8315
8340
8365
1,0
8413
8438
8461
8485
8508
8531
8554
8577
8599
1,1
8643
8665
8686
8708
8729
8749
8770
8790
8810
1,2
8849
8869
8888
8907
8925
8944
8962
8980
8997
1,3
9032
9049
9066
9082
9099
9115
9131
9147
9162
1,4
9192
9207
9222
9236
9251
9265
9279
9292
9306
1,5
9332
9345
9357
9370
9382
9394
9406
9418
9429
1,6
9452
9463
9474
9484
9495
9505
9515
9525
9535
1,7
9554
9564
9573
9582
9591
9599
9608
9616
9625
1,8
9641
9649
9656
9664
9671
9678
9686
9693
9699
1,9
9713
9719
9726
9732
9738
9744
9750
9756
9761
2,0
9772
9778
9783
9788
9793
9798
9803
9808
9812
2,1
9821
9826
9830
9834
9838
9842
9846
9850
9854
2,2
9861
9864
9868
9871
9875
9878
9891
9884
9887
2,3
9893
9896
9898
9901
9904
9906
9909
9911
9913
2,4
9918
9920
9922
9925
9927
9929
9931
9932
9934
2,5
9938
9940
9941
9943
9945
9946
9948
9949
9951
2,6
9953
9955
9956
9957
9959
9960
9961
9962
9963
2,7
9965
9966
9967
9968
9969
9970
9971
9972
9973
2,8
9974
9975
9976
9977
9977
9978
9979
9979
9980
2,9
9981
9982
9982
9983
9984
9984
9985
9985
9986
3,0
9987
9987
9987
9988
9988
9989
9989
9989
9990
3,1
9990
9991
9991
9991
9992
9992
9992
9992
9993
3,2
9993
9993
9994
9994
9994
9994
9994
9995
9995
3,3
9995
9995
9995
9996
9996
9996
9996
9996
9996
3,4
9997
9997
9997
9997
9997
9997
9997
9997
9997
3,5
9998
9998
9998
9998
9998
9998
9998
9998
9998
3,6
9998
9998
9999
9999
9999
9999
9999
9999
9999
9
5359
5753
6141
6517
6879
7224
7549
7852
8133
8389
8621
8830
9015
9177
9319
9441
9545
9633
9706
9767
9817
9857
9890
9916
9936
9952
9964
9974
9981
9986
9990
9993
9995
9997
9998
9998
9999