Redactie:
Bert P. M. Creemers (secretaris)
Hans F.M. Crombag
Arie Dirkzwager
Johan Hoogstraten
Leo van der Kamp
Nijs Lagerweij
Wim Meijnen
Robert F. van Naerssen
Roger Parmentier
Robert Jan Simons
Marinus J. M. Voeten
Els Wardenaar
Peter Weeda
Jaargang 9
1984
blblioth-EBK DER
rijksuniversiteit
UTRECHT
VERENIGING VOOR ONDERWIJSRESEARCH
-ocr page 2-Artikelen
Berkel, H.J.M. van, Brink, W.P. van den en Vorst, H.C.M. Beschrijvende modellen
voor de retentie van geleerde tentamenstof 207
Brink, W.P. van den. De itemselectie coëfficiënt f van Van Naerssen 216
Brink, W.P. van den en Mellenbergh, G. J. Woord vooraf 200
Corte, E. de en Lowyck, J. De discussie over het onderzoek van onderwijzen voortge-
zet: Een reactie op Creemers, Knoers en Veenman 34
Delbeke, L. en Sente, A. De houding van laatstejaarsleerlingen uit het Algemeen
Vormend en Technisch Secundair Onderwijs in België tegenover Moderne Vreemde
Talen 97
Deynse, N. van, Smet, M., Henderikx, P. en Neve, H. de. Studietijden en Studieresul-
taten bij Eerstejaars Burgerlijk Ingenieur aan de K.U. Leuven 171
Flier, H. van der, Mellenbergh, G. J., en Adèr, H. J. Een onderzoek naar de effectiviteit
van een iteratieve item bias detectie methode bij groepen met een verschillend
treknivo 61
Gruijter, D.N.M. de. Some reflections on how many choices to choose in multiple
Heerden, J. van en Hoogstraten J. Gesprek met prof. dr. R.F. van Naerssen 201
Hofstee, W.K.B. Een interpretatie van de viervelden correlatie, en een nagekomen
commentaar op de Taylor-Russell-tabellen 230
Holleman, J. W. Handvatten voor de behandeling van de studieduur 292
Jong, T. de en Ferguson-Hessler, M. G. M. Strategiegebruik bij het oplossen van
problemen in een semantisch rijk domein: Electriciteit en magnetisme 3
Jonge, J. de. De school- en beroepsloopbaan van KMBO- en BBO-leerlingen 49
Koele, P. Enkele opmerkingen betreffende het gebruik van Fisher's Z-transformatie
van product-moment correlatie-coëfficiënten 235
Linden, W.J. van der. Over absolute en nog relatievere zak-slaag beslissingen 243
Mellenbergh, G. J. Van zielsmeting bezield 253
Molenaar, I. W., & Sijtsma K. Internal consistency and reliability in Mokken's non-
parametric item response model 257
Naerssen, R. F. van. Psychometricus. Bijdragen ter gelegenheid van zijn afscheid van
de Universiteit van Amsterdam
Brink, W.P. van den en Mellenbergh, G. J. Woord vooraf 200
Pubhcaties R.F. van Naerssen 277
Naerssen, R. F. van Relatief nut van klassieke indices voor de selectie van dichotome
Naerssen R. F. van. Toetsen met enkele moeilijke items voor de sterke studenten 16
Oostendorp, H. van en Kok, I. Effecten van aanwijzingen voor aantekeningen maken
Publicaties R.F. van Naerssen
Scheerens, J. De Zogenaamde Conservatieve Bias bij Énkele Gangbare Evaluatie-de-
signs 161
Schmidt, H. G., Volder, M. L. de, Gijselaers, W. H., en Kerkhofs, L. M. M. Een Positief
Verband tussen Studiejaar en Tentamenresultaat, cn de Rol van Toenemende Voor-
kennis 183
SVO-beoordeling van het Project 'Groei en gezondheid van tieners' 142
Tillema, H. Betrouwbaarheid van een instrument voor leerstofstructurcring 281
Toelichting op de rubriek 'SVO-eindbeoordelingen' 141
Verstralen, H. Normen bij een Rasch-gecalibreerde Itembank. 303
Verstralen, H. Rasch Scales for Extended Curricula 149
Vijn, P. Latente variabelen, schaalpunten en stochastische ordening 269
Wolters, M.A.D. De functie van deel-geheel schema's in het rekenonderwijs: een
terugblik 71
Notities en Commentaren
Ginkel, F.C. van. Berekening van (quasi) F-ratio's in variantie-analyse 84
Gruijter, D. N.M. de. A note on Item-test and Item-rest regressions 135
Jansen, P.G.W. Een Nieuwe Correctie voor 'Restriction of Range' 180
Verstralen, H.F.M.M. Groeiend inzicht? Een kritiek op het simuleren van Kunstmatige
Intelligentie met leerlingen 27
Boekbesprekingen
Aarnoutse, C.A.J.
Aspecten van begrijpend lezen in het vierde leerjaar van het gewoon lager onderwijs.
Vakgroep Interdisciplinaire Studierichting Onderwijskunde K.U.N., 1982 (E. Bol) 42
Brink, W.P. van den. Binomiale Modellen in de Testleer. Universiteit van Amsterdam,
1982 (Niels H. Veldhuyzen) 191
Groot, A.D. de & Wijnen, W.H.F.W. Vijven en zessen. Groningen, Wolters-Noordhof,
1983 (Johan M. Wijnstra) 323
Kleij P. van de, Zeg na, jij. Over regels, patronen, selectie en reproductie in het lager
onderwijs. Purmerend: Muusses, 1983. (G.W. Meijnen) 324
Koele, P. Gissen en Beslissen. Universiteit van Amsterdam, 1982 (Nico Smid) 91
Krogt, F. v.d. Probleemoplossing en beleidsvorming in scholen. Een formatieve evalua-
tie van organisatiemodellen op hun bruikbaarheid in een instrumentarium voor
schoolontwikkeling. Leiden, 1983. (Peter Smets) 39
Krogt, F.J. v.d. & Weijzen, W.P. Variaties in schoolorganisaties (SVO-reeks no. 60)
Den Haag/Harlingen: Flevodruk, 1982 (Peter Smets) 39
Schccrcns,i. Evaluatie-onderzoek en beleid. Het sectoronderzoek: onderwijsonderzoek
in de marge van wetenschap en beleid. (L. Kooistra) 317
Spearrit, D, (Ed.) The improvement of measurement in education and psychology.
Hawthorn, Victoria: The Australian Council for Educational Research, 1982 (W.J.
van der Linden) 138
Weeda, W.C. Beheersingsleren: het model getoetst in de tijd. Katholieke Hogeschool
Tilburg, 1982 (Egbert Warries) 189
Zee, H. v.d. Tussen vraag en antwoord: beginselen van sociaal-wetenschappelijk onder-
zoek. Amsterdam, Meppel: Boom, 1983; (W.C. Weeda) 321
Tijdschrift voor Onderwijsresearch 9 (1984) nr. 1, pp. 1-2
Bij de aanvang van de negende jaargang van dit tijdschrift zijn er enkele nieuwtjes te melden.
Het eerste daarvan zal dc lezer nauwelijks ontgaan zijn: het tijdschrift heeft een nieuw
uiterlijk gekregen. Dat is voorlopig het enige dat de lezer merkt van het feit dat het tijdschrift
een nieuwe uitgever heeft: de firma Swets & Zeitlinger te Lisse. Deze verandering kwam niet
tot stand omdat de oude uitgever, de Stichting IVIO te Lelystad, haar werk niet goed deed.
Integendeel, de redactie heeft alle reden om de Stichting IVIO dankbaar te zijn voor de goede
samenwerking gedurende de afgelopen acht jaren. Er is echter reden om aan te nemen dat de
nieuwe uitgever het voortbestaan van dit tijdschrift beter kan garanderen. Kille financiële
redenen hebben ons van uitgever doen veranderen.
Ook binnen de redactie hebben zich enkele veranderingen voorgedaan. Marinus Voeten
droeg dc functie van redactie-secretaris over aan Bert Creemers. Voeten was jarenlang de ziel
en motor van de redactie.Zijn mederedacteuren cn naar ons oordeel ook dc lezers van dit blad
hebben reden tot grote dankbaarheid voor zijn werk.
In de loop van 1983 werd de redactie met een aantal personen uitgebreid. Wie dc lijst van
redacteuren bekijkt, zal het opvallen dat thans meer specialismen en benaderingswijzen
vertegenwoordigd zijn dan voorheen. Deze verbreding van de redactie moge er een teken van
zijn dat het ons ernst is met ons voornemen de inhoud van dit tijdschrift gevarieerder tc
maken. Daarop heeft de Vereniging voor Onderwijsresearch bij herhaling aangedrongen. De
redactie is, hoewel zij zich onafliankelijk acht, voor die wens niet ongevoelig. Zij is bereid
artikelen van velerlei inhoud en benaderHigswijzen op te nemen, mits zij voldoen aan eisen
van kwaliteit. Nu zijn kwaliteitseisen soms moeilijk te scheiden van voorkeuren voor bepaalde
benaderingswijzen. De redactie is zich daar altijd van bewust geweest. Een gevarieerder
samenstelling van de redactie moet de kans op onjuiste beslissingen in dit opzicht verder
verkleinen.
Het aanbod van kopij neemt snel toe. Gevolg daarvan is, dat de ,,publication lag" groter
wordt; zij bedraagt thans bijna een jaar. Een voor de hand liggende remedie zou zijn het
aantal bladzijden per jaargang tc vergroten. Dat is echter vooralsnog niet mogelijk om een
banale reden: geld. Dit tijdschrift heeft meer abonnees nodig, want meer abi)nnecs maken
meer bladzijden nn)gclijk. Zo eenvoudig is dat. De lezers van dit blad zouden aan dc oplossing
van dit probleem kunnen bijdragen.
Ook de auteurs kunnen aan het probleem iets doen door in hun manuscripten niet langer
van stof te zijn dan strikt nodig is. Economisch schrijven is een kunst, die nog te weinig auteurs
blijken te beheersen. Dc redactie brengt dat nog eens met nadruk onder de aandacht van de
auteurs.
Met de omvang groeit de gevarieerdheid van dc aangebiHlen kopij, een ontwikkeling die de
redactie probeert te versterken door af en toe auteurs uit te nodigen overzichtsartikelen te
schrijven. Daaraan wil dc redactie nu een initiatief toevoegen: de uitnodiging tot het leveren
van 'tutorials', artikelen waarin moeilijke theoretische of methodologische benaderingswij-
zen voor niel-specialisten worden verklaard. Dergelijke bijdragen zullen echter aan hoge
didaktische eisen moeten voldoen.
Tijdschrift voor Onderwijsresearch 9 (1984) nr. 1, pp. 1-2
Bij de aanvang van de negende jaargang van dit tijdschrift zijn er enkele nieuwtjes te melden.
Het eerste daarvan zal de lezer nauwelijks ontgaan zijn: het tijdschrift heeft een nieuw
uiterlijk gekregen. Dat is voorlopig het enige dat de lezer merkt van het feit dat het tijdschrift
een nieuwe uitgever heeft: de firma Swets & Zeitlinger te Lisse. Deze verandering kwam niet
tot stand omdat de oude uitgever, de Stichting IVIO te Lelystad, haar werk niet goed deed.
Integendeel, de redactie heeft alle reden om de Stichting IVIO dankbaar te zijn voor de goede
samenwerking gedurende de afgelopen acht jaren. Er is echter reden om aan te nemen dat de
nieuwe uitgever het voortbestaan van dit tijdschrift beter kan garanderen. Kille financiële
redenen hebben ons van uitgever doen veranderen.
Ook binnen de redactie hebben zich enkele veranderingen voorgedaan. Marinus Voeten
droeg de functie van redactie-secretaris over aan Bert Creemers. Voeten was jarenlang de ziel
en motor van de redactie.Zijn mederedacteuren en naar ons oordeel ook de lezers van dit blad
hebben reden tot grote dankbaarheid voor zijn werk.
In de loop van 1983 werd de redactie met een aantal personen uitgebreid. Wie de lijst van
redacteuren bekijkt, zal het opvallen dat thans meer specialismen en benaderingswijzen
vertegenwoordigd zijn dan voorheen. Deze verbreding van de redactie moge er een teken van
zijn dat het ons ernst is met ons voornemen de inhoud van dit tijdschrift gevarieerder te
maken. Daarop heeft de Vereniging voor Onderwijsresearch bij herhaling aangedrongen. De
redactie is, hoewel zij zich onafhankelijk acht, voor die wens niet ongevoelig. Zij is bereid
artikelen van velerlei inhoud en benaderingswijzen op te nemen, mits zij voldoen aan eisen
van kwahteit. Nu zijn kwaliteitseisen soms moeilijk te scheiden van voorkeuren voor bepaalde
benaderingswijzen. De redactie is zich daar altijd van bewust geweest. Een gevarieerder
samenstelling van de redactie moet de kans op onjuiste beslissingen in dit opzicht verder
verkleinen.
Het aanbod van kopij neemt snel toe. Gevolg daarvan is, dat de „publication lag" groter
wordt; zij bedraagt thans bijna een jaar. Een voor de hand liggende remedie zou zijn het
aantal bladzijden per jaargang te vergroten. Dat is echter vooralsnog niet mogelijk om een
banale reden: geld. Dit tijdschrift heeft meer abonnees nodig, want meer abonnees maken
meer bladzijden mogelijk. Zo eenvoudig is dat. De lezers van dit blad zouden aan de oplossing
van dit probleem kunnen bijdragen.
Ook de auteurs kunnen aan het probleem iets doen door in hun manuscripten niet langer
van stof te zijn dan strikt nodig is. Economisch schrijven is een kunst, die nog te weinig auteurs
blijken te beheersen. De redactie brengt dat nog eens met nadruk onder de aandacht van de
auteurs.
Met de omvang groeit de gevarieerdheid van de aangeboden kopij, een ontwikkeling die de
redactie probeert te versterken door af en toe auteurs uit te nodigen overzichtsartikelen te
schrijven. Daaraan wil de redactie nu een initiatief toevoegen: de uitnodiging tot het leveren
van 'tutorials', artikelen waarin moeilijke theoretische of methodologische benaderingswij-
zen voor niet-specialisten worden verklaard. Dergelijke bijdragen zullen echter aan hoge
didaktische eisen moeten voldoen.
Van de redactie
Tot slot nog een opmerking over de vorm waarin manuscripten worden aangeboden In veel
gevallen voldoen die met aan de richtlenen die daarvoor gelden en die elders in dit t Jdschrif
worden gegeven^ Veel manuscripten bevatten bovendien typefouten, spelfouten, XS
Nederlands en/of steenkolen-Engels Hef piM,»i u r. j • KcureKKig
redactie besloten heeft de redactiL^reSrisTe Lfn • de
al te bont maken, onbeoordeeld aan auteïs 1 Je het in dit opzicht
' ... . ""'^"rs te retourneren. Auteurs die door de vornippvino
van hun werk er blijk van geven weinig consideratie te kunnen opbrengen voor de prTwemen
van beoordelaars die hun werk van een advies moeten voorzien, kunnen wat de reda^S
betreft op hun beurt met langer op consideratie rekenen redactie
De redactie van het TOR wenst de lezers succes bij het werk in het nieuwe jaar en ziet met
belangstelhng uit naar de resultaten daarvan.
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 1, pp. 3-15.
Strategiegebruik bij het Oplossen van Problemen in
een Semantisch Rijk Domein: Electriciteit en
Magnetisme^
Ton de Jong Monica G. M. Ferguson-Hessler
Groep Onderwijsresearch en Afdeling der Technische Natuurkunde
TH Eindhoven TH Eindhoven
abstract
The use of strategy in solving problems in a semantically rich domain:
electricity and magnetism
Problem solving in semantically rich domains requires knowledge of the subject involved. In
addition an adequate strategy seems to be important. In this research project the question was
investigated whether students who received additional instruction and training in problem ap-
proach did use the strategy taught and, as a consequence, achieved better results.
Participants in the experiment were first-year students of Electrical Engineering at the Eindho-
ven University of Technology. They all followed an ISS course on Electricity and Magnetism. A
strategy, based on the so-called GHV (Mettes and Pilot, 1980), was designed. Part of the
participants received additional instruction in this strategy during six periods. Data were collected
by letting the participants take two tests on the ISS course while thinking aloud.
The results showed that the group of students who received the additional instruction did not
change their problem approach. The problem solving behavior of the different groups of students
showed a remarkably consistent pattern. Also, when good and poor solutions were compared, that
same pattern of behavior was found for both types. It does seem that success or failure in problem
solving cannot be attributed to differences in the use of strategy, but mainly to differences in the
way the subject is mastered.
INLEIDING
Binnen het onderzoek naar probleemoplossen is een toenemende aandacht voor het oplossen
van problemen in semantisch rijke domeinen waar te nemen. Semantisch rijke domeinen zijn
kennisgebieden waar een grote hoeveelheid semantische kennis is samengebundeld (Bhaskar
and Simon, 1977). Voorbeelden van dit soort gebieden zijn wiskunde (Schoenfeld, 1979;
Greeno, 1980), boekhouden (Dillard, Bhaskar & Stephens, 1982) en natuurkunde (Vaags,
1975; Larkin, 1976; Larkin, McDermott, Simon & Simon, 1980).
Een uitgebreid rapport over dit onderzoek is verschenen bij de Groep Onderwijsresearch TH
Eindhoven. Tevens werd op de ORD '83 te Amsterdam een paperlezing over dit onderzoek
gehouden.
Adres auteurs: Den Dolech 2, Postbus 513, 5600 MB Eindhoven.
-ocr page 8-4 Strategiegebruik bij het oplossen van problemen
Voor het oplossen van problemen uit zo'n gebied moet een oplosser in de eerste plaats
beschikken over de juiste specifieke vakkennis. Vakkennis alleen echter lijkt niet voldoende.
Reif, Larkin en Brackett (1976), die onderzoek deden naar het oplossen van natuurkundige
vraagstukken, constateerden:
'Thus, even when students know all the relevant facts and principles necessary for the solution of a
problem they may be unable to solve jt because they lack any systematic strategy for guiding them to apply
such facts and principles' (Reif et al., 1976, blz. 216).
Naast specifieke vakkennis moet een oplosser klaarblijkelijk ook beschikken over een be-
paalde manier van probleemaanpak of zoals dat beter genoemd kan worden, een strategie.
Een strategie kan gezien worden als een algemeen actieplan waarin is vastgelegd in welke
volgorde stappen (cognitieve handelingen, fasen) in het oplosproces plaats moeten vinden
(Woods, Crowe, Hofmans & Wright, 1976; Posner & McLeod, 1982). Door een strategie kan
de organisatie van het oplosproces geregeld worden. Schoenfeld (1979) spreekt in dit verband
dan ook van 'managerial strategy'.
Na de constatering dat het de studenten ontbrak aan systematiek bij het oplossen gaven
Reif et al. (1976) een aantal studenten naast het reguliere onderwijs dat zij volgden, een extra
instructie in een simpele strategie voor probleemoplossen. Deze strategie hield in dat het
oplosproces werd uitgevoerd in vier opeenvolgende fasen: beschrijving, planning, im-
plementatie en controle. Studenten die deze extra instructie gevolgd hadden behaalden betere
resultaten.
Een belangrijke nederiandse studie over het oplossen van natuurkundige problemen wordt
gevormd door het onderzoek van Mettes en Pilot (1980). Zij ontwikkelden een model voor
het oplossen van natuurkundige problemen, het zogenaamde 'gewenst handelingsverloop'
(GHV). In het GHV wordt het oplosproces in een aantal fasen opgedeeld. Deze fasen zijn in
een vaste sequentie geplaatst. Binnen elke fase worden een aantal (vak-)specifieke detaille-
ringen, bestaande uit gewenste denkhandelingen, gegeven. Eén aspect van het GHV is dus dat
het een strategie omvat.
Mettes en Pilot (1980) ontwierpen een cursus waarin studenten geleerd werd problemen
volgens dit GHV op te lossen. De cursus werd ingericht volgens de leertheorie van Gal'perin
aangevuld met het principe van mastery learning. Alle onderdelen van de cursus werden
nauwgezet op elkaar afgestemd. Invoering van deze nieuwe cursus bleek een gunstige invloed
op de prestaties van de studenten te hebben.
Het ontwikkelen van een nieuwe cursus vergt veel constructiearbeid. Bovendien betekent
invoering ervan het afleggen van een lange weg met ongetwijfeld vele obstakels. De resultaten
van het onderzoek van Reif et al. (1976) geven echter aan dat ook een minder arbeidsinten-
sieve ingreep dan de constructie van een geheel nieuwe pursus vruchten af kan werpen.
In het onderhavige onderzoek werd daarom onderzocht of studenten die naast het reguliere
onderwijs (dus niet geïntegreerd in een nieuwe cursus) een extra instructie ontvingen in een
op basis van het GHV ontworpen strategie (zonder (vak-)specifieke detailleringen), proble-
men meer conform deze strategie (hierna: de strategie) gingen oplossen en dientengevolge
betere resultaten behaalden.
METHODE
Om de bovenstaande onderzoeksvraag te kunnen beantwoorden werd aan een groep eerste-
jaars studenten Electrotechniek die deelnam aan een cursus Electriciteit en Magnetisme
De Jong en Ferguson-Hessler 5
(E&M I), een extra instructie gegeven waarin de strategie onderwezen werd. Een andere
groep studenten die deelnam aan de cursus kreeg geen extra instructie en fungeerde als
controlegroep. Data werden verkregen door beide groepen hardop denkend toetsen af te
laten leggen. Dit gebeurde zowel voor als na de extra instructie.
De verschillende elementen uit het onderzoek zullen nu afzonderhjk toegelicht worden.
De SPS-cursus E&M I
Het in de cursus gegeven vak, Electriciteit en Magnetisme, is een van de theoretische
basisvakken van de studie. De cursus wordt gegeven in SPS-vorm (Self Paced Study). De
inhoud van de cursus is verdeeld in 9 blokken elk afgesloten met een toets. Het onderwijs
bestaat uit klassikale instructies gedurende de eerste maanden, speciaal gericht op de nodige
wiskundige vaardigheden. Daarnaast zijn er vrageninstructies waar vragen van studenten
n.a.v. opgaven behandeld worden. In de zogenaamdetenslotte, kunnen studenten
individueel vragen stellen over door hen afgelegde toetsen. De nominale studielast van deze
cursus is 100 uur.
öe strategie
De voor dit onderzoek ontwikkelde strategie is voornamelijk gebaseerd op het werk van
Mettes en Pilot (1980). Veel van de door hen gebruikte terminologie is daarom door ons
overgenomen. Zoals in de inleiding al aangegeven wijkt de hier behandelde strategie echter
duidelijk af van het GHV van Mettes en Pilot (1980) daar de strategie niet expliciet vakspeci-
fieke gewenste denkhandelingen binnen de aangegeven fasen bevat.
De strategie bestaat uit het achtereenvolgens uitvoeren van een aantal fasen in het oplos-
proces. Deze fasen zijn: analyse (A), opstellen van kernbetrekkingen (KB), oplossingsroute
(O) uitwerking (U) en controle (K).
In de analysefase moet een helder beeld van de situatie opgebouwd worden. Daarbij is van
belang: het goed lezen van de tekst van de opgave, het maken van een zo volledig mogelijke
schets van de gegeven situatie, het trekken van conclusies, en (voor zover mogelijk) het
voorspellen van kenmerken van het antwoord (bijvoorbeeld teken of richting van een ge-
vraagde grootheid). Na het uitvoeren van de analyse moeten voor de oplossing relevante
kernbetrekkingen geselecteerd worden. Kernbetrekkingen zijn fundamentele formules uit de
stof (zie Mettes en Pilot, 1980). Tevens wordt in deze fase nagegaan of de gekozen kern-
betrekkingen geldig zijn in de gegeven situatie. Vervolgens moet de oplosser een oplos-
singsroute zoeken en opstellen. Met behulp van de geselecteerde kernbetrekkingen moet men
een plan voor de oplossing maken, zonder daarbij al tot rekenwerk over te gaan. Is de
oplossingsroute opgesteld dan vindt in de volgende fase de concrete uitwerking van de
opgestelde plannen plaats. Tot slot behoort in de controlefase nagegaan te worden of het
antwoord klopt. Dit kan gebeuren door het nalopen van het rekenwerk, het herhalen van de
oplossing met een andere methode etc.
öe instructie probleemaanpak (IPA)
De experimentele groep ontving de instructie probleemaanpak (IPA), één uur per week
gedurende zes weken. De instructie ving aan nadat elke student de toets van het tweede blok
uit de cursus E&M I had afgelegd. In de eerste bijeenkomst werd aan de hand van fouten in de
opgaven uit deze toets het nut van een systematische aanpak geïllustreerd. Daarna werd het
begrip kernbetrekking behandeld en werd geoefend in het opstellen van kernbetrekkingen uit
de stof. Het tweede instructie-uur werd besteed aan het bespreken van de verschillende fasen
Uit de strategie, mede aan de hand van voorbeelden. De resterende vier instructie-uren
6 Strategiegebruik bij het oplossen van problemen
werden gebruikt voor oefening van de strategie. Hierbij werd gebruik gemaakt van werkbla-
den uit het onderzoek van Van Weeren, de Mul, Peters, Kramers-Pals en Roossink (1979),
waarop aparte ruimten voor de eerste vier fasen van de strategie zijn aangebracht. Daar werd
een aparte ruimte voor de controlefase aan toegevoegd. Na elke oefening werd een voor-
beeldoplossing uitgereikt.
Deelnemers aan het onderzoek
Deelnemers aan het onderzoek waren eerstejaars studenten Electrotechniek. Op grond van
eindexamencijfers werd een groep studenten samengesteld die aan de ene kant vermoedelijk
een goede kans hadden om de cursus met succes af te leggen, maar aan de andere kant
waarschijnlijk niet zo briljant waren dat ze geen moeilijkheden met de stof zouden ondervin-
den. (Gemiddeld cijfer c voor natuurkunde, wiskunde I en eventueel wiskunde II, 7,3 è c ê
8, en een 6 of hoger voor het vak nederlands). Hieruit werden twee, per toeval gekozen,
groepen uitgenodigd voor informatieve bijeenkomsten. Gestreefd werd naar 8 deelnemers in
zowel de experimentele groep (IPA én hardop denken bij twee toetsen) als in de controle-
groep (alleen hardop denken bij twee toetsen).
Uiteindelijk ontstonden een experimentele groep met 10 deelnemers en een controlegroep
met 6 deelnemers. Dit kwam deels omdat een persoon zich op kwam geven voor de experi-
mentele groep. Deze was op dat moment nog niet vol en de betreffende persoon werd
toegelaten. In de controlegroep viel tijdens het experiment een deelnemer uit omdat hij vond
dat het hardop denken hem hinderde bij het maken van de opgaven.
De toetsen
Voor elk van de negen blokken uit de cursus wordt voor elke student uit een verzameling
opgaven een toets samengesteld. Afhankelijk van het blok bevat deze toets 4 tot 7 opgaven.
De inhoud van de opgaven varieerde dus over studenten. In het onderzoek werden alleen die
opgaven uit de toetsen betrokken waar de volledige oplossing van een probleem vereist werd.
Altijd moest bij deze opgaven de waarde van een grootheid berekend worden. Een groot
aantal van deze opgaven zijn meerkeuzevragen waarbij de alternatieven gevormd worden
door verschillende waarden voor de gevraagde grootheid. De studenten hadden niet allen een
gelijk aantal van deze opgaven die een volledige oplossing van een probleem vereisten en dus
in het onderzoek betrokken werden in hun toets (zie ook tabel 1).
Het bestaan van variaties in zowel de inhoud van de opgaven als hun aantal had geen
consequenties voor het onderzoek omdat de strategie geldig geacht werd voor al deze opgaven
en er naar resultaten van groepen en niet van individuele studenten gekeken werd.
De effectmeting
Voor beantwoording van de onderzoeksvraag moest het oplosgedrag van de studenten
afgezet worden tegen het ideale in de IPA gedoceerde oplosgedrag. Dit vereiste een gecom-
pliceerde meting. De hierbij gevolgde stapsgewijze procedure wordt nu beschreven.
Opname van toetsen
Alle deelnemers aan het onderzoek moesten twee toetsen (een voor en een na de IPA, nl de
toetsen van blok 2 en van blok 9 uit de cursus) hardop denkend afleggen. Dit werd op een
geluidsband opgenomen. De studenten mochten aantekeningen maken. De bij de opname
aanwezige studentassistent maakte hiervan een zogenaamd technisch protocol, d.w.z. dat hij
de aantekeningen van de student kort weergaf met daarbij het tellernummer van het band-
opname-apparaat. De taak van de studentassistent bestond verder alleen hieruit dat hij
De Jong en Ferguson-Hessler 7
ingreep wanneer er lange stiltes vielen of er onduidelijk gesproken werd. Beschikbaar voor
analyse kwamen dus de bandopname, het schriftelijk werk van de student en het technisch
protocol van de assistent.
Het analyseschema
Met behulp van enkele proefprotocollen werd een analyseschema voor de analyse van
protocollen opgesteld. De fasen uit de strategie werden hiertoe onderverdeeld in meer
specifieke denkhandelingen. Elke denkhandeling in het analyseschema werd voorzien van
een label, een zo nauwkeurig mogelijke omschrijving van deze denkhandeling en voorbeelden
ervan. Dit om de betrouwbaarheid van de scoring te bevorderen. Ter illustratie denkhande-
ling A.I.3., horende bij de analysefase:
A. 1.3. Het vaststellen van relevante kenmerken van de situatie, die niet expliciet gegeven zijn. Hieronder
valt o.a. het vaststellen van symmetrie-eigenschappen, het maken van gevolgtrekkingen uit de
gegevens, het aangeven van een typering van de situatie. Voorbeelden:
- dat betekent dat hier een spanning over staat.
- q is positief, dus het veld loopt van binnen naar buiten.
- als je zo'n stroom hebt dan gaat het B-veld in de'^^-richting staan.
Om het oplosgedrag van de studenten volledig te kunnen beschrijven, werd aan de fasen uit de
strategie toegevoegd de fasen Vergelijking (V) en Gissen (G). Vergelijking betreft het
vergelijken van het gevonden antwoord met de geboden antwoordalternatieven en Gissen is
het op niet fysische gronden kiezen voor een antwoordalternatief. Beide fasen komen alleen
voor bij de meerkeuzevragen. De fase 'uitwerking' uit de Strategie werd gesplitst in Uitwer-
king (U) en Probleemtransformatie (PT). Uitwerking blijft dan gereserveerd voor puur
rekenwerk en probleemtransformatie omvat dan die denkhandelingen die soms nodig zijn om
vanuit een gekozen deelprobleem naar rekenwerk over te kunnen gaan. Het kiezen van een
kring resp. oppervlak bij het toepassen van een integraalstelling is bijvoorbeeld een pro-
bleemtransformatie. Uit de analysefase werd nog de fase Lezen AO) afgescheiden en uit de
fase oplossingsroute werd de fase Kiezen van een (deel-)probleem (DP) apart gezet.
Er werden zo uiteindehjk tien fasen in het oplosproces onderscheiden, waarbij een onder-
verdeling van in totaal 29 denkhandelingen werd aangebracht. Figuur 1 geeft deze tien fasen
in een van de strategie afgeleide 'ideale oplossingsweg'.
De protocolanalyse
Door gebrek aan financiële middelen konden de bandopnamen niet uitgetikt worden. De
protocolanalyse vond daarom rechtstreeks vanaf de band plaats. Hierbij waren het schriftelijk
werk cn het technisch protocol belangrijke hulpmiddelen. Het analysewerk werd telkens door
twee personen uitgevoerd. Bij de protocolanalyse werden uitspraken van studenten benoemd
d-m.v. de denkhandelingen uit het analyseschema. Tevens werd aantekening gemaakt van
voorkomende rekenfouten en natuurkundige fouten. Het resultaat van deze analyse was dat
elk protocol als een sequentie van denkhandelingen (en dus de daarbij behorende fasen)
beschreven konden worden.
Om zicht te krijgen op de betrouwbaarheid van de analyse werden 10 protocollen een
tweede keer beoordeeld. Tussen beide beoordelingen lag een periode van zes maanden
waarin in totaal 127 protocollen werden beoordeeld.
Het percentage overeenstemming tussen beide beoordelingen (bij benoeming in de 10
fasen) was 81. De 19% onbetrouwbaarheid werd voornamelijk veroorzaakt door opmerkin-
gen die bij de ene beoordeling wel en bij de andere niet benoemd werden. Het rechtstreeks
1196 Strategiegebruik bij het oplossen van problemen
AO (Lezen)
A (Analyie)
_
V (V*rgelliklng).
Q (Glwm)
=1-
EINDE
Figuur l De 'ideale oplossingsweg'
van de band scoren zal hier niet vreemd aan zijn geweest. Opmerkingen van de studenten die
bij beide beoordelingen benoemd werden, werden in 97,4% van de gevallen (Kappa (Cohen,
1969) is .969) in dezelfde fase geplaatst.
Vergelijking van het oplosgedrag met de strategie
Na de protocolanalyse was van elke oplossing een beschrijving in de vorm.van een sequentie
van fasen beschikbaar. Het volgen van de strategie betekent het uitvoeren van het oplosproccs
in een sequentie van fasen als aangegeven in de ideale oplossingsweg (figuur 1). Om een
vergelijking tussen hét oplosgedrag van de studenten en het oplosgedrag volgens de strategie
te kunnen maken is een zogenaamde overgangstabel ontworpen. In figuur 2 zijn vier van deze
De Jong en Ferguson-Hessler 9
overgangstabellen opgenomen. De interpretatie van deze tabellen vereist enige uitleg.
De codes AO, A, KB, enz. staan voor de verschillende fasen (zie ook figuur 1). De
geanalyseerde protocollen werden verwerkt tot de student zijn eerste antwoord gaf, de fase
gissen (G) kon daarom uit de overgangstabel weggelaten worden.
De cellen van de tabel geven overgangen tussen fasen aan. De horizontale as is daarbij
telkens het uitgangspunt. Op de verticale assen zijn de fasen waar men naar toegaat aangege-
ven. De cel met (percentage) 11,5 in overgangstabel A van figuur 2 geeft dus een overgang
van de fase lezen (AO) naar de fase analyse (A) aan, de cel met (percentage) 3,4 in over-
gangstabel A van figuur 2 een overgang van deelprobleem (DP) naar kernbetrekking (KB).
De strategie wordt aangegeven met de dubbel omlijnde cellen. Hierbij is rekening gehouden
met het feit dat niet elk probleem een probleemtransformatie vereist en sommige problemen
de successievehjke oplossing van meerdere deelproblemen met zich meebrengen (zie figuur
1). Het wordt bovendien niet als een afwijking van de strategie gezien als men eerst vergelijkt
en dan pas controleert. Boven de dubbel omlijnde cellen én de diagonaal zijn de overgangen
tussen fasen waarbij een fase uit de strategie is overgeslagen te vinden. Als men bijvoorbeeld
geen oplossingsroute maakt gaat men rechtstreeks van KB naar DP of U. De resterende cellen
geven teruggangen naar een eerdere fase uit de strategie aan. Daarbij is een onderscheid
aangebracht tussen teruggangen die niet conform de strategie zijn (onder de horizontale as)
en teruggangen die niet als afwijking van de strategie beschouwd worden (boven de horizon-
tale as). Dit laatste betreft bijvoorbeeld tussentijdse controles en enkele uitzonderingen (om
vakinhoudelijke redenen).
RESULTATEN
Elk geanalyseerd protocol werd overgebracht op een overgangstabel. Per toets werden deze
voor de experimentele en de controlegroep afzonderlijk gesommeerd. In de cellen van de
tabel komen dan de totale frequenties voor een bepaalde overgang. Deze frequenties werden
vervolgens omgezet in percentages van het totaal aantal in de betreffende overgangstabel
voorkomende stappen. Dit werd gedaan omdat het totaal aantal stappen per overgangstabel
verschilde (o.a. verschillend aantal opgaven en deelnemers).
Figuur 2 bevat de vier overgangstabellen die op deze manier ontstonden. Blok 2 is de toets die
afgenomen werd voordat de IPA werd gegeven, blok 9 is de toets die na de IPA werd
afgenomen.
De overgangstabellen uit figuur 2 worden samengevat in tabel 1. Hierbij staat 'STRATEGIE'
voor de overgangen die volgens de strategie zijn én de toegestane teruggangen. Tevens wordt
in deze tabel aangegeven hoeveel opgaven in totaal per blok en per conditie in het onderzoek
betrokken waren.
J^e resultaten wijzen uit dat er tussen de controlegroep en de experimentele groep geen
verschillen in afwijking van de strategie bestaan, noch in blok 2, noch in blok 9. Een
vergelijking tussen de blokken laat zien dat in blok 9 door beide groepen iets minder volgens
de strategie gewerkt wordt dan in blok 2. Deze verschillen zijn echter vrij klein en van
dezelfde orde van grootte als de verschillen die een zelfde procedure oplevert bij de tien
protocollen die voor de bepaling van de betrouwbaarheid tweemaal beoordeeld werden. Hier
kan dus geen interpretatie aan verbonden worden.
|
|
10 Strategiegebruik bij het oplossen van problemen
A. Controlegroep, Blok 2 B. Controlegroep, Blok 9
D. Experimentele groep. Blok 9
C. Experimentele groep. Blok 2
|
|
Figuur 2 Overgangen tussen fasen voor de controlegroep en de experimentele groep, percentages van
het totaal.
11
De Jong en Ferguson-Hessler
Tabel 1 Gesommeerde percentages en aantallen opgaven
STRA- |
OVER- |
TERUG |
AANTAL | ||
TEGIE |
SLAAN |
OPGAVEN | |||
CONTR. |
51 |
29 |
21 |
25 |
BLOK |
EXP. |
50 |
28 |
23 |
38 |
BLOK |
CONTR. |
47 |
29 |
24 |
24 |
BLOK |
EXP. |
47 |
30 |
23 |
40 |
BLOK |
CONCLUSIES EN DISCUSSIE
Uit de resultaten blijkt dat de extra instructie (IPA) de studenten er niet toe gebracht heeft
meer volgens de daarin gedoceerde strategie te gaan werken. Voor het niet effectief blijken
van de IPA kunnen twee verklaringen gegeven worden. In de eerste plaats is de omvang van
de IPA niet groot geweest, zes bijeenkomsten, en sommige studenten hebben wel eens een
bijeenkomst gemist. Hierbij speelt ook mee dat de IPA gegeven werd naast een bestaande
cursus. Het kan zo zijn dat de IPA 'verdronken' is in deze cursus omdat mogelijk de docenten
uit de cursus een (impliciete) strategie hanteerden die niet overeen kwam met de in de IPA
gedoceerde strategie. Het was echter de opzet van het onderzoek (om in de inleiding
genoemde redenen) om na te gaan of een extra instructie nut kon hebben.
In de tweede plaats moet een instructie als de IPA des te indringender zijn als de gewoonten
van de studenten sterk ingeworteld zijn. Een aanwijzing voor dit laatste kan gevonden worden
in de vier overgangstabellen van figuur 2 waarin steeds hetzelfde oplospatroon te herkennen
valt. De strategie die de studenten in het algemeen volgden en die wij aanduiden met de term
'kick and rush' is als volgt te omschrijven: nadat het probleem gelezen is vindt er een analyse
plaats. Veelal vindt deze in eerste instantie niet in voldoende mate plaats want er moet vaak
naar de analysefase teruggekeerd worden. Vanuit de analysefase worden kernbetrekkingen
geselecteerd waarna er onmiddellijk tot uitwerking wordt overgegaan. Dit kan zich dan
herhalen. Deelproblemen worden ook vrij vaak direct na de analysefase gekozen. Dat
betekent waarschijnlijk dat men iets ziet dat berekend kan worden, waarna dit dan ook
gebeurt zonder dat men zich realiseert of dit zinvol of noodzakelijk is. Ook het vrij grote
aantal teruggangen van DP naar KB staan hiermee in verband. Het relatief hoge percentage in
de cel die de overgang van A naar O aangeeft is voor een groot deel afkomstig van 'spijtop-
tanten' die na een eerste mislukte poging het probleem op een directe wijze op te lossen nu
gaan nadenken over de opgave. Het consistente patroon in elke ovcrgangstabel leidt tot dc
suggestie dat studenten een zwaar verankerde strategie voor het oplossen van problemen
hebben.
Dat studenten hier deze 'kick and rush' strategie (ondanks de IPA) hanteerden kan mede
gestimuleerd zijn door het feit dat de resultaten van de in het onderzoek gebruikte toetsen
meetelden voor de studieresultaten van de deelnemers. Dit kan hen er toe gebracht hebben
het zekere voor het onzekere te nemen en die strategie te handhaven die zij gewend waren.
Invloed op de door de studenten gebruikte strategie van het feit dat de meeste opgaven van
het meerkeuze type waren is niet onmogelijk maar lijkt ons niet waarschijnlijk. Alle opgaven
vereisten de volledige oplossing van een probleem en bovendien was in de afleiders rekening
gehouden met mogelijke fouten bij het oplossen.
12 Strategiegebruik bij het oplossen van problemen
Gelet op het bovenstaande hjkt het niet waarschijnlijk dat de door studenten gehanteerde
'kick and rush' strategie doorbroken en veranderd kan worden met een extra instructie die een
(relatieve) omvang heeft als de in dit onderzoek gebruikte IPA.
In de IPA werd niet getracht de studenten specifieke vakinhoudelijke procedures aan te
leren. De gedoceerde strategie was gebaseerd op een model, het GHV van Mettes en Pilot
(1980), waar vakinhoudelijke procedures wel een rol speelden. In dit verband was het tweede
deel van de onderzoeksvraag (worden door het volgen van de strategie betere resultaten
gehaald?) van belang. Was de IPA effectief geweest dan hadden de resultaten van de
studenten het waardeoordeel over de onderwezen strategie kunnen vormen, naast de IPA was
het onderwijs immers voor aUen gehjk. Omdat de IPA geen verandering in strategiegebruik
tot gevolg heeft gehad is dit echter niet mogelijk. Wel kan een indruk verkregen worden van
het belang van de onderwezen strategie voor het bereiken van de goede oplossing door
overgangstabellen van goed en fout opgeloste problemen apart te sommeren. In figuur 3 staan
deze sommaties, omgezet in percentages.
Wanneer nu deze percentages gesommeerd worden in de categorieën 'strategie', 'overslaan'
en 'terug', dan is geen duidelijk verschil tussen de vier overgangstabellen te constateren.
Hiermee is uiteraard niet aangetoond dat het volgen van de strategie nooit nut kan hebben,
maar het betekent wel dat het volgen van de strategie in ieder geval geen belangrijke
voorwaarde is voor het bereiken van de goede oplossing.
Opmerkelijk is dat wederom in alle vier de overgangstabellen een zeer consistent patroon
aanwezig is. De eerder beschreven 'kick and rush' strategie, die als diep ingeworteld geken-
schetst werd, wordt door studenten zowel bij goede als bij foute oplossingen aangewend.
Tussen goede en foute oplossingen kon slechts een onderscheid gemaakt worden in aantallen
vakinhoudelijke fouten en rekenfouten. (Voor een overzicht van deze fouten zie Ferguson-
Hessler en De Jong, in voorbereiding). Het verschil tussen het bereiken van een goede of
foute oplossing lijkt dan ook niet toegeschreven te kunnen worden aan verschillen in strate-
giegebruik (zoals in dit onderzoek gedefinieerd), maar lijkt veeleer af te hangen van het al dan
niet optreden van vakinhoudelijke fouten of omissies, of van rekenfouten.
De fase oplossingsroute, het zoeken naar en maken van een plan voor de oplossing, wordt
wel als een cruciale fase in het oplosproces beschouwd (Larkin, 1976). Het is daarom
interessant de fase oplossingsroute er uit te lichten bij de tweedeling in goede en foute
oplossingen. Opmerkelijk is het lage percentage (2,6%) oplossingsroute voor de goede
oplossingen uit blok 2 ten opzichte van de foute oplossingen uit dat blok (5,4%) en de goede
en foute oplossingen uit blok 9 (6,4% en 6,0% respectievelijk). Hier is een, enigszins
speculatieve, verklaring voor te geven.
Het is opvallend dat de fase oplossingsroute veelal laat in het oplosproces voorkomt, van A
naar O (meestal na een eerdere teruggang naar A) en van U naar O. Dit is in overeenstem-
ming met de veel gehoorde opmerking van studenten dat 'je pas gaat kijken hoe het ook al
weer moet, wanneer je er niet uitkomt'. Zoals eerder opgemerkt proberen studenten een
probleem eerst op een 'kick and rush' manier op te lossen. Het maken van een oplossingsroute
wordt daarbij als een redmiddel gezien. De problemen van blok 2 zijn minder complex,
bevatten in het algemeen minder deelproblemen, dan de problemen van blok 9. Een directe
wijze van oplossen kan bij deze niet complexe problemen tot succes leiden. Voorwaarde is dan
wel dat men de vakinhoud goed beheerst. Is dit niet het geval dan biedt het alsnog inlassen van
een fase oplossingsroute in de meeste gevallen geen uitweg. Bij de meer complexe problemen
uit blok 9 biedt de directe benadering van een probleem veel minder vaak ook een directe
oplossing. Ook studenten met een goede vakkennis moeten dan vaak alsnog een oplos-
B. Goede oplossingen. Blok 9
De Jong en Ferguson-Hessler 13
|
|
C. Foute oplossingen, Blok 2
D. Foute oplossingen. Blok 9
|
|
F'guur 3 Overgangen tussen fasen gesommeerd voor goede en foute oplossingen, percentages van het
totaal
14 Strategiegebruik bij het oplossen van problemen
singsroute maken. Hier kan dit dan wel tot succes in tweede instantie leiden. Het zoeken naar
en maken van een oplossingsroute lijkt slechts dan bij te dragen aan succes bij het oplossen,
wanneer de oplosser over goede vakinhoudelijke kennis beschikt en het gaat om het oplossen
van relatief complexe problemen.
Een dergelijk verschijnsel vinden we ook beschreven bij Chi, Glaser en Rees (1982). In een
overzicht van onderzoek vermelden zij dat experts bij simpele problemen een 'working
forward' strategie hanteren waarbij geen expliciete deelanalyse en planning plaatsvindt. Als
een van de mogelijke interpretaties hiervan noemen de auteurs dat experts geen complexe
planning nodig hebben. Zij bezitten routines die zij direct op het probleem toe kunnen passen.
Wanneer problemen complexer worden gaan experts weer wel gebruik maken van planning
(Chi et al., 1982).
De studenten die een goede oplossing produceerden onderscheiden zich hierin van de
experts uit het artikel van Chi et al. (1982) dat zij (in het algemeen) de complexiteit van een
probleem niet tijdig onderkennen en alle problemen eerst zonder oplossingsroute trachten op
te lossen.
Kennis van strategie kan beschouwd worden als behorend tot de kennisbasis of het ken-
nisrepertoire van een oplosser (De Jong en Ferguson-Hessler, 1982). Op grond van de
resultaten van dit onderzoek kan gesteld worden dat componenten van het kennisrepertoire
die specifiek domeingebonden zijn (declaratieve kennis, vakspecifieke procedures), voorlo-
pig meer aandacht verdienen dan de meer algemeen geldende strategiecomponent. Een
tendens naar meer nadruk op vakkennis is in recent onderzoek waarneembaar. Daarbij zijn
twee sporen van theorievorming en onderzoek waarneembaar. Binnen het ene spoor wordt
meer nadruk gelegd op verschillen in organisatie van kennis (Chi, Feltovich & Glaser, 1981;
Chi et al. 1982). Het andere spoor richt zich meer op de vorm (declaratief of procedureel)
waarin de vakkennis is opgeslagen (Anderson, Greeno, Kline & Neves, 1981; Anderson,
1982). Al dit onderzoek houdt zich voornamelijk bezig met verschillen tussen beginners en
experts. Het in kaart brengen van verschillen in vakkennis tussen beginners onderling zal,
naar onze mening, een minstens zo belangrijke richting van onderzoek blijken te zijn.
LITERATUUR
Anderson, J.R. (1982). Acquisition of cognitive skill. Psychological Review 89, 369-406.
Anderson, J.R., Greeno, J.G., Kline, P.J. & Neves, D.M. (1981). Acquisition of problem-solving skill. In
J.R. Anderson (Ed.), Cognitive skills and their acquisition (pp. 191-230). Hillsdale, N.J.:
Erlbaum.
Bhaskar, R., & Simon, H.A. (1977). Problem solving in semantically rich domains: An example from
engineering thermodynamics. CogmV/'ve 5cicncc, I, 193-215.
Chi, M.T., Feltovich, P.J., & Glaser, R. (1981). Categorization and representation of physics problems by
experts and novices. Cognitive Science, 5, 121-152.
Chi, M.T., Glaser, R., & Rees, E. (1982). Expertise in problem solving. In R.J. Sternberg (Ed.),Advances
in the psychology of human intelligence, (Vol. I, pp. 7-77). Hillsdale, N.J.: Erlbaum.
Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Mea-
surement, 20, 37-46.
Dillard, J.F., Bhaskar, R., & Stephens, R.G. (1982). Using first order cognitive analysis to understand
problem solving behavior: An example from accounting. Instructional Science, 20, 199-203.
Ferguson-Hessler, M.G.M., & Jong, T. de (in voorbereiding). Markante (dwaal)wegen bij het oplossen
van E&M problemen. Groep Onderwijsresearch, TH Eindhoven.
Greeno, J.G. (1976). Cognitive objectives of instruction: Theory of knowledge for solving problems and
-ocr page 19-De Jong en Ferguson-Hessler 15
answering questions. In D. Klahr (Ed.), Cognition and Instruction (p. 123-161). Hillsdale, N.J.:
Erlbaum.
Jong, T. de, & Ferguson-Hessler, M.G.M. (1982). Voorwaarden voor het succesvol oplossen van proble-
men. Groep Onderwijsresearch, TH Eindhoven.
Larkin, J.H. (1976). Human problem solving in physics I: Global features of an information processing
model (Working paper 3), Group in Science and Mathematics, University ot Berkeley, CA.
Larkin, J.H., McDermott, J., Simon, D.P., & Simon, H.A. (1982). Expert and novice performance in
solving physics problems. Science, 208, 1335-1342.
Mettes, C.T.C.W., & Pilot, A. (1980). Over het leren oplossen van natuurwetenschappelijke problemen.
(Diss.). CDO/THT, Enschede.
Posner, M.I., & McLeod, P. (1982). Information processing models, in search of elementary operations.
Annual Review of Psychology, 33, 477-514.
Reif, F., Larkin, J.H., & Bracke«, G.C. (1976). Teaching general learning and problem-solving skills.
American Journal of Physics, 44, 212-217.
Schoenfeld, H.A. (1979). Can heuristics be taught? In J. Lochhead and J. Clement (Eds.), Cognitive
process instruction (p. 315-338). Philadelphia: The Franklin Institute Press.
Vaags, D.W. (1975). Over het oplossen van technische problemen. (Diss.) TH Eindhoven.
Weeren, J.H.P. van. Mul, F.F.M. de, Peters, M.J., Kramers-Pals, H., & Roossink, H.J. (1979). Project
electriciteit en magnetisme. Eerste tussentijds verslag. TH Twente: CDO/AVC.
Woods, D.R., Crowe, C.M., Hofman, T.W., & Wright, J.D. (1979). Major Challenges to teaching
problem solving skills. Engineering Education, 277-284.
Manuscript ontvangen 4-3-1983
Definitieve versie ontvangen 10-6-1983
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 1, pp. 16-26.
Toetsen met Enkele Moeilijke Items voor de Sterke
Studenten
Robert F. van Naerssen
Psychologisch Laboratorium, Universiteit van Amsterdam
Achievement Tests with some difficuh items for the betier students
To motivate students it may be preferable to reserve the most difficult items for the better
students. The pass-fail decision is based on the easy items, the decision between higher marks on
all the items of the test. This simple method is totally transparent, justifiable and acceptable for
both students and teachers, as contrasted with differential weighting of items. If student samples
are very large, then item response parameters can be estimated by maximum likelihood methods,
and item response theory can also be used to estimate the relative efficiency of the shortened test
at the relevant levels. The teacher's sample of students, however, is small. In this paper a fast
computer program is treated, with which the relative efficiency of the shortened test at the
selection levels can be estimated. The efficiency is deduced from some stable sample statistics,
which can easily be calculated by the teacher: mean and standard deviation of p-values and item
test correlations. The inevitable assumptions - specific distribution of the difficulty and discrimi-
nation parameters, and of the trait - lead to crude estimates, but these may be useful. A simulation
study shows some encouraging results, especially when all or some items of the domain are
difficult, when the discrimination values are high, and when the number of alternatives is low.
PROBLEEM
In sommige gevallen is het om meerdere redenen ongewenst om alle studenten (leerlingen)
dezelfde toets af te nemen. Studenten met lage totale scores (hier de zwakken genoemd)
zullen ontmoedigd raken en bovendien door hun raden de meting ongunstig beïnvloeden. De
studenten met hoge scores (de sterken genoemd) zullen zich achteraf soms beklagen over de
simpelheid van de items en de (vermeende?) toevalligheid van hun judicium. Dit probleem
doet zich natu^urlijk vooral voor bij grote spreiding van de te meten trek (vaardigheid),
bijvoorbeeld bij intelligentiemeting van een steekproef van de gehele bevolking; maar o.a.
ook bij min of meer wiskundige vakken in de universitaire opleidingen binnen de faculteit der
Sociale Wetenschappen, waar zowel wiskundige vóóropleiding als aanleg van de studenten
enorm verschillen.
De Item Characteristic Curve (ICC) theory, ook genoemd Item Response Theory (Lord,
1980) biedt verschillende mogelijkheden om dit probleem op te lossen. Heeft men bij vorige
afnemingen van de items de discriminatie-index aj, de moeilijkheids-index b| en de raad-index
Cj van de items kunnen schatten, dan kan men de informatie van de items berekenen, en
daarmee die van de totale test, en dat voor alle relevant geachte waarden van de trek thèta.
Dat kan men nu ook doen voor de test waarbij enkele items met hoge moeilijkheid b, zijn
weggelaten, en het quotiënt van de nieuwe informatie en de oude he^t dan de relatieve
efficiëntie. Deze geeft aan in hoeverre het weglaten van de moeilijke items succesvol is
geweest. Is de relatieve efficiëntie bijvoorbeeld 1.2 dan weet men dat (voor de betreffende
trekwaarde) de (reeds verkorte) test zelfs nog met een factor 1.2 verkort kan worden om
dezelfde informatie (gegeven thèta) op te leveren als de oude onverkorte test. (Lord, 1980,
Ch. 5, of Birnbaum, Ch. 20 in Lord en Novick (1968)). De relevante trekwaarden zijn die
Van Naerssen 17
waarden van de trek (de te meten vaardigheden) op de grenzen van de judicia (bijv. A, B, C, D
(gezakt), of cum laude, met genoegen, voldoende, onvoldoende, of cijfers). Een van de
verdiensten van de ICC-theorie (en de reden waarom deze hier wordt gebruikt) is dat met het
begrip relatieve efficientie het belang van een test als meetinstrument voor een bepaald niveau
(van de trek) en t.o.v. een andere test, in een getal kan worden vastgesteld. De klassieke
testleer kent alleen waarde-begrippen voor de test in zijn geheel, zoals betrouwbaarheid en
validiteit. Dat weglaten van moeilijke items de waarde van de totale test kan verhogen wordt
echter ook binnen de klassieke testleer verklaard: deze items leveren door het raden, relatief
meer foutenvariantie, dan ware variantie aan de totale test.
In plaats van erg moeilijke (of erg gemakkelijke) items weg te laten kan men theoretisch
scherper differentiëren tussen personen op een bepaald niveau, wanneer men voor dat niveau
specifieke gewichten aan de items geeft, te berekenen uit de aj, b; en q van de items. Maar deze
optimale gewichten maken de scoring ondoorzichtig voor de studenten. Onder meer De
Groot (1970) en Cohen (1980) hebben gewezen op het sociale belang van transparantie van
de scoring. De methode van weglating van de moeilijke items is bijzonder simpel en daarom
voor iedereen aanvaardbaar.
Voor het betrouwbaar schatten van de parameters (van items en personen) heeft men met
de door Lord aanbevolen ML-methode echter vele tientallen nul-één-waarnemingen nodig
per parameter. Bij n personen en k items heeft men nk waarnemingen (itemscores) cn 3k
itemparameters plus n persoonsparameters (de thèta-waarden). Bij 50 items en 1000 perso-
nen heeft men nog een redelijk aantal waarnemingen per parameter, n.1. 43 (Lord, 1980, p.
56), maar bij 100 personen (al een groot aantal voor de meeste docenten die meerkeuzetoet-
sen gebruiken) is dit quotiënt gereduceerd tot 20, wat veel te weinig is. Bij 50 personen zijn er
12.5 waarnemingen per parameter. Men kan dan nog wel het aantal parameters verminderen
met plausibele aannamen. In de eerste plaats kan men de k c-waarden gelijkstellen aan één
gedeeld door het aantal alternatieven van de items; en dan kan men de n thèta-waarden
gelijkstellen aan een lineaire functie van de scores. Dat is redelijk als de test lang en
betrouwbaar is, maar de items niet te hoog intercorreleren. Dan heeft men in het laatste geval
bijvoorbeeld 25 waarnemingen per parameter. Toch zijn de zo gevonden aj en bj bij de voor
docenten gebruikelijke steekproefgrootten nog zeer instabiel. Op grond van deze bj de items
selecteren lijkt daarom vrij zinloos. Men kan hiervoor wellicht beter de p-waarden benutten.
Want bij alle door latente-trek-onderzoekers benadrukte nadelen van p-waarden, in het
bijzonder wanneer meerdere populaties personen in het spel zijn, heeft de p-waarde één
kardinaal voordeel: zij is zeer stabiel van steekproef tot steekproef (uit dezelfde populatie),
bijvoorbeeld vergeleken met item-test-correlaties en vooral vergeleken met geschatte laten-
te-trek-parameters.
Het heeft dus zeker zin voor de docent om, als hij moeilijke items wil reserveren voor de
sterken dat gewoon te doen op grond van de bij eerdere afnemingen berekende p-waarden.
Hij/zij moet de moeilijke items op het testformulier merken, en de zwakke leerlingen zullen
'leze dan over slaan. De slaag-zak-grens (tussen de judicia D en C) wordt namelijk uitsluitend
bepaald op grond van de niet-gemerkte items, stel op een proportie p van de niet-gcmcrkte
'tems. De grens tussen de judicia C en B kan men stellen op p of hoger van alle items en de
grens tussen B en A op een (nog) hogere proportie van alle items, of desgewenst op eenzelfde
proportie maar dan van een subgroep items waarbij de allergemakkelijkste zijn weggelaten.
Zwakke studenten zullen de gemerkte items overslaan omdat dat tijd spaart, omdat zij
"leestal tijd tekort komen en omdat zij alleen geïnteresseerd zijn in slagen. De beteren zullen
de moeilijke items wèl maken omdat zij geïnteresseerd zijn in hogere judicia en toch tijd over
hebben daar zij sneller werken. Dc methode heeft dus als bijkomend voordeel dat de toetstijd
18 Toetsen met enkele moeilijke items
gereduceerd kan worden. Het is bekend lioe zwakke studenten soms eindeloos lang kunnen
weifelen bij de invulling van de moeilijke items.
Het spreekt natuurlijk vanzelf dat een duidelijke explicatie van de methode voor de
studenten noodzakelijk is, evenals bij de methode van de zekeraanduiding, waarmee deze
methode enige overeenkomst heeft. Het cardinale verschil is dat bij elke 'confidence scoring'
de student bij elk item een beshssing moet nemen: is dit voor mij moeilijk (onzeker) of
gemakkelijk (zeker). Hier neemt de student vóór het tentamen zijn besluit, op grond van
ervaring of proeftentamens: mik ik op slagen of op hogere judicia? De methode heeft daarom
meer overeenkomst met een eerder beschreven methode, waarbij de student tevoren zijn
slaagkans voor het gehele tentamen moet opgeven (Van Naerssen, 1973). Nu echter loopt de
student geen risico door zijn keuze: hij kan niet zakken (D) door het slecht maken van de
moeihjke items, als hij deze gekozen heeft, want deze tellen alleen op het hoger niveau tussen
C en B of tussen B en A. Voorgesteld wordt dus dat de docent zijn toets verbetert door de
moeihjke items eenvoudig op grond van de p-waarden er uit te halen, eventueel met behulp
van het computerprogramma of door de bestudering van de hieronder vermelde varianten en
tabellen en het onderhavige onderzoek toont aan in welke gevallen dat kan, of raadzaam is.
Als de methode duidehjk en gespecificeerd op schrift staat, met tevoren vastgestelde normen,
zijn er geen juridische moeihjkheden te verwachten.
In het onderstaande wordt nu eerst een eenvoudig (en zeer snel) computerprogramma
beschreven waarmee men globaal kan nagaan of en in welke gevallen men succes zal hebben
bij het weglaten van de moeilijke items voor de zwakken of van de gemakkelijke items voor de
beteren, en dat op grond van de geschatte p-waarden; succes wat betreft de relatieve
informatie bij de relevante trekwaarden, d.w.z. op de grenzen van de judicia-intervallen. In de
daarop volgende paragraaf zal het gebruik van het programma worden toegelicht met een
reëel voorbeeld, en met enkele varianten daarvan. Aan de hand van deze voorbeelden zullen
ten slotte conclusies getrokken worden over de mogelijkheden van de methode om moeilijke
items niet te laten meetellen voor de slaag-zak-beslissing maar wel bij de hogere judicia.
Ook zal (in de appendix) worden ingegaan op een voor sommige Lord-lezers misschien
voor de handliggende alternatieve methode, gebaseerd op formule 6-20 van Lord (1980).
Deze alternatieve methode blijkt echter niet te voldoen bij de voor docenten gebruikelijke
steekproeven van minder dan 200 personen.
UITGANGSPUNT EN PROGRAMMA
Men kan, nogmaals, bij de kleine waarden van n waarmee de docent te maken heeft, niet
uitgaan van schattingen van de parameters aj, bj en q zelf. Maar men kan wel uitgaan van
enkele redelijk-stabiele steekproefwaarden van de toets: gemiddelden en standaardafwijkin-
gen van resp. de p-waarden en de itemtestcorrelaties (de laatste liefst gecorrigeerd voor
valsheid en attenuatie). Met deze vier gegevens, en natuurlijk het aantal items, kan men een
ruwe schatting maken, zoals later blijkt, van de onder- en bovengrenzen van de aj en b| van de
items. Uiteraard (of helaas, zo men wil) kan dat niet zonder een aantal aannamen. De
aannamen die in een eerder artikel (Van Naerssen, 1978) als ruwe benadering geaccepteerd
werden zijn: 1) de verdeling van de a, en die van de b; zijn rechthoekig; 2) tussen de aj en de bj
bestaat geen statistisch verband; 3) de verdeling van de trek thèta is standaardnormaal; 4) de
raadparameters q zijn gelijk en bijvoorbeeld gelijk aan het omgekeerde van het aantal
alternatieven. Met deze aannamen berekent het eerder beschreven programma (1978) de a-
en b-grenzen en met deze waarden berekent een nieuw programma (Van Naerssen, 1982) in
Van Naerssen 19
de eerste plaats de informatie van de items, en die van de test, voor een praktisch voldoende
aantal waarden van thèta. Dat zijn de 11 waarden -2.5 opklimmend met 0.5 tot -t-2.5. Het
programma accepteert voor deze 11 waarden een willekeurige (zij het discrete) verdeling van
thèta. Maar in het voorbeeld hieronder wordt, omdat iedere lezer gewend is een normale
verdeling te interpreteren, de quasi-normale verdeling (11369 10 96311) met n = 50
ingevoerd; 50 omdat men met deze kleine steekproefgrootte nog betrouwbare p-waarden kan
berekenen.
Men had ook uit kunnen gaan van normale verdelingen van a en b (hoewel van a normale
Verdelingen ook al weinig realistisch lijken), maar oude studies (bijv. Van Naerssen 1962,
deel 3) hadden al aangetoond dat normale en rechthoekige verdelingen veelal weinig ver-
schillende resultaten geven. Een studie over deze verschillen bij een soortgelijk probleem is
nog in uitvoering.
Het (nieuwe) programma genereert (simuleert) bovendien (weer met behulp van het
logistische model; voor de formules zie Lord, 1980) de itemscores van de n personen op de k
items. Daaruit worden in de eerste plaats de p-waarden berekend op grond waarvan de items
geselecteerd worden voor de verkorte test. Dit wordt herhaald voor een 2e, 3e en 4e groep
personen om te kunnen nagaan wat de invloed is van de steekproefgrootte. In het voorbeeld
onder worden dus de steekproefgrootten 50, 100, 150 en 200 gebruikt.
Omdat er slechts 11 (thèta-waarden) maal k (items) exponenten berekend hoeven te
Worden (voor de kansen volgens het logistische model) terwijl alle andere berekeningen
elementair zijn is het programma bijzonder snel (voor de CDC-computer 1.5 sec. CP-tijd per
variant; zie onder).
Om te kunnen controleren of de gegenereerde test overeenkomt, wat betreft scores en
p-waarden, met de test die men wil simuleren, berekent het programma gemiddelde en
standaardafwijking van die p-waarden, maar bovendien de scores met gemiddelde en stan-
daardafwijking van die scores en ten slotte de Kuder-Richardson-20 (alpha) van de gegene-
reerde test. Daarmee kan men, met trial and error, ook wel de juiste a- en b-grenzen vinden
zonder gebruik te maken van het programma uit '78. In feite is dat oude programma
gebaseerd op gesystematiseerde trial-and-error.
Het gebruik van het voor docenten ontworpen programma zal nu eerst geïllustreerd worden
aan de hand van een oud tentamen, hier genoemd de standaardtoets.
Een voorbeeld: de standaard-toets
De toets (testleer, nov. '81) bestond uit 70 tweekeuze-items en werd afgenomen bij 89
studenten. Daarvan hadden echter 9 een extreem lage score van 45 of lager (zogenaamde
'verkenners', zie Van den Brink, 1977). Deze kan men bij itemanalyses beter niet meereke-
nen vanwege de ruis die in alle steekproefwaarden gaat zitten. Bij de overige 80 personen gaf
de itemanalyse wat betreft de p-waarden een gemiddelde van 0.82 en een standaardafwijking
Sp van 0.14 en wat betreft de gecorrigeerde itemtestcorrelaties een gemiddelde van 0.17 en
een standaardafwijking van 0.15. De KR-20 was 0.64, een door 'restriction-of-range' door
het weglaten van de verkenners nogal lage waarde. De twee gemiddelden en standaardafwij-
kingen leverden, met het aantal van 70 items en een raadindex c van 0.5, ingevoerd bij het
oude programma, als grenzen van de a-waarden: 0.04 en 1.00 en van de moeilijkheidsindices
b: -4.17 en -1-1.85. Hieruit volgen de aj en de bj van de 70 items. Als men zich namelijk een
rechthoek indenkt gevormd door de 'breedtegraden' 0.04 en 1.00 en de 'lengtegraden' -4.17
'^n 1.85 dan bevinden de 70 'itempunten' zich op de middens van de 70 rechthoekjes die
ontstaan door de grote rechthoek te verdelen in 10 vertikale en 7 horizontale stroken (of
20 Toetsen met enkele moeilijke items
Tabel 1. Relatieve efficiëntie bij de 'standaardtoets' en n = 50 bij handhaving van de items
met Pc groter dan de aangeduide waarde.
Pc> 0 |
= -2.5 |
-2.0 |
-1.5 |
-1.0 |
-0.5 |
0.0 |
0.5 |
1.0 |
1.5 |
2.0 |
2.5 |
0.00 |
1.03 |
1.04 |
1.03 |
1.03 |
1.02 |
1.00 |
0.95 |
0.89 |
0.83 |
0.80 |
0.80 |
0.05 |
1.03 |
1.04 |
1.03 |
1.03 |
1.02 |
1.00 |
0.95 |
0.89 |
0.83 |
0.80 |
0.80 |
0.10 |
1.03 |
1.04 |
1.03 |
1.03 |
1.02 |
1.00 |
0.95 |
0.89 |
0.83 |
0.80 |
0.80 |
0.15 |
1.05 |
1.05 |
1.05 |
1.04 |
1.02 |
0.99 |
0.93 |
0.85 |
0.77 |
0.73 |
0.72 |
0.20 |
1.07 |
1.06 |
1.05 |
1.02 |
0.99 |
0.94 |
0.86 |
0.77 |
0.68 |
0.64 |
0.64 |
0.25 |
1.08 |
1.07 |
1.05 |
1.03 |
0.99 |
0.93 |
0.85 |
0.75 |
0.66 |
0.61 |
0.59 |
0.30 |
1.09 |
1.08 |
1.06 |
1.04 |
0.99 |
0.93 |
0.84 |
0.73 |
0.62 |
0.56 |
0.53 |
0.35 |
1.12 |
1.11 |
1.08 |
1.04 |
0.98 |
0.88 |
0.75 |
0.61 |
0.51 |
0.45 |
0.45 |
0.40 |
1.15 |
1.13 |
1.11 |
1.06 |
0.99 |
0.88 |
0.74 |
0.60 |
0.48 |
0.41 |
0.38 |
0.45 |
1.17 |
1.15 |
1.10 |
1.03 |
0.93 |
0.80 |
0.65 |
0.51 |
0.40 |
0.34 |
0.32 |
0.50 |
1.23 |
1.19 |
1.12 |
1.00 |
0.84 |
0.68 |
0.53 |
0.42 |
0.35 |
0.31 |
0.30 |
omgekeerd: in Van Naerssen (1978) werd reeds vermeld dat dat empirisch niet veel blijkt uit
te maken; zie ook onder, variant X).
Het nieuwe programma genereerde met deze gegevens en de bovengenoemde quasi-nor-
male verdeling van de trek bij resp. n = 50, 100, 150 en 200 als belangrijkste uitkomst de
relatieve efficiëntie van een verkorte test, bij de 11 trekwaarden -2.5 tot +2.5, en dat bij
resp. weglating van de items met (op raden gecorrigeerde) p-waarden kleiner dan 0.00, 0.05,
..., 0.50. De correctie geschiedt met de klassieke formule p,. = (p-c)/(l -c). Voor n = 50
staan de relatieve efficiënties in tabel 1 en voor n = 200 in tabel 2. Het heeft geen zin
efficiënties voor de tussenliggende waarden van n te vermelden.
De eerste kolom van de tabellen 1 en 2 geeft de minimum (gecorrigeerde) p-waarde van de
behouden items. Hoeveel items dat zijn staat in de frekwentietabel van de p-waarden (tabel
3), die betrekking heeft op n = 200.
Tabel 2. Relatieve efficiëntie bij de 'standaardtoets' en n = 200 bij handhaving van de items
met Pc groter dan de aangeduide waarde.
Pc> © |
= -2.5 |
-2.0 |
-1.5 |
-1.0 |
-0.5 |
0.0 |
0.5 |
1.0 |
1.5 |
2.0 |
2.5 |
0.00 |
1.00 |
1.00 |
1.00 |
1.00 |
1.00 |
1.00 |
4.00 |
1.00 |
1.00 |
1.00 |
1.00 |
0.05 |
1.02 |
1.02 |
1.02 |
1.02 |
1.01 |
1.00 |
0.98 |
0.94 |
0.91 |
0.89 |
0.90 |
0.10 |
1.03 |
1.03 |
1.03 |
1.02 |
1.01 |
0.99 |
0.96 |
0.91 |
0.87 |
0.84 |
0.83 |
0.15 |
1.05 |
1.04 |
1.04 |
1.03 |
1.02 |
0.99 |
0.94 |
0.88 |
0.81 |
0.76 |
0.75 |
0.20 |
1.06 |
1.06 |
1.06 |
1.05 |
1.02 |
0.98 |
0.92 |
0.83 |
0.74 |
0.68 |
0.66 |
0.25 |
1.08 |
1.07 |
1.07 |
1.05 |
1.01 |
0.96 |
0.88 |
0.78 |
0.68 |
0.62 |
0.61 |
0.30 |
1.08 |
1.07 |
1.07 |
1.05 |
1.01 |
0.96 |
0.88 |
0.78 |
0.68 |
0.62 |
0.61 |
0.35 |
1.10 |
1.09 |
1.08 |
1.06 |
1.02 |
0.95 |
0.87 |
0.76 |
0.65 |
0.59 |
0.57 |
0.40 |
1.23 |
1.20 |
1.16 |
1.07 |
0.94 |
0.77 |
0.59 |
0.44 |
0.35 |
0.30 |
0.30 |
0.45 |
1.24 |
1.21 |
1.16 |
1.08 |
0.94 |
0.75 |
0.56 |
0.41 |
0.31 |
0.26 |
0.24 |
0.50 |
1.25 |
1.21 |
1.14 |
1.03 |
0.87 |
0.69 |
0.51 |
0.37 |
0.28 |
0.24 |
0.23 |
Van Naerssen 21
Tabel 3. Frekwentietabel van de p^-waarden van de 'standaardtoets', n = 200. | ||||||||||
|
Zo blijkt uit tabel 3 dat, als men p^ = 0.3 als minimum accepteert, men 5 items verwijdert.
Tabel 2 laat zien dat de relatieve efficiëntie bij pc = 0.3 nog groter is dan 1.0 zolang thèta
hoogstens gelijk is aan -0.5, dus, omdat thèta wordt verondersteld standaardnormaal ver-
deeld te zijn, zolang hoogstens 31% pleegt te zakken. Zakt de helft of meer dan is weglating
van items hier altijd nadelig wat betreft de relatieve efficiëntie, maar beschouwt men an-
derzijds slechts 2'/2% van de populatie 'onder de norm' dan is de relatieve efficiëntie bij
weglating van de vijf items met laagste p-waarde 1.07. Deze waarde stijgt tot 1.21 wanneer
men de minimum p-waarde op 0.5 stelt, dus (tabel 3) wanneer men 21 van de 70 items
verwijdert. Hoe meer moeilijke items men echter weglaat, hoe slechter de test wordt aan de
hoge zijde van thèta, bij de sterken. Pleegt men bijvoorbeeld 34% van de studenten een
judicium B of hoger te geven (dus thèta = 1.0 blijkens de standaardnormaaltabel) dan zou
Weglating van de vijf items met laagste p-waarde reeds een verlaging geven van de relatieve
efficiëntie op dat punt tot 0.78. De tabel suggereert dat men bij dit tentamen voor het
judicium B tenminste alle items moet handhaven maar vermoedelijk zelfs nog wat moeilijker
Items moet toevoegen.
Vergelijking van de tabellen 1 en 2 toont dat n = 50 tot praktisch dezelfde relatieve
efficiëntie leidt als n = 200. Natuurlijk kan men verwachten dat de getallen des te nauwkeuri-
ger zijn naarmate n groter is, maar een steekproef van 50 personen blijkt al groot genoeg om
de relatieve efficiënties praktisch geheel te kunnen vertrouwen. De verschillen zijn nauwelijks
groter dan die welke verkregen werden bij een andere 'seed' van dc gebruikte random
getallen (hier niet afgedrukt).
Enkele varianten van testsituaties
Hoewel elke docent voor zijn speciale tentamen, met specifiek aantal items, aantal alternatie-
ven en gemiddelde en standaardafwijking van p-waarden en itemtestcorrelaties, dus ook
KR-20, het beste het onderhavige programma kan gebruiken, zijn de in deze paragraaf te
behandelen varianten toch instructief. Het programma werd in eerste instantie gedraaid met
een aantal varianten van het 'standaardtentamen' uit de vorige paragraaf, waarbij, voor dc
overzichtelijkheid en interpreteerbaarheid, elke variant slechts in één opzicht verschilt van
het standaardtentamen. Daarna werden toch nog enkele varianten toegevoegd omdat de
meeste lezers vermoedelijk eerder vicrkeuzetoetsen dan tweekeuzetoetsen gewend zijn.
Ook bij alle varianten bleken de resultaten bij n = 50 praktisch gelijk aan die bij n = 200.
Om ruimte te sparen zullen alleen de resultaten bij n = 200 gegeven worden. Om ook verder
nog ruimte te sparen wordt in dc overzichtstabel 4 van elke variant slechts één regel vermeld,
namelijk die waarbij alleeen items met een op raden gecorrigeerde p-waarde van minstens 0.5
Worden gehandhaafd. Voorts worden alleen de middelste zeven thètawaarden (van -1.5 tot
+ 1-5) in de tabel opgenomen, dus die welke (blijkens tabellen van de standaardnormale
Verdeling) overeenkomen met thèta-pcrcentielscores van 7, 16, 31, 50, 69, 84 en 93).
Anderzijds zijn toegevoegd kolommen met: aantal items verwijderd en de uit de simulatie
berekende waarde van gemiddelde en standaardafwijking van de p's, en van de KR-20 (alle
22 Toetsen met enkele moeilijke items
Tabel 4. Relatieve efficiëntie bij varianten (n = 200, Pc > 0.50) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
drie berekend bij de complete test van 70, resp. 35 items). Deze drie kolommen zijn van nut
voor de interpretatie: men is gewend om met p-waarden en testbetrouwbaarheid te werken,
en niet met de a- en b-waarden van het logistische model.
De varianten zijn:
I. groter b-bereik (range 2.0 groter)
II. kleiner b-bereik (range 2.0 kleiner)
III. moeilijker items (b's 1.0 hoger)
IV. kleiner a-bereik (range 0.4 kleiner)
V. hogere a-waarden (a's 0.5 hoger)
VI. vierkeuzetoets (35 vierkeuze-items i.p.v. 70 tweekeuze-items)
VII. idem maar met b-grenzen als van I
VIII. idem maar met moeilijker items, b-grenzen als van III
IX. idem maar met meer discriminerende items, a-grenzen als van V
Men ziet aan tabel 4 dat
I. als de b-range toeneemt, met uiteraard grotere Sp en (zeer) lage KR-20, dan wordt het des
te voordeliger om moeilijke items weg te laten voor de slaag-zak-beslissing, en nu ook bij
forsere zak-percentages; althans bij de tweekeuze-tbets, niet bij de overeenkomstige
vierkeuze-toets (variant VII);
II. als, omgekeerd, de b-range afneemt, met kleinere Sp en hogere KR-20, dan verdwijnt het
nut van de methode; bij een 'peaked test' geldt: hoe meer items hoe beter;
III. als alle items wat moeilijker zouden zijn, of de groep een lagere vaardigheid zou bezitten,
dan wordt het zeer gewenst om de methode toe te passen; maar: hoe meer men wint aan de
lage zijde van thèta, hoe meer men veriiest aan de hoge kant;
IV. als de a-range afneemt leidt dit tot hogere KR-20 maar het nut van de itemselectie blijft
ongeveer gelijk aan dat bij de standaardtoets;
V. als de a-waarden hoger worden, wat natuuriijk vooral zichtbaar is in een hogere KR-20,
bijvoorbeeld bij een homogene toets of een meer heterogene groep, dan wordt de methode
uiterst nuttig;
Van Naerssen 23
als men in plaats van 70 tweekeuze-items 35 vierkeuze-items gebruikt, met dezelfde a- en
b-waarden, dan is er minder reden om items weg te laten bij slaag-zak-beslissing; vermoede-
J'jk is de methode vooral goed bruikbaar bij een gering aantal alternatieven, dan immers is de
•nvloed van raden het ernstigst bij moeilijke items; dit bhjkt ook bij de volgende varianten met
vierkeuze-items;
als, bij vierkeuze-items, de b-range toeneemt net als bij variant I, dan zakt de be-
trouwbaarheid minder dan bij tweekeuze-items, maar het nut van de itemselectie is hoogstens
nog aanwezig bij zeer lage thèta;
^in. als, bij vierkeuze-items, de vragen moeilijker worden, de b-waarden hoger, dan is de
methode, net als bij de overeenkomstige variant III, zeer nuttig;
IX. als, bij vierkeuze-items, de discriminatie-waarden a groter worden, net als bij variant V,
dan is de methode ook zeer nuttig, zij het toch weer minder dan bij tweekeuze-items.
Tenslotte is in tabel 4 nog variant X toegevoegd. Hierbij zijn er niet zoals bij de andere
varianten meer verschillende b-waarden dan a-waarden, maar omgekeerd; er zijn hier 7 a's en
5 b's i.p.v. 5 a's en 7 b's. De verschillen met de overeenkomstige variant VI zijn wel niet nul,
maar toch gering en in feite ongeveer even groot als die welke men krijgt als men uitgaat van
een andere 'seed'.
Deze tien kwalitatieve bevindingen zijn allemaal in overeenstemming met hypothesen die
men tevoren had kunnen opstellen: weinig verrassend, maar anderzijds is het toch wel
l^evredigend dat dc theorieën kloppen. Doch het gaat natuurlijk om de kwantitatieve gege-
vens. De docent kan, uitgaande van zijn speciale toets bij zijn speciale populatie, na bereke-
ning van gemiddelde en standaardafwijking van zijn p-waarden en itemtestcorrelaties, schat-
ten welk nut hij/zij heeft van de methode van het weglaten van moeilijke items voor de
zwakken of toevoegen van moeilijke items voor de sterken, en dat in termen van relatieve
efficiëntie.
Het weglaten van gemakkelijke items
Het programma geeft ook de relatieve efficiëntie bij weglating van de gemakkelijkste items,
met Pc-waarden groter dan 0.95, 0.90, enz. Nergens leidt deze methode echter tot verhoging
van de relatieve efficiëntie, wel juist tot min of meer drastische verlaging, en natuurlijk vooral
bij de lage thèta's. Achteraf is het niet verwonderlijk dat wegladng van de gemakkelijkste
Items hier geen nut toont. Intuïtief zou men kunnen aannemen dat de gemakkelijke items ruis
Veroorzaken door onoplettendheid e.d. maar mogelijk spelen deze factoren ook niet een
merkbare rol in de werkehjkheid: zelfs de sterkste student kan het wellicht nog opbrengen om
tijdens het één of twee uur durende tentamen zijn aandacht ook nog te richten op de simpele
|tems, wetend dat deze eveneens belangrijk zijn voor zijn score - mits er een aantal andere
'tems is waar hij zijn tanden in kan zetten. Alleen als er helemaal geen moeilijke items in het
tentamen zitten, dan zullen misschien gevoelens van frustratie of teleurstelling te verwachten
Zijn, evenals bij de zwakken overigens wanneer, omgekeerd, te veel moeilijke items in de toets
aanwezig zijn.
CONCLUSIE EN SAMENVATTING
Er zijn belangrijke psychologische redenen om bij een breed spreidende groep, zoals een
steekproef uit de totale bevolking of een klas gammawetenschappehjke studenten bij min of
meer wiskundige stof, niet alle personen dezelfde vragen voor te leggen. De zwakken worden
24 Toetsen met enkele moeilijke items
daar immers door ontmoedigd en de sterken verveeld. Daarnaast zijn er meettechnische,
psychometrische redenen. De item-respons-theorie biedt vele methoden om dit probleem op
te lossen, bij voorbeeld 'tailord testing' en 'two-stage-testing' (zie bijv. Lord, 1980).
Helaas is het voor al deze methoden noodzakehjk om de itemparameters aj en bj, eventueel
ook Cj, te schatten, naast de vaardigheidsparameters van de personen. Dat kan alleen vol-
doende betrouwbaar geschieden bij zeer grote steekproeven, veel groter dan zelfs de prope-
deuse-docent zal aantreffen. (Zie ook de appendix).
Bij de hier geschetste methode worden niet de item parameters a en b zelf geschat maar
alleen hun gemiddelde en hun range, en wel uit de relatief stabiele gemiddelden en standaard-
afwijkingen van p-waarden en itemstestcorrelaties. De methode bestaat hierin dat een aantal
gemerkte moeilijke items door de zwakken kan worden overgeslagen omdat de slaag-zak-
grens alleen betrekking heeft op de overige, gemakkelijke items. De moeilijke items zullen
echter wel door de sterke studenten beproefd worden, en hen in feite meer motiveren, omdat
deze wel meegerekend worden bij de hogere judicia (A en B). De methode is, in tegenstelling
tot ingewikkelder weging van items, zeer doorzichtig en daardoor aanvaardbaar voor alle
partijen.
In het onderhavige onderzoek wordt wel gebruik gemaakt van de item-responstheorie
omdat deze het voordeel biedt van een goede maat te leveren - de relatieve efficiëntie - voor
het nut van een toets die op een bepaald niveau moet differentiëren, maar zonder dat de
itemparameters zelf geschat hoeven te worden. Uitgegaan wordt van klassieke
steekproefgrootheden: p-waarden en itemtestcorrelaties, waarvan dan alleen de van
steekproef tot steekproef stabiele gemiddelden en standaardafwijkingen gebruikt worden
voor de berekening van de relatieve efficiëntie bij weglating van de items met de laagste
p-waarden; ook p-waarden zijn zeer stabiel.
Een snel programma werd ontwikkeld waarmee de docent met deze gegevens kan schatten
in hoeverre de methode voor zijn combinatie van studentengroep en itemdomein bruikbaar is,
d.w.z. tot hogere informatie leidt op de beoogde niveau's. Als 'standaardtoets' werd, ter
illustratie van het gebruik van het programma, een 70-item-tweekeuze-toets gekozen, die was
afgenomen bij 80 personen (niet-verkenners). Hier bleek bijvoorbeeld een verhoging van de
relatieve efficiëntie bij weglating van de 21 items met laagste p-waarde, mits hoogstens 20%
van de groep studenten (thèta iets hoger dan -1, zie tabel 4) onvoldoende wordt geacht. Als
steeds gaat verhoging van de relatieve efficiëntie bij lage thèta gepaard met verlaging bij hoge
thèta: in de hogere regionen moet men de moeilijke items dus juist handhaven of men moet er
zelfs een aantal bij toevoegen.
Variëren van parameters, in het bijzonder de a| en de b| - het aantal items is niet interessant
en het aantal personen blijkt dit ook niet te zijn - leidt tot de volgende conclusies: de methode
is vooral van nut bij in het algemeen moeilijke items en hoge itemdiscriminaties, voorts bij
grote spreiding van moeilijkheid en bij tweekeuzetoetsen.
Maar zelfs wanneer de relatieve efficiëntie in plaats van groter dan 1.0 iets kleiner is, zal
men wellicht de voorkeur geven aan de methode omdat zij tot minder frustraties leidt bij de
studenten en minder tijd vergt bij de afneming.
APPENDIX
Lord (1980) heeft een formule (6-20) gepubhceerd, die ogenschijnlijk handig is voor het
onderhavige probleem. Met enkele vereenvoudigende aannamen, in het bijzonder dat de
scoreverdehng gebruikt kan worden als een benadering van de trekverdeling, komt hij tot een
Van Naerssen 25
formule die de relatieve efficiëntie van een testscore ten opzichte van die van een andere test
geeft als functie van de beide testscores, de bijbehorende scorefrequenties, en de aantallen
Items in de tests. De beide testscores moeten daarbij overeenkomen met dezelfde per-
centielscore. Het aantrekkelijke zit natuurlijk hierin dat men op bijzonder eenvoudige wijze
de relatieve efficiëntie van twee tests kan berekenen, uitgaande van alleen de scorefrequen-
ties, dus niet van p-waarden en itemtestcorrelaties, zoals bij de hier geëxposeerde methode.
Lord schrijft dat de methode direct is toe te passen bij 1000 ppn of meer. Bij minder moet men
de scoreverdeling gaan 'smoothen'.
Met een programma (D 201) werd getracht de methode te gebruiken voor N = 50 en N =
200 en gladstrijken met behulp van de negatief-hypergeometrische (Polya-)verdeling. Zie
Lord en Novick (1968, 23.6). Deze theoretische verdeling lijkt bijzonder geschikt omdat er
zowel scheve als normale, slanke zowel als platte of zelfs tweetoppige empirische verdelingen
mee gedekt kunnen worden. Uitgaande van een verzameling parameters van de items worden
door het programma itemscores berekend volgens het logistische model, en daaruit gemid-
delde score en betrouwbaarheid (KR-20 zowel als KR-21), voorts natuurlijk de p-waarden
omdat de items daarop geselecteerd worden. Van de totale test zowel als van de verkorte test
(zonder de te moeilijke items) worden de scorefrequenties geschat met de Polya-verdeling uit
de gemiddelde score en betrouwbaarheid (zowel KR-20 als -21 werden geprobeerd). Voor
elke score wordt met Lord's formule 6-20 de informatie berekend, en daaruit worden voor
een aantal tevoren gestelde percentielscores met lineaire interpolatie weer informaties bere-
kend. Dit alles voor de totale test en de verkorte, waarna door deling de relatieve informatie
berekend wordt.
Deze nu kan direct vergeleken worden met de uit de itemparameters te berekenen relatieve
mformatie, uiteraard berekend voor dezelfde percentielscores (zij het hier van de trek). De
laatste relatieve informaties kunnen de 'ware' genoemd worden. De met Lord's formule 6-20
en de Polya-gladstrijking berekende waarden moeten hier ongeveer mee overeenstemmen.
Helaas doen zij dat niet. Dc relatieve efficienties moeten bijvoorbeeld voortdurend afne-
men met toenemende score en trek; dat doen de berekende ware relatieve efficienties ook
keurig, maar die via de Polya-verdeling geschatte waarden niet. Kortom, hoewel de Polya-
verdeling vaak op het oog een mooie gladgestreken scoreverdeling oplevert, is zij hiervoor
blijkbaar niet geschikt. Op andere wijze 'smoothen' lijkt mij hier ook tot arbitraire waarden te
leiden, zodat ik voorlopig concludeer dat Lord's formule 6-20 alleen geschikt is voor (zeer)
grote steekproeven.
LITERATUURVERWIJZINGEN
Brink, W.P. van den (1977). Het verken-effect. Tijdschrift voor Onderwijsresearch, 2, 253-261.
Cohen, M.J. (1981) Sludierechten in het wetenschappelijk onderwijs. Zwolle: Tjeenk Willink.
Groot, A.D. de (1970). Some badly needed non-statistical concepts in applied psychometrics. Nederlands
Tijdschrift voor de Psychologie, 25, 360-376.
Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, N.J.
Erlbaum.
Lord, P.M., & Novick M.R. (1968). Statistical theories of mental testscores. Reading, Mass.: Addison-
Wesley.
Naerssen, R.F. van (1962). Selectie van chauffeurs. Groningen: Wolters.
Naerssen, R.F. van (1973). Betrouwbaarheid van de eindscore bij gebruik van tevoren geschatte score.
Nederlands Tijdschrift voor de Psychologie, 28, 281-288.
26 Toetsen met enkele moeilijke items
Naerssen, R.F. van (1978). Een snel programma voor de simulatie van een gegeven test. Tijdschrift voor
Onderwijsresearch, 3, 281-283.
Naerssen, R.F. van. Een programma voor de berekening van de relatieve efficiëntie bij weglating van
items op grond van de p-waarde (Memo Dl96). Vakgroep Methodenleer, Subfaculteit Psy-
chologie, Universiteit van Amsterdam.
Naerssen, R.F. van. Een programma voor de berekening van de relatieve efficiëntie van een verkorte test
met behulp van de Polya-verdeling van scores (Memo D 202). Vakgroep Methodenleer,
Subfaculteit Psychologie, Universiteit van Amsterdam.
Manuscript ontvangen 22-12-1982.
Definitieve versie 18-5-1983.
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 1, pp. 27-33.
Notities en Commentaren
groeiend inzicht?
Een kritiek op het simuleren van Kunstmatige Intelligentie met leerlingen
H.F.M.M. Verstralen
C/ro, Afd. Onderzoek en Psychometrische Dienstverlening, Arnhem
1- Inleiding
De laatste jaren is een aantal artikelen verschenen waarin men beoogt onderwijs vorm te
geven volgens ideeën die ontleend zijn aan een bepaald paradigma binnen het cognitief
psychologisch onderzoek.
Onderzoekers binnen dit paradigma streven ernaar om computerprogramma's te ontwik-
kelen die menselijke cognitieve functies simuleren, zoals probleemoplossen en verstaan en
produceren van natuurlijke taal. Dit onderzoek heeft vooral in de Verenigde Staten opgang
gemaakt door o.a. het werk van Newell en Simon (1972) op het gebied van probleemoplossen
en Schank (Schank & Colby, 1973) en Winograd (1973) op het gebied van taalverwerking.
Mede hierdoor wordt deze stroming wel aangeduid als het 'amerikaanse informatie vcrwer-
l^ings paradigma', of als 'het Kunstmatige Intelligentie paradigma'. Wij duiden deze stroming
verder aan met de naam 'K.I.'.
Geïnspireerd door het K.I.-paradigma schreven Brown en Burton (1977) een computer-
Programma dat 60 systematische fouten in het rekenen van kinderen kan diagnostiseren,
Voung en O'Shea (1981) brachten hierin enige vereenvoudigingen aan. Bhaskar en Simon
(1978) ontwikkelden een programma dat het oplossen van problemen in de thermodynamica
simuleert. Elshout en Wielinga (1979) zijn inmiddels een eind gevorderd in het construeren
van een programma dat een hardopdenk-protocol over het oplossen van thermodynamica-
Problemen volgt en analyseert. Breuker (1982) ontwikkelt onderwijs in lezen en schrijven van
teksten gebaseerd op ideeën van Kintsch (bijv. Kintsch & Van Dijk, 1978) en Schank.
In deze notitie betogen we dat onderwijs op deze leest geschoeid, niet zonder meer een
Verbetering genoemd kan worden. Integendeel, onderwijs dat te eenzijdig op K.I.-principes
berust, kan schade toebrengen aan het ontluikende begrip van schoolleerstof dat leerlingen
ontwikkelen. We onderbouwen dit standpunt door eerst ons beeld te schetsen van menselijke
cognitie en de rol die taal hierin speelt, welk beeld we confronteren met de uitgangspunten van
het K.I. onderzoek. Tenslotte zetten we uiteen dat een groot deel van menselijke cognitie, dat
essentieel is voor begrip, buiten het blikveld is verdwenen van het onderwijs dat vanuit het
'^.I.-paradigma is ontwikkeld.
Adres auteur: CITO, Postbus 1034, 6801 MG Arnhem.
-ocr page 32-28 Notities en commentaren
2. Produceerbare en niet-produceerbare bewustzijnsinhouden
In ons bewustzijn verwezenlijken we een voortdurende stroom van kwalitatief onderscheiden
onderling gerelateerde inhouden. Voor een belangrijk deel verwerkelijken wij deze inhouden
met behulp van onze zintuigen en de rest bestaat uit fantasieën en dromen. Beide groepen van
bewustzijnsinhouden zijn voortdurend gelijktijdig in een bijna onontwarbare mengeling
aanwezig. Het zwaartepunt lijkt soms meer (bij dagbewustzijn) soms minder (bij dromen) op
basis van actuele zintuigelijke activiteit te zijn geconstrueerd.
Bewustzijnsinhouden die wij met behulp van onze zintuigen verwerkelijken noemen we
waarnemingen. Voor zover bewustzijnsinhouden niet op basis van actuele zintuigelijke
activiteiten zijn opgebouwd, noemen we ze fantasieën. We gaan er vanuit dat wij bij waarne-
mingen en fantasieën dezelfde neurale structuren gebruiken (Neisser, 1970; Paivio, 1977).
Fantasieën onderscheiden zich slechts van waarnemingen doordat wij ze construeren zonder
beperkingen door actuele zintuigelijke activiteiten. Zij zijn noch gebaseerd op actuele zintui-
gelijke activiteiten noch vindt controle tegen zintuigelijke activiteit plaats. Zowel in fan-
tasieën als in waarnemingen kunnen zeer abstracte mentale activiteiten een rol spelen. In
principe zijn bewustzijnsinhouden beperkt tot een individu. Toch kunnen individuen bewust-
zijnsinhouden meer of minder gemeenschappelijk hebben. Twee personen die hetzelfde stuk
bosgrond bekijken hebben een groter gelijkenis van bewustzijnsinhoud naarmate hun opvoe-
ding en cultuur betreffende bosgrond meer overeenkomst vertonen. Hiervoor geldt hetzelfde
als bijvoorbeeld bij het kijken door een microscoop. Een geoefend bioloog neemt hierin veel
meer structuur waar dan een leek. Kunnen wij onze waarnemingen nog enigszins in het
bewustzijn van een ander inbrengen, bijvoorbeeld door de ander er opmerkzaam op te
maken, met de meeste van onze fantasieën is dit niet op dezelfde directe manier mogelijk. De
enige uitzondering wordt gevormd door de fantasieën die wij in de waarneembare buiten-
wereld kunnen produceren, zoals bijvoorbeeld fantasieën over ons stemgeluid. Wanneer deze
fantasieën tenminste niet al te zeer bezijden de werkelijkheid zijn. Mijn fantasieën over mijn
stemgeluid kan ik vrijwel onmiddellijk ongeveer net zo in het bewustzijn van een ander
aanwezig laten zijn. Iets moeilijker ligt het met schrifttekens. Maar met papier en schrijfgerei
kan ook op dit terrein een en ander worden bereikt. Hoewel zij slechts een klein deel van het
totaal aan bewustzijnsinhouden van mensen uitmaken, hebben fantasieën over stemgeluid en
schrifttekens dus het geweldige voordeel dat ze gemakkelijk ontsloten kunnen worden uit
ieders privé-bewustzijn en ingebracht kunnen worden in de buitenwereld. Daardoor kunnen
zij als waarneming in het bewustzijn van een ander opnieuw worden geconstrueerd.
Op sommige gebieden bezitten de meeste mensen de mogelijkheid om relatief complexe
structuren in hun bewustzijn te verwerkelijken. Eén van deze gebieden is de visuele waarne-
ming van menselijke gezichten in hun gebruikelijke stand (rechtop). Een ander gebied is het
waarnemen en/of fantaseren van lexicale en syntactiscKe auditieve en/of visuele structuren.
Deze laatste vaardigheden spelen een belangrijke rol, hoewel niet de hoofdrol, bij begripvol
taalgebruik.
Mensen kunnen hun waarnemingen met allerlei fantasieën combineren en fantasieën ook
onderling. Zo kan een ervaren automonteur bij het horen van een bepaald motorgeluid in
fantasie 'zien' hoe de ontsteking verkeerd is afgesteld.
Verder kunnen mensen leren om aan waarnemingen die zij kunnen classificeren bepaalde
fantasieën te koppelen. Zo kan een kind Ieren om bij het zien van kachels opnieuw het
brandende gevoel ^an zijn handje te fantaseren en het verminderen van dit gevoel als hij het
handje terugtrekt.
Mensen hebben van deze mogelijkheid tot hel koppelen van min of meer vaste fantasiepa-
tronen aan classificeerbare waarnemingen gebruik gemaakt bij het scheppen van taal, gespro-
Verstralen 29
ken en geschreven, en in het algemeen door het scheppen van symboolstructuren. In de loop
van de eeuwen ontwikkelden groepen mensen onder elkaar fantasieën die in de buhenwereld
gemakkehjk te produceren waren en bij waarneming gemakkelijk te categoriseren: spraak-
geluiden en schrifttekens. Door deze groep fantasieën, de symbolen, systematisch in samen-
hang met als gemeenschappehjk ervaren waarnemingen en fantasieën te gebruiken kon men
in het bewustzijn van elkaar fantasieën oproepen die niet of niet gemakkelijk in de buiten-
wereld te produceren zijn.
Zelfs is het hierdoor mogelijk bij een ander fantasieën op te roepen die wij zelf alleen als
waarneming kunnen reahseren, of zelfs dat niet eens. Zo kan een geboren blinde mij
bijvoorbeeld vertellen, dat er twee straten verder een rode brievenbus is geplaatst. Behalve dit
alledaagse gebruik, kunnen we met symbolen en taal een ander stimuleren meer genuanceerd
en abstracter waar te nemen en te fantaseren. Kunst- en wetenschapsonderwijs danken
hieraan hun bestaansrecht.
Hierboven is steeds stilzwijgend verondersteld dat productie van stemgeluid in de buiten-
wereld wordt voorafgegaan door auditieve fantasieën hierover en de productie van schrift-
tekens door visuele fantasieën. Hoewel dat goed mogelijk is, is het, zeker theoretisch, niet
noodzakelijk dit te veronderstellen. De senso-motoriek die nodig is om iets in de buiten-
wereld te produceren kan men opvatten als gebaseerd op mentale activiteit. Het is niet nodig
om te veronderstellen dat deze mentale activiteit wordt voorafgegaan door fantasieën over de
waar te nemen effecten ervan. Bij spraakproductie zou een artikulatie-programma op zich
voldoende zijn. Echter bij de terugkoppeling en controle op dit programma blijken fantasieën
over de effecten een rol te spelen. Vertraagd horen van de eigen stem, kan de productie zelfs
onmogelijk maken. Het voorgestelde model over menselijke cognitie ondergaat hierdoor
mijns inziens geen essentiële wijziging. In het vervolg blijven we derhalve spreken over
auditieve fantasieën over stemgeluid en visuele fantasieën over schrifttekens, die vervolgens
in de buitenwereld geproduceerd kunnen worden. Fantasieën over stemgeluid en schrift-
tekens maken deel uit van de produceerbare fantasieën, evenals een deuntje fluiten en in het
algemeen het maken van bewegingen met ons lichaam. Alle andere fantasieën die niet via ons
lichaam in de buitenwereld geproduceerd kunnen worden, noemen we niet-produceerbaar.
In dc volgende paragraaf beschrijven we de rol van niet- ot niet gemakkelijk produceerbare
fantasieën in de wetenschap.
Wetenschap, fantasieën en dc constructie van symboolstructuren
Onder andere Shepard (1978) en Hadamard (1954) beschreven hoe (vooral visuele) fan-
tasieën ten grondslag liggen aan baanbrekende (natuur-)wetenschappelijke ontwikkelingen.
Meestal betrof het fantasieën van een complexiteit, helderheid en gedetailleerdheid, die voor
de meeste stervelingen niet realiseerbaar zijn. Bijvoorbeeld Tesla, Faraday en Einstein
moesten produceerbare fantasieën (symboolstructuren) construeren bij hun niet-produceer-
bare fantasieën om te voorkomen dat zij verloren zouden gaan. Met deze symboolstructuren
Zouden anderen min of meer dezelfde fantasieën kunnen verwerkelijken.
Omdat deze fantasieën nieuw waren, bestond er natuurlijk nog geen symbolisme voor. Om
nu toch anderen in staat te stellen deze niet produceerbare nieuwe fantasieën ook in hun
bewustzijn te creëren en eventueel te verbeteren moesten de eerste scheppers deze fantasieën
m onderdelen uiteenleggen. Zowel deze onderdelen als de koppeling hiervan aan symbolen
moeten voor anderen bekend zijn.
Verder worden anderen (en ook zijzelf) geholpen, doordat zij hun fantasieën, behalve
mdirect via symbolen, ook met apparaten, meetinstrumenten, enz. in de buitenwereld produ-
ceren. De apparaten, eenmaal gebouwd, helpen anderen verder om, ook weer net zoals
30 Notities en commentaren
bijvoorbeeld Tesla, naar electromagnetische verschijnselen te kijken. Zolang het anderen
niet lukt om zich deze manier van kijken eigen te maken, vegeteert Tesla's inzicht slechts
voort in een schijndood symbolisme.
Bij sommige kunsten kan men eenzelfde soort cyclus onderscheiden.
4. Kunstmatige Intelligentie en. menselijke cognitie
We beschrijven nu de aard van het K.I.-onderzoek en vergelijken dit met de boven gegeven
schets van menselijke cognitie.
Onderzoekers die binnen het K.I.-paradigma werken gaan ervan uit dat aan iedere vorm
van intelligent gedrag processen ten grondslag liggen die symbolische informatie manipule-
ren' (Elshout en Wielinga, 1981). Het meest algemene model dat 'symbolische informatie
manipuleert' is de Turing machine. Voor iedere specificeerbare procedure kan een Turing
machine worden ontworpen die deze procedure uitvoert. Dit geldt ook voor procedures die
eventueel in de verre toekomst worden ontworpen voor menselijke senso-motoriek. Het
model is zo algemeen dat het hoogstwaarschijnlijk onmogelijk is om te bewijzen dat een mens
iets zou kunnen waarvoor geen Turing machine gemaakt kan worden (Webb, 1980).
De uitspraak van Elshout en Wielinga kan ik dan ook onderschrijven, hoewel er een
addertje onder de term 'symbohsche informatie' kan schuilen. In de praktijk van het K.I.-on-
derzoek wordt symbolische informatie namelijk grotendeels beperkt tot taai-structuren,
gebaseerd op natuuriijke taal en/of vaktaal zoals natuurkunde, wiskunde, enz. Symbool-
structuren die senso-motorische processen representeren (door K.I.-onderzoekers 'kennis
van de wereld' genoemd), komen in dit paradigma niet of op zeer inadequate wijze voor.
Adequate theorieën over menselijke senso-motoriek bestaan immers niet. Men hoeft slechts
te denken aan iemand herkennen volgens een signalement vs. iemand herkennen van een foto
of een vroegere ontmoeting, om zich te realiseren dat in taal uitgedrukte kennis en senso-
motorische kennis elkaar aanvullen, maar zeker niet identiek zijn. De opvatting dat taal-ver-
werking en denken identiek zijn heeft een lange geschiedenis en beleeft met het K.1.-para-
digma een nieuwe opleving. Russell (1943) wijdde aan deze opvatting een uitgebreide kritiek
en in 1959 klinkt ergernis door waar hij schrijft:
'This is one of those views which are so absurd that only very learned men could possibly adopt them'.
Meerdere malen merkt hij op:
'Philosophers and bookish people generally tend to live a life dominated by words, and even forget that it
is the essential function of words to have a connection of one sort or another with facts, which are in
general non-linguistic'.
In onze opvattingen van menselijke cognitieve activiteit moet men 'facts' vervangen door
'andere cognitieve activiteiten'.
Beide uitspraken zijn mij uit het hart gegrepen. Dat wil niet zeggen dat het naar mijn
mening zinloos is om de grenzen van het mogelijke te exploreren van geïsoleerde taal- en
symbool-structuren. Ik ga derhalve niet zover als Brandt Corstius (1981) die de K.I.-ge-
meenschap ronduit van bedrog beschuldigt. McDermott (1976) vertolkt op een prettige
manier kritiek op K.I. als model voor menselijke cognitie. Ik vindt het evenals hij onjuist om
K.I.-programma's te presenteren als modellen van mensehjke cognitie. Hierover valt natuur-
lijk te twisten. Het wordt in mijn ogen echter schadelijk wanneer deze modellen als ideaal-
modellen gaan fungeren voor de constructie van onderwijs. Deze modellen beschrijven
immers een leerhng die lexicaal-syntactisch vaardig is in het hanteren van de taal waarmee de
Verstralen 31
leerstof beschreven wordt, zonder er een snars van te snappen. Dit kan door leerlingen
Worden benaderd, maar we moeten het niet gaan propageren als onderwijsdoelstelling.
Leren via taal en symbolen
Hoe kan men voorkomen dat leerlingen de abstracte structuren van schoolleerstof voorna-
melijk op het concrete niveau van symboolmanipulaties beheersen en/of slechts verbaal
beheersen?
Piaget (1973) en ook de school van Gal'perin (Van Parreren en Carpay, 1980) propageren
het omgaan met concreet materiaal (niet de symbolen) waarmee het kind als het ware de
abstracte structuur zelf herontdekt (Piaget) of waardoor het kind wordt voorbereid op het zich
eigen maken hiervan (Gal'perin).
Hierover twee opmerkingen. In de eerste plaats lijkt mij deze weg nauwelijks begaanbaar,
behalve voor de eenvoudige abstracte mentale activiteiten zoals tellen en meting van ele-
mentaire grootheden zoals lengte. Het lijkt mij onmogelijk dat leerlingen uit zichzelf een
begrip van bijv. behoud van energie ontwikkelen. Het gebruik van natuurkundige en wis-
kundige taal en symbool-structuren is hierbij onontbeerlijk.
In de tweede plaats is een formele symbolische structuur zelf uiterst concreet hoewel
formele symbolische structuren meestal abstracte noties representeren. De materiële hande-
lingen die zowel Piaget als Gal'perin propageren als gelegenheid om te ontdekken resp. als
Voorbereiding op, kunnen derhalve ook worden uitgevoerd op een symbool-systeem.
Het is echter niet voldoende a//m/ met de symbool-machine te oefenen, net zomin als het
Voldoende zou zijn om alleen lengtes te meten zonder deze te koppelen aan de symbool
machine (i.c. het cijfersysteem). Dit geldt ook voor moeilijker concepten als 'behoud van
energie'. De symbool-structuur moet als startpunt dienen om voor zichzelf abstracte fan-
tasieën over energie-behoud te koppelen aan (fantasieën van) concrete fysische situaties. Het
's zinloos om leerlingen concrete situaties aan tc bieden waarin behoud van energie een rol
speelt, zonder dat cr (met taal) over verschillende vormen van energie en hun onderlinge
relaties enz. is en wordt gepraat en gelezen. Een leerling heeft dan geen idee hoe je zinvol
tegen een dergelijke situatie aan kan kijken, of waarom hem deze situaties worden voorge-
schoteld.
Hoe kan men nu, ondanks voorafgaande presentatie van ccn nieuwe symboolstructuur
Voorkomen dat de beheersing bij de concrete symbool-structuur blijft steken? In principe
door leerlingen voortdurend te stimuleren om niet-talige fantasieën te oefenen van een
groeiende abstractheid en complexiteit in relatie met de taal en de symbolen die de structuur
representeren, die in deze fantasieën hiermee wordt aangeduid. Voor het opereren op
getallen en het symboliseren hiervan met (tientallige) cijfers is bijv. Bruner (1978), of het
materiaal van Wiskobas aanbevelenswaard. Leraren die voor zichzelf een duidelijk onder-
scheid maken tussen taalstructuur en hiermee corresponderende niet-produceerbare fan-
tasieën doen dit als vanzelfsprekend. Helaas worden leraren maar al te vaak in een voorname-
hjk talige omgeving opgeleid cn blijven ze ook na hun opleiding, voor zover het hun vak
betreft, vooral talig bezig. Deze omstandigheden zijn niet bevorderlijk voor het ontwikkelen
Van niet-talige cognitieve activiteiten bij de taal van hun vak.
Uiteraard dient men de manipulatie en beheersing van symbool-structuren niet te ver-
waarlozen. Symboolstructuren zijn een prachtig concreet hulpmiddel bij het exploreren en
construeren van anderszins niet te beheersen ideeën en ideeën-complexen. Strikte symbool-
manipulatie, zonder zich rekenschap te geven van de noties waarmee symbolen zijn verbon-
den, kan bij tijd en wijle een krachtige strategie zijn bij deze exploratie en constructie.
Voor het rekenen kan bijv. het programma van Brown & Burton (1977) van nut zijn.
-ocr page 36-32 Notities en commentaren
hoewel ik daar twijfels over heb. Zoals reeds vermeld, kan dit programma 60 verschillende
elementaire fouten ontdekken in het proces dat leerlingen volgen bij het rekenen. Hoewel in
het artikel zelf niet wordt gesproken over de remediering, neem ik aan dat in de meeste
gevallen de leerlingen wordt verteld dat 'je het niet zo moet doen, maar zó'. Mij lijkt het niet
zinvol om precies te weten welke systematische fout een leerling maakt, wel dat hij een
systematische fout maakt. Of een fout systematisch is of door slordigheid ontstaat, lijkt mij
gemakkelijk te achterhalen door de leerling het sommetje nogmaals te laten maken. Als de
fout systematisch blijkt te zijn is het onvoldoende om de leerling te vertellen hoe hij wel moet
rekenen. Met moet niet nalaten om met de leerhng (weer) door te nemen hoe met het
cijfersysteem getallen en operaties met getallen kunnen worden gesymboliseerd, bijvoor-
beeld door met verschillende soorten van abstracte hoeveelheden en maten te werken zoals
lengte, volume, gewicht, temperatuur, etc. En dat hij daarom anders moet rekenen dan hij
deed. Men zou leerlingen derhalve tekort doen ze slechts goed met cijfers te leren rekenen.
Voor zogenaamde niet-exacte vakken geldt hetzelfde probleem. Zij onderscheiden zich
slechts van de exacte vakken doordat het betreffende symbool-systeem of de taal minder
expliciet geïsoleerd gehanteerd kan worden. Bij het geïsoleerd hanteren van deze talen maken
wc gebruik van onze lexicaal-syntactische vaardigheden, die waarschijnlijk redelijk adequaat
beschreven worden in de taalmodellen van Schank c.s.
In het onderwijs dient men evenwel opmerkzaam te zijn ten aanzien van deze ongewenste
ontwikkehng bij een leerling. De leerstof wordt daardoor erg moeilijk, doordat zij niet
ondersteund wordt door senso-motorische fantasieën, waarmee de taal begrijpelijk en zinvol
wordt. Bovendien wordt de leerstof erg saai, zodat een leerling terecht het idee krijgt dat de
school zijn ontwikkehng hindert in plaats van bevordert. Het onderwijs op basis van K.I.-
principes heeft tot nu toe de neiging om dit gevaar te onderschatten en zelfs voeding te geven
aan de misvatting dat verwerking van leerstof niet verder gaat dan het opbouwen van een
mentale taalstructuur.
LITERATUUR
Bhaskar, R., & Simon, H.A. (1977). Problem solving in semantically rich domains: An example from
engineering thermodynamics. Cog/ii'/iVe Science, I, 193-215.
Brandt Corstiüs, H. (1981). Weg met de computer! Kennis en Methode, 5, 23-31.
Breuker, J. (1982). Gaan waar de woorden gaan. Bulletin Leren van Volwassenen, II, 3-24.
Brown, J.S., & Burton, R.R. (1977). Diagnostic models for procedural bugs in basic mathematical skills.
Cognitive Science, /, 155-192.
Bruner, J.S. (1979). Beyond the information given. Studies in the psychology of knowing. New York:
Norton.
Elshout, J.J., & Wielinga, B.J. (1979)./I computational approach to the study of human skill acquisition.
Proceedings of the 6th International Joint Conference on Artificial Intelligence, Tokyo.
Elshout, J.J., & Wielinga, R.J. (1981). Simulatie van leren en probleemoplossen. Nederlands Tijdschrift
voor de Psychologie, 36, 371-383.
Hadamard, J. (1954). The psychology of invention in ihe mathematical field. New York.
Haugeland, J. (Ed.) (1981). Mind design, philosophy, pshychology, artificial intelligence. Montgomery,
Vermont: Bradford Brooks.
Kintsch, W., & Dijk, T. van (1978). Toward a model of text comprehension and production. Psychologi-
cal Review, 85, 363-394.
McDermott, D. (1976). Artificial intelligence meets natural stupidity. SIGART Newsletter, nr. 57.
(Reprinted in: Haugeland, 1981).
Neisser, U. (1970). Visual imagery as process and as experience. In J.S. Antrobus (Ed.), Cognition and
affect. Boston: Linle, Brown and Comp.
Newell, A., & Simon, H.A. (1972). Human problem solving. Englewood Cliffs, N.J.: Prentice Hall.
Verstralen 33
Paivio, A. (1977). Images, propositions, and knowledge. In J.M. Nicholas (Ed.), Images, perception, and
knowledge. Dordrecht: Reidel,
arreren, C.F. van, & Carpay, J.A.M. (Red.), (1980). Sovjetpsychologen over onderwijs en cognitieve
ontwikkeling. Groningen: Wolters-Noordhoff.
"'aget, J. (1973). Comments on mathematical education. In A.G. Howson (Ed.), Developments in
mathematical education, (Proceedings of the Second International Congres on Mathematical
Education). Cambridge: The University Press.
Rüssel, B. (1943). An Inquiry into meaning and truth. New York: W.W. Norton.
Russell, B. (1959). My philosophical development. London: Allen & Unwin. (Unwin Books Edition,
„ ^
^»chank, R.C., & Colby, K.M. (Ed.), (1973). Computer models of thought and language. San Francisco:
W.H. Freeman.
Shepard, R.W. (1978). Externalisation of mental images and the act of creation. In B.S. Randawa, &
Coffman (Eds.) Visual learning, thinking, and communication. New York: Academic Press.
Webb, J.C. (1980). Mechanism, mentalism and mathematics, an essay onfinitism. (Synthese Library, 37).
Dordrecht: Reidel.
Wmograd, T. (1973). A procedural model of language understanding. In R.C. Scank & K.M. Colby
(feds.), (1973). Computer models of thought and language. San Francisco: W.H. Freeman.
Young, R.M. & O'Shea, T. (1981). Errors in children's subtraction Cognitive Science, 5, 153-177.
'Manuscript ontvangen 14-1-'83
Definitieve versie 18-3-'83.
-ocr page 38-Tijdschrift voor Onderwijsresearch 9 (1984), nr. 1, pp. 34-38.
DE DISCUSSIE OVER HET ONDERZOEK VAN ONDERWIJZEN VOORTGE-
ZET: EEN REACTIE OP CREEMERS, KNOERS
EN VEENMAN
E. De Corte en J. Lowyck
K.U. Leuven
In zijn reactie op het artikel 'Heroriëntatie in het onderzoek van onderwijzen', verschenen in
het novembernummer 1983, zegt Veenman dat iedere beschrijving van de actuele tendensen
in het onderzoek van onderwijzen van meet af aan gekleurd is door de positie die de schrijvers
ten opzichte van het onderzoek van onderwijzen innemen. Deze uitspraak geldt ongetwijfeld
ook voor de reacties op het artikel.
Omdat het onze bedoeling is geweest een artikel te publiceren over een boeiende thema-
tiek, zoals het zoeken naar de belangrijke variabelen in het onderwijzen, zullen we thans
nader ingaan op een aantal markante thema's die door de discussianten zijn naar voren
gebracht. Ook in deze reactie blijft onze aanvankelijke bedoeling in het centrum: bijdragen
tot de bezinning omtrent mogelijkheden om de diverse aspecten uit vorige onderzoekstradi-
ties te integreren in een meer omvattende theorie, wat door ons als een heroriëntatie is
beschouwd. We zullen in het onderstaande niet ingaan op details, doch drie problemen
bespreken die uit de reacties op ons artikel naar voren springen, met name (1) het conflict
tussen de paradigma's, (2) de behoefte aan een vereenvoudigd model en (3) de transfer van
onderzoek van onderwijzen naar de opleiding van onderwijsgevenden.
1. Het conflict tussen de paradigma's in het onderzoek van onderwijzen
In de bijdrage van Creemers wordt het conflict erg scherp gesteld. Vooreerst worden de
onderzoekers van onderwijzen in twee bijna lijnrecht tegenover elkaar staande scholen
ingedeeld: zij die van mening zijn dat er reeds voldoende kennis is vergaard omtrent de relatie
tussen lerarengedrag en leerwinst en degenen die dit pntkennen. Afgezien van de vraag of
enig onderzoeker zich graag in de eerste categorie zou ondergebracht willen zien, worden wij
door Creemers tot de tweede groep gerekend. Deze voorstelling van zaken is echter overma-
tig simplistisch. Uit de ganse evolutie van onderwijzen is af te leiden, dat onderzoekers
onderhevig zijn aan verwachtingen van mogelijke resultaten die op het moment van dc
uitvoering van het onderzoek doorgaans niet empirisch gevalideerd konden worden. Onder-
zoekers van de persoonlijkheid van de leerkracht hebben gewerkt binnen het toen bestaande
raamwerk van de testpsychologie. Men ging op zoek naar vaste trekken in de persoon van de
leerkracht, die een voorspellende waarde zouden bezitten voor de leeriingcnuitkomsten.
Slechts nadat heel wat onderzoek binnen deze richting werd verricht, is men tot de vaststelling
gekomen dat zowel de denkkaders als de gehanteerde instrumenten ontoereikend waren.
Adres auteurs: Afdeling Didactiek en Psychopedagogiek, Vesaliusstraat 2, 3000 Leuven België
-ocr page 39-De Corte en Lowyck 35
Deze constatering heeft derhalve geleid tot het herdenken van het theoretisch raamwerk en
tot de constructie van nieuwe methoden en technieken. Blijkbaar hebben de discussianten zelf
weinig moeite gehad met de overgang van de studies van de persoonlijkheid van de leerkracht
naar de proces-produktstudies: vanuit hun visie op onderzoek is dit laatste een geldig
paradigma dat nog niet aan een wissehng toe is.
In ons artikel hebben we geenszins willen suggereren, dat alle voorafgaande ondernemin-
gen weinig opgeleverd hebben en dat nu eindelijk een oplossing wordt voorgesteld die wel een
antwoord geeft op alle gestelde vragen. Deze pretentie had het artikel niet, wat Creemers
hierover ook moge beweren. Wel zijn we uitgegaan van de nood aan complementariteit die
verschillende stromingen in het onderzoek van onderwijzen kunnen opleveren. Letterlijk is
gesteld dat:
'Uit de voorafgaande kritische bespreking van de diverse kwantitatieve benaderingen in het onderzoek
van het onderwijzen men niet mag concluderen, dat wij het daarbinnen geleverde speurwerk van geen of
weinig betekenis achten. We zijn zelfs van mening dat het belangrijk is ermee door te gaan...' (De Corte &
Lowyck, 1983, p. 251)
L>e lezer hoeft dus niet wantrouwig te worden bij het doornemen van het artikel. Hopelijk
wordt hij er wel kritisch van.
De waarde van een stroming in het onderzoek moet overigens niet gemeten worden aan de
onmiddellijke opbrengst. Het voortdurend zoeken naar belangrijke variabelen in het onder-
wijzen is te beschouwen als een continu proces waarvan de evolutie mede bepaald wordt door
de ervaringen met vroegere paradigma's. Op die wijze hebben de door ons genoemde vorige
stromingen relevante gegevens opgeleverd, die integreerbaar zijn in een groeiend kennisbe-
stand en die een platform bieden voor heroriëntatie.
De vraag is nu, of wij als auteurs van het artikel gepleit hebben voor een paradigmawisse-
hng. Hebben wij het effectiviteitsparadigma verlaten om te pleiten voor een cognitief para-
digma? Ons inziens is het hier van groot belang om na te gaan over welk criterium wij
beschikken om over een paradigmawisseling te spreken. Iedere onderzoeker van onderwijzen
is er uiteindelijk op gericht die variabelen op het spoor te komen, die van wezenlijke invloed
zijn op het leren van de leerlingen. Dit heeft o.m. te maken met de situering binnen de
onderwijskunde waar de optimalisering een essentieel oogmerk is van de uitkomsten van
onderzoek. Men kan derhalve stellen, dat men zich steeds binnen het effectiviteitsparadigma
situeert. Blijft nu echter de vraag naar het moment waarop het kennisbestand groot genoeg is
om de effectiviteit vast te kunnen stellen. De relativering van de proces-produktstudies als
enige invalshoek om effectiviteit te meten dient in dit licht te worden bekeken. Onderwijs-
gedragingen hebben op zich geen effectiviteitswaarde: ze zijn deelgedragingen die in bredere
gehelen zijn opgenomen en waarbij de situatie een belangrijke rol speelt. Dat een leerkracht
vragen stelt en hoeveel er gesteld worden is als zodanig geen criterium voor effectiviteit.
Welke vraag over welke inhoud op welk moment aan welke leerling wordt gesteld is een
sterker criterium. Om dit te achterhalen moet men toegang verkrijgen tot de intentionaliteit
van het onderwijzen.
Ons inziens hoeft er geen sprake te zijn van een conflict tussen de paradigma's. Wel kan er
van een positieve spanning sprake zijn. Dat de grens tussen de diverse benaderingen van het
onderzoek van onderwijzen niet zo haarfijn af te bakenen is, blijkt o.m. uit een recente
bijdrage van Creemers & Westerhof (1982, p. 24), waarin de auteurs hun onderzoek naar
routines in het leerkrachtengedrag voorstellen en het als volgt situeren:
36 Notities en commentaren
'In deze studie wordt bij de cognitieve wending ten aanzien van leerkrachtenonderzoek aangesloten. We
menen dat er motieven zijn, op grond van empirische studies en theoretische heranalyse, om deze nieuwe
oriëntatie voor te staan'.
Het valt op, dat Creemers in zijn reactie op ons artikel sterker polariseert dan het genoemde
citaat zou laten vermoeden, wat pleit voor het afzwakken van het 'conflict' tussen de paradig-
ma's.
2. Discussie omtrent het model van onderzoek
In minder scherpe bewoordingen dan Creemers, hebben Knoers en Veenman aandacht
gevraagd voor de werkbaarheid van het voorgestelde model voor onderzoek van onderwijzen,
waarin plaats wordt voorzien voor interne, cognitieve processen van leerkrachten en leerlin-
gen. Hier komen we bij een interessant discussiepunt dat centraal staat bij de theorievorming
rond onderwijzen. Welke zijn met name de essentiële variabelen die het onderwijzen bepalen
en vandaar ook het effect ervan op de leerling? Knoers evenals Veenman pleiten voor
spaarzaamheid bij het invullen van variabelen die het onderwijzen beïnvloeden. Een verdere
aanvulling van de schema's van Mitzel en van Dunkin & Biddle (De Corte & Lowyck, 1983) is
volgens hen enkel van nut wanneer het iets wezenlijks bijdraagt tot de verheldering van deze
essentiële variabelen. Voor een verruiming van het voorgestane model lijkt er, althans binnen
het kader van de 'teacher-effectiveness' onderzoekingen, vooralsnog geen behoefte.
Volgens Knoers kan het inzicht in de cognitieve processen hooguit van nut zijn bij diagnos-
tisch onderwijs, m.n. wanneer leerlingen falen. Deze voorstelling van zaken lijkt ons alvast
problematisch. Het is niet omdat een leerkracht heel wat routinegedragingen stelt, dat
daarmee de behoefte aan inzicht in de intentionaliteit en in het verloop van de interne
processen overbodig zou zijn. Voor de onderzoeker blijft het probleem bestaan waarom deze
leerkracht in deze omstandigheden z.g. routinegedrag in werking stelt. Trouwens, ook met het
oog op de opleiding van onderwijsgevenden is inzicht in de cognitieve processen van grote
betekenis.
De verwerping van een breder theoretisch model komt mede voort uit een te sterke
afzondering van wat men uitwendig observeerbaar gedrag en interne processen is gaan
noemen, hetgeen een typische uiting is van het Cartesiaanse dualisme in de Westerse psy-
chologie (zie o.m. De Corte, 1982). Daartegenover kunnen cognitieve processen en ob-
serveerbare gedragingen beschouwd worden als twee vormen van activiteit, die niet prin-
cipieel van elkaar verschillen; in de twee gevallen gaat het om door de persoon verrichte
handehngen (Van Parreren, 1981; Leont'ev, 1980).
De neiging om de cognitieve procesbenadering te,verengen treedt ook nog op andere
punten van de reacties naar voren. Zo reduceert Veenman de door ons voorgestelde cog-
nitieve procesbenadering tot planningsonderzoek, zoals dit onder de term 'teacher thinking"
vooral bij Clark wordt aangetroffen. In vroegere publikaties hebben we steeds gepleit voor
een breder model, dat meestal ook handelingsmodel is genoemd (Lowyck, 1982; De Corte,
1982). Hierin wordt getracht om extern observeerbaar gedrag en interne processen te
integreren in het concept 'handeling'. Immers, intentionaliteit zonder waarneembaar gedrag
is leeg, terwijl uitwendig observeerbaar gedrag zonder intentionaliteit zonder betekenis is.
Derhalve dient onder de cognitieve wending niet begrepen te worden dat men zich nu gaat
concentreren op dè interne processen in strikte zin. In eigen onderzoek hebben we steeds een
breder standpunt ingenomen en we menen dat dit voor de discussianten wel bekend is.
Derhalve blijven we pleiten voor een uitbreiding van het model voor onderzoek van
onderwijzen, waarin ook interne processen, samen met extern gedrag en omgevingsvariabe-
len, hun terechte plaats als variabelen kunnen vinden.
De Corte en Lowyck 37
Discussie omtrent het verband onderzoek-opleiding
Met dit discussiepunt, dat ook in de reacties is naar voren gebracht, komen we terug op de
vraag naar het moment waarop gegevens uit het onderzoek van onderwijzen kunnen overge-
dragen worden naar opleidingssituaties. Deze spanning is reeds van meet af aan in het
onderzoek van onderwijzen ingebouwd. Rosenshine & Furst (1971, p. 40) zeggen hierover:
Perhaps the beginning of wisdom in the'study and improvement of teaching is the confession of our lack
of knowledge that can be applied with confidence to a teacher education program'.
Knoers stelt onze stelling in vraag dat verbetering van het onderwijsgedrag van leerkrachten
het meest efficiënt kan geschieden via de beïnvloeding van de onderliggende variabelen van
het uitwendig gedrag. We geven toe dat er in dit verband nog weinig empirische evidentie
voorhanden is om terzake meer specifieke richtlijnen uit te werken. Met de argumentatie van
de auteur hebben we echter wel enige moeite. Het belang van de cognitieve processen voor de
leerkrachtenopleiding wordt immers afgewezen op grond van de onderstelling dat het niet
voor de hand ligt dat uitwendig gedrag door onderliggende procesvariabelen gestuurd wordt.
Een argument hiervoor is, dat gedrag vaak routinegedrag is en volgens Knoers juist niet stoelt
op rationele processen.
Volgens ons kunnen routines ook niet zonder meer gezien worden, los van elke rationali-
teit. Deze uitspraak hangt samen met het bepalen van de eenheid van analyse waarmee
onderwijsgedrag wordt bestudeerd. De vraag die zich hier opdringt is deze naar de zinvolheid
van het onderwijsgedrag. Miller, Galanter en Pribram (1960) hebben in dit opzicht verduide-
lijking nagestreefd door het begrip 'plan' in te voeren als de brug tussen cognitie en actie. Zo'n
plan kan richting geven aan heel wat gedragingen, die routinematig kunnen verlopen, doch
steeds gecontroleerd worden op hun consistentie met het aanvankelijk plan. De loutere
studie, c.q. training van routines levert weinig inzicht in de zinvolheid van het gedrag op en
^egt evenmin iets over de controleerbaarheid van het gedrag. De relatieve positie van ieder
deelgedrag, resp. routine in een breder geheel kan uitsluitsel geven over de betekenis ervan.
Wellicht komt hier een verschil in opvatting over zinvol handelen opnieuw aan het licht.
Vanuit een integratief model is getracht om, op lange afstand, kennis en inzicht te genereren
die voor de praktijk bruikbaar zijn. Dat op dit moment van onderzoek nog geen eensluidende
conclusies te vinden zijn, hoeft niet te worden benut als een tegenargument. Een verbreding
van de kijk op onderwijsgedrag en de daarmee gepaard gaande opleidingsmogelijkheden,
dienen niet te worden gekwalificeerd als het verwaarlozen van reeds verkregen resultaten,
maar als een in de toekomst geprojecteerde oriëntatie. Het is dan ook moeilijk om de
uitspraak van Creemers in dit verband, dat wij de empirie tegen ons hebben, in zijn ware
betekenis te vatten.
4. Ter afsluiting en heropening van de discussie
De idee om een artikel kritisch door collegae te laten doornemen is een interessant initiatief
Hierdoor wordt de mogelijkheid geboden om eventuele verfijningen in het denken te sug-
gereren, alsmede om een gesprek te openen over een aantal essentiële kwesties rond het
thema onderzoek van onderwijzen.
Uit de reacties hebben we alvast geleerd, dat het gebruik maken van indelingen van andere
auteurs erg dikwijls een identificatie met die auteurs oproept. Dit was het geval o.m. bij de
Vereenzelviging met Clark die nochtans in ons eigen model eveneens gerelativeerd wordt. Dit
brengt ons tot het aanvoelen van de noodzaak om naar de toekomst toe de denkkaders nog
beter te omschrijven en te expliciteren, de gehanteerde begrippen nog duidelijker te definië-
38 Notities en commentaren
ren, de relatieve positie van de invalshoeken nog nader te bepalen en tenslotte aan te dringen
op de voortzetting van de discussie.
Ons inziens is de tijd rijp voor een nieuwe synthese van de diverse stromingen in het
onderzoek van onderwijzen. Zo zien we bijvoorbeeld in het uitvoerige voorstel van Veenman
omtrent thema's voor toekomstig onderzoek, een grote aandacht voor de persoonlijkheids-
kenmerken in de evolutie van de leerkracht. Hij neemt de draad op met vroeger onderzoek
naar persoonhjkheidskenmerken, zij het dan vanuit een ontwikkehngsperspectief. Het zou de
moeite lonen om dit voorstel te ontleden op zijn uitgangspunten, verwachtingen, methoden en
mogehjke opbrengst. Zo'n verheldering kan er ongetwijfeld toe bijdragen om het zoeken naar
essentiële variabelen in het onderwijzen te stimuleren en aansluiting te vinden op andere
onderzoeksobjecten die vroeger en nu in de kern van het onderzoeksbedrijf te vinden waren,
resp. zijn. Het vermijden van een methodenstrijd kan slechts worden gerealiseerd door een
continu gesprek over achtergronden, doelen, methoden en resultaten van verricht onderzoek.
Dit dient meteen gezien te worden in het perspectief van de optimalisering van het onderwij-
zen en van de opleiding daartoe.
LITERATUUR
Creemers, H.P.M., & Westerhof, K.J. (1982). Onderzoek naar routines in het leerkrachtengedrag. In
R. Halkes & W.J. Nijhof (Eds.), Planning van onderwijzen (p. 23-33) Lisse: Swets & Zeitlinger.
De Corte, E. (1982). Het speurwerk over het plangedrag van leerkrachten onder de loep. In R. Halkes &
W.J. Nijhof (Eds.), Planning van onderwijzen (p. 77-91). Lisse: Swets & Zeitlinger.
De Corte, E., & Lowyck, J. (1983). Heroriëntatie in het onderzoek van onderwijzen. Tijdschrift voor
Onderwijsresearch, 8, 242-260.
Leont'ev, A.N. (1980). Activiteit als psychologisch probleem. Pedagogische Studiën, 57, 324-343.
Lowyck, J. (1979). Procesanalyse van het onderwijsgedrag. Pedagogische Studiën, 56, 427-446.
Rosenshine, B., & Fürst, N. (1971). Research on teacher performance criteria. In B.O. Smith (Ed.),
Research in teacher education. Englewood Cliffs: Prentice Hall.
Van Parreren, C.F. (1981). Activiteit als object van de psychologie: noch 'inwendig' noch 'uitwendig'.
Nederlands Tijdschrift voor de Psychologie, J6, 185-196.
Manuscript ontvangen 16-12-1983
-ocr page 43-Tijdschrift voor Onderwijsresearch 9 (1984) nr. 1, pp. 39-44.
Ferd v.d. Krogt
Probleemoplossing en beleidsvorming in scholen
Een formatieve evaluatie van organisatiemodellen op hun bruikbaarheid in een instrumen-
tarium voor schoolontwikkeling.
Leiden: Academisch proefschrift, 1983 (225 pagina's).
F J- v.d. Krogt en W.P. Weijzen
Variaties in schoolorganisaties (SVO-reeks no. 60)
Den Haag/Harlingen: Flevodruk, 1982 (240 pagina's).
Marx publiceerde in 1975 zijn vijf onderwijskundige modellen voor scholengemeenschappen avo/vwo.
(Marx, 1975). De modellen hebben twee kanten, een organisatorische en een onderwijskundige. Marx
onderscheidt aanvankelijk zes modellen aan de organisatorische kant: de segmentale organisatie, seg-
mentale organisatie met hiërarchische leidingsstruktuur, lijn- en staforganisatie, kollegiale organisatie,
gedifferentieerde organisatie en procesorganisatie. Hij beschrijft de komponenten en elementen van
deze modellen. Zo is de leiding van de school in een segmentale organisatie 'inhoudelijk gericht maar
sterk gereduceerd tot indirekte beïnvloeding via de hantering van voorzieningen' en in de procesorgani-
satie 'overwegend procesgericht'. Dat wil zeggen: de schoolleiding richt haar inspanningen vooral naar
het optimaal laten verlopen van het onderwijsleerproces in de school. Marx voegt later de eerste twee
organisatiemodellen, de scgmentale en segmentale met hiërarchische leidingsstruktuur, samen, omdat
het onderscheid, 'weinig fundamenteel en zonder scherpe overgang' is. De samenvoeging krijgt de naam
Segmentale organisatie'.
Hij bouwt de onderwijskundige kant op rond het individualiserend vermogen. Het individualiserend
Vermogen is gelijk aan dc mate waarin de scholengemeenschap het mogelijk maakt, dat elke leeriing
deelneemt aan onderwijs met onderwijsdoelstellingen die voor de leerling optimaal zijn. Marx kon-
strueert zo vijf onderwijskundige modellen: het vertikale, beperkt vertikale, horizontale, ongedeelde en
niecrvoudige model. Het eerste model heeft een geringer individualiserend vermogen dan het laatste. In
de eerste kan de leerling bijvoorbeeld moeilijk of niet overstappen naar een andere onderwijsrichting of
änder niveau. In het laatste wel.
Vervolgens betoogt Marx, dat de organisatie en onderwijskundige modellen konsistent of inkonsistent
kunnen zijn. Konsistent zijn ze als het organisatorisch systeem een geschikt middel is voor het doelgericht
funktioneren van het onderwijskundig systeem. Inkonsistent als die geschiktheidsrelatie ontbreekt. De
organisatiemodellen vormen een oplopende reeks die een toenemende valentie hebben voor de onder-
wijskundige modellen. Anders gezegd: een organisatiemodel verder in de reeks, met een grotere valentie,
kan ook alle prestaties leveren die organisatiemodellen lager in de reeks kunnen leveren. De vijf
■nodellen die konsistent zijn geeft Marx de namen: vertikaal, beperkt vertikaal, horizontaal, ongedeeld en
rneervoudig onderwijskundig-organisatorisch model. Marx beargumenteert de konsistentie van de on-
derwijskundig-organisatorische modellen vanuit het individualiserend vermogen van de modellen voor
Vakspecifieke en niet vak-specifieke onderwijsleerdoelen. Zo kan hij ook de toenemende valentie
beredeneren.
Tenslotte staaft Marx de konsistentie van de modellen vanuit de mogelijkheid tot vernieuwing. Deze
optiek levert gelijktijdig aanwijzingen voor de onderwijsvernieuwingspraktijk. Het laat zien wat organi-
satorisch nodig is om onderwijskundige vernieuwingen realiseerbaar te maken.
De modellen van Marx hebben een ongekende invloed in Nederland gehad. Zeer velen die met
schoolorganisatievraagstukken te maken hebben grijpen terug op Marx'modellen. Van der Krogt kan
terecht met enige trots Van der Vegt citeren als deze zegt: 'De modellen van Marx hebben school
gemaakt' (Van der Krogt, 1983 p. 4).
40 Boekbesprekingen
De navolging is gepaard gegaan met kritiek. Van der Krogt vat die in drie punten samen (p. 6-8):
1. Theoretisch bouwen de modellen niet expliciet voort op bestaande organisatietheorieën, bijvoorbeeld
over de relatie tussen technologie (= het geheel van kennis en inzichten aangaande onderwijsproces-
sen, p. 31) en organisatievorm.
Kritici werpen in het verlengde hiervan de vraag op, of de samenhang tussen het onderwijskundig en
organisatorisch deel wel zo centraal staat in scholen. Scholen missen toch een duidelijke technologie,
hebben toch geen heldere doelstelling en bestaan toch uit omstreden machtscentra.
2. De modellen hebben een zwakke empirische basis.
3. De modellen vormen een ontwikkelingsreeks die een school doorloopt via het aanpakken en reduce-
ren van problemen. Kritici betwijfelen of scholen zo veranderen. Zij menen dat een schoolontwikke-
ling meer drijft op verandering in taakopvattingen van leraren.
Marx heeft na publikatie van de modellen niet stilgezeten en is bezig om zijn modellen verder te
ontwikkelen. Hij doet dat met enkele andere onderzoekers, waaronder Van der Krogt en Weijzen. Van
der Krogt werkt aan de evaluatie en ontwikkeling van de Marx-modellen. Het empirische deel van het
werk heeft hij samen met Weijzen gedaan en is verschenen in 'Variaties in schoolorganisaties'. Daarna
heeft Van der Krogt de organisatorische modelevaluatie en -ontwikkeling op zich genomen. Weijzen zal
de onderwijskundige evaluatie en ontwikkeling nog voor zijn rekening nemen. De organisatorische
modelevaluatie en -ontwikkeling staat in Van der Krogt's proefschrift. 'Variaties in schoolorganisaties'
fungeert daarbij als bijlage1.
De studie van Van der Krogt gaat niet in op de kritiek die op de modellen van Marx geleverd is. Het is
ook niet zijn bedoehng. Hij wil, zoals gezegd, de modellen evalueren en ontwikkelen.
Wat verstaat hij daaronder?
Modelevaluatie omschrijft Van der Krogt in twee vragen (p. 60):
a. In hoeverre zijn de modellen bruikbaar om dc onderwijskundig-organisatorische struktuur te be-
schrijven en te karakteriseren?
b. In hoeverre zijn de modellen bruikbaar om problemen, die zich op school voordoen, te analyseren?
Dit noemt hij de diagnostische vraag.
Dc modelontwikkeling loopt van konkretiseren, uitwerken, expliciteren en toevoegen tot het veranderen
van de modellen of komponenten ervan.
De dubbele (of eigenUjk driedubbele) doelsteUing van het onderzoek lijkt aantrekkelijk, maar noopt
de onderzoeker te hinken op twee tegenstrijdige gedachten. Immers, voor het diagnostische deel moet hij
uitgaan van de 'juistheid' van de konsistentietheorie, maar voor de modelontwikkeling is het in twijfel
trekken nodig.-De beide doelstellingen verenigt in een onderzoek, vraagt om moeilijkheden.
Hoe is het empirische deel van het onderzoek opgezet en uitgevoerd? Het onderzoek is beperkt tot drie
van de vijf modellen van Marx; het segmentale, lijn-staf en kollegiale model (p. 16), en tot drie scholen
voor avo^wo van ongeveer dezelfde omvang (p. 66). Het belangrijkste selektiekriterium voor de keuze
van de scholen is spreiding naar onderwijskundig-organisatorische opbouw (p. 66). Hoe dat precies
gebeurt, is in het proefschrift niet exact te achterhalen. Wel schrijft v.d. Krogt hoe hij dat bij één van de
scholen heeft gedaan. Daaruit blijkt dat hij toen een horizontaal-kollegiale school zocht (p. 216/217). Pas
nadat de school bleek te voldoen aan deze eis nam hij die op in het onderzoek. De keuze van deze school
en misschien ook de andere scholen vind ik problematisch, als de juistheid van de konsistentie-theorie aan
een kritisch onderzoek onderworpen moet worden, omdat voor zo'n onderzoek juist inkonsistent
opgebouwde scholen ook opgenomen moeten kunnen worden.
Het aantal van drie is, in het licht van de onderzoeksdoelen, nogal klein, want zelfs bij een aselekte
steekproef zou een resultaat, waarbij alle scholen konsistent zouden zijn nog niet veel zeggen. (Het
95%-betrouwbaarheidintervaI van de kans op konsistente scholen loopt dan van 40% tot 100%;
0,4 < p < 1).
1 Het zig-zag beleid van de SVO-reeks zorgt ervoor dat U de bijlage via de boekhandel kunt krijgen,
maar het proefschrift niet. Daarvoor moet u zich wenden tot de auteur: dr. F. van der Krogt, Sociologisch
Instituut, Thomas van Aquinolaan 3, Nijmegen. Tel: (080) 512014.
41 Boekbesprekingen
Wat zijn de resultaten van het onderzoek? Ik zal de drie doelen (beschrijving, diagnose en modelont-
wikkeling) suksessievelijk aflopen.
De beschrijving van de drie scholen is nauwkeurig en gedetailleerd. Het beschrijvingskader uiteengezet
"1 'Variaties in schoolorganisaties' is een grote verbetering van Marx' oorspronkelijke modellen. Het
^ader is systematisch, beknopt, efficiënt en toegankelijk. Het schoolorganisatie onderzoek, ook dat wat
buiten de Marx modellen valt, zal veel gemak hebben van dit operationele kader.
Het diagnostisch deel, waar problemen van scholen beschreven en geanalyseerd worden, roept bij mij
twee vragen op.
Eén: Wanneer is een probleem een probleem? De onderzoekers onderkennen bij de drie scholen
meerdere problemen. Maar onduidelijk is om wiens probleem het gaat. Wie stelt het probleem? Hoe
knellend is het? En: Zijn dit alle onderwijskundig-organisatorische problemen?
De tweede vraag luidt: Zijn alle komponenten van het model even belangrijk voor de konsistentie van
het onderwijskundige en organisatorische deel? Van der Krogt geeft niet aan wat het onderling gewicht
van de komponenten van de modellen is, en hoe 'tolerant' de modellen zijn voor afwijkingen. Hierdoor
'ijkt alles even belangrijk en telt elke afwijking even zwaar. Feitelijk wreekt zich hier het manco van het
ontbreken van een afhankelijke of kriterium variabele. Immers, wat onderscheidt een konsistent georga-
niseerde school van een inkonsistente? De effektiviteit? Welke effektiviteit? Onderwijsresultaten, toe-
'oop van leerlingen, klimaat, minder problemen? We weten het niet. Van der Krogt noemt en onderzoekt
Seen kriterium. Dat ontneemt hem de gelegenheid de modellen aan een kritisch onderzoek te onderwer-
pen, zodat gesnoeid kan worden in de modellen, waarbij onbelangrijke delen eruit gaan cn belangrijke
erin blijven.
De modelontwikkeling, het derde doel, koncentreert zich op twee onderdelen: de invoeging van drie
nieuwe strukturele dimensies in de modellen en een vierdeling in de beleidsterreinen van een school. Dit
boeiende deel van het onderzoek verrijkt Marx' modellen met de recente aandacht voor nieuwe struk-
turele configuraties, zoals de matrix-struktuur, de liaison-struktuur en de interne samenhang van or-
ganisatorische eenheden. Voorts verwerkt het de notie van de verschillende invloedssferen of onderhan-
delingszones in school in de modellen.
Welke eindindruk blijft over na lezing van beide boeken? Het proefschrift van Van der Krogt is
Zorgvuldig opgebouwd. Het is daardoor makkelijk toegankelijk, wat een groot voordeel is bij zo'n dik
t'oek met een even dikke bijlage. Een nadelige konsekwentie van deze werkwijze is dat het boek 'traag'
geschreven is, omdat de schrijver op vele plaatsen pas op de plaats maakt. De grootste kracht van het
proefschrift zit in het beschrijvende deel. Bezwaarlijk vind ik dat de modellen niet gewied zijn door een
theoretisch en empirisch onderzoek. De modelevaluatie en ontwikkeling heeft enkele interessante
elementen toegevoegd, maar geen enkel minder belangrijk element kunnen afvoeren, zodat onduidelijk
's Wat essentieel is voor de konsistentie van de modellen en wat een konsistent georganiseerde school vóór
heeft op een inkonsistente.
De afgelopen jaren hebben geleerd dat Marx' modellen met vrucht toepassing vinden in (na)scholing
Van onderwijsgevenden en begeleiding van schoolteams, maar minder in empirisch of theoretisch weten-
schappelijk onderzoek gebruikt worden. Ik vermoed dat dit zo blijft: het is een goed stuk schoolorganisa-
tiekunde.
Peter Smets
Instituut voor
Toegepaste Sociologie,
Nijmegen
LITERATUUR
^arx, E.C.H. (1975). De organisatie van scholengemeenschappen in onderwijskundige optiek. Gronin-
gen: Tjeenk Willink.
42 Boekbesprekingen
Aarnoutse, C.A.J.
Aspecten van begrijpend lezen in het vierde leerjaar van het gewoon lager onderwijs.
Vakgroep Interdisciplinaire Studierichting Onderwijskunde K.U.N., 1982
(dissertatie).
In dit nogal lijvige boek (336 blz. exclusief bijlagen) brengt de auteur verslag uit over literatuurstudie en
empirisch onderzoek op het gebied van het begrijpend lezen. De auteur manifesteert zich als iemand die
niet gaarne over één nacht ijs gaat. Een groot deel van het boek bestaat namelijk uit preambules, die het
voor de lezer soms lastig maken de draad van het verhaal in het oog te houden. De auteur heeft dit
kennelijk in dc gaten, omdat hij de kern van het onderzoek bij herhaling beschrijft. Wanneer de lezer het
nodige geduld weet op te brengen, dan kan hij/zij veel waardevols in het boek aantreffen. Bij de
bespreking zal ik mij houden aan de opbouw van het boek en de zes hoofdstukken achtereenvolgens
belichten.
Hoofdstuk I is een inleidend hoofdstuk, waarin eerst voorafgaand onderzoek wordt besproken.
Vervolgens wordt ingegaan op de wijze waarop de zgn. skill-approach (speciaal het Wisconsin Design)
heeft geleid tot het onderzoek en de doelstelling daarvan. In navolging van deze benadering worden taken
onderscheiden die leerlingen ten aanzien van een tekst moeten leren uitvoeren (blz. 8). In de eerste fase
van het onderzoek zal op grond van een theorie van begrijpend lezen en inferentieprocessen een drietal
leestaken worden geselecteerd. Deze taken worden gespecificeerd en geoperationaliseerd in de vorm van
drie taakgerichte tests (blz. 8,9). Van elke test worden parallelvormen ontwikkeld. In de tweede fase van
het onderzoek wordt eerst de betrouwbaarheid en validiteit van deze tests en twee typen cloze tests
bepaald. Daarna wordt in een 'true experimental pretest-posttest control group design' nagegaan wat het
effect is van drie taakgerichte onderwijsprogramma's, gemeten met dc verschillende tests direct na afloop
van de programma's, en twee maanden later (retentietoets). Bovendien zal worden nagegaan of de drie
leestaken in werkelijkheid zijn te onderscheiden, door de effecten van de drie programma's met elkaar te
vergelijken op de drie taakgerichte tests en de cloze tests (blz. 9, 10). Het hoofdstuk besluit met een
overzicht van het boek.
In hoofdstuk II worden theorieën van begrijpend lezen en van inferentieprocessen uit de doeken
gedaan. Bij elke benadering wordt nagegaan in hoeverre deze als basis kan dienen voor de selectie van
leestaken (blz. 12). Twee benaderingen van het begrijpend leesproces worden onderscheiden. Bij de
eerste benadering wordt uitgegaan van de tekst of de semantische structuur daarvan en wordt veronder-
steld dat het begrijpend leesproces primair gestuurd wordt vanuit de tekst (o.a. Kintsch en Van Dijk). De
tweede benadering richt zich primair op de cognitieve processen die bij de tekstverwerking een rol spelen
en veronderstelt dat de aanwezige kennisstructuur, met name schemata, hierbij een bepalende factor is
(o.a. Anderson, Rummelhart cn Norman) (blz. 17). De twee benaderingen worden uitgebreid besproken
en van kritiek voorzien. Vervolgens wordt ingegaan op literatuur over inferenties en inferentieprocessen.
De waarde van deze delen van het hoofdstuk is dat een goed en helder overzicht wordt gegeven van de
betreffende literatuur tot 1980. Ik vindt het bijvoorbeeld zeer geschikt introductiemateriaal voor stu-
denten. In het laatste deel van het hoofdstuk wordt ingegaan op de selectie van dc leestaken. Mede aan de
hand van een zestal criteria werden de volgende taken geselecteerd:
- het afleiden van de hoofdgedachte uit een informatieve tekst (dc taak Hoofdgedachte)
- het afleiden van de bedoehng van de hoofdpersoon uit een fictieve, verhalende tekst (de taak
Bedoehng)
- het trekken van conclusies uit logische redeneringen (de taak Redeneren).
De taak Hoofdgedachte past binnen het model van Kintsch en Van Dijk, de taak Bedoelingen werd
primair gekozen naar aanleiding van een publicatie van Kintsch en de taak Redeneren naar aanleiding
van publicaties van Frederiksen en Kintsch (blz. 42). Persoonlijk vind ik deze fundering van de gekozen
taken op de literatuur niet zo overtuigend. Ten eerste vraag ik me af, waarom na een zo uitgebreide
bespreking van de literatuur (die zelfs artikelen bevat gepubliceerd na de keuze van dc taken) de auteur
zich uiteindelijk op slechts enkele pubhcaties baseert. En ten tweede betwijfel ik of het model van Kintsch
en Van Dijk theoretisch te verenigen is met de uitgangspunten van dc skill-approach. In elk geval had de
auteur deze kwestie moeten verantwoorden. In het laatste deel van het hoofdstuk worden de drie
leestaken nader gespecificeerd aan de hand van (deels weer andere dan de eerder behandelde) literatuur.
Ook dit deel maakt een nogal eclectische indruk.
43 Boekbesprekingen
Het eerste deel van hoofdstuk III handelt over curricula en benaderingen van begrijpend lezen,
Waarvan de effecten worden bekeken. Deze onderzoeksgegevens worden gebruikt voor de opzet van de
drie programma's. Voor de opbouw van de programma's wordt gebruik gemaakt van een leertaakanalyse,
Zoals die is beschreven door Gagné (blz. 74). Hoewel de auteur hier de nodige bladzijden aan wijdt, is mij
"•et geheel duidelijk geworden hoe de programma's zijn afgeleid uit de gegevens in de literatuur. Het
tweede deel van het hoofdstuk is gewijd aan de bespreking van vaardigheden op het gebied van het
''egrijpend lezen en het onderzoek daarvan. De auteur schrijft aan het eind zelf dat de lezer niet moet
denken dat de literatuurstudie geen invloed heeft gehad op het onderhavige onderzoek, maar dat enkele
ideeën zijn overgenomen (blz. 90). Opnieuw kan ik me niet aan de indruk ontworstelen dat de bespreking
van de literatuur niet zo erg functioneel is voor het onderzoek, zoals dat uiteindelijk wordt uitgevoerd. In
het derde deel van het hoofdstuk worden eerst methoden voor het meten van begrijpend lezen besproken
6n daarna komen specifieke meetinstrumenten aan de orde. De auteur gaat uitgebreid in op onderzoek
Waarin de samenhang wordt vastgesteld tussen technisch en begrijpend lezen, woordenschat en begrij-
pend lezen, en intelligentie en begrijpend lezen, teneinde verwachtingen te kunnen formuleren omtrent
de samenhang tussen de in dit onderzoek ontwikkelde taakgerichte tests en maten voor technisch lezen,
begrijpend lezen, woordenschat en non-verbale intelligentie. In het onderzoek zullen die verwachtingen
empirisch worden getoetst in verband met de validiteit van de taakgerichte tests (blz. 101). Eenzelfde
bespreking volgt met betrekking tot de cloze tests. Persoonlijk vind ik dit het nuttigste onderdeel van het
hoofdstuk.
In hoofdstuk IV wordt opzet en methode van het onderzoek besproken. Het onderzoek bestaat uit twee
delen, een descriptief gedeelte waarin de betrouwbaarheid en validiteit van dc vijf te ontwikkelen tests
Worden vastgesteld, en een experimenteel gedeelte waarin de effecten van drie programma's (Hoofdge-
dachte, Bedoehng en Redeneren) worden bepaald. Deze programma's worden uitgevoerd op vier
Scholen in het vierde leerjaar. Op elk van deze scholen worden de leerlingen verdeeld in vier gelijkwaar-
dige groepen. In drie van de groepen worden de drie programma's uitgevoerd en in de vierde groep een
controle programma (programma Begrijpend lezen van Bol e.a.). Daarnaast zijn er vier controle scholen
Waar geen specifiek leesprogramma wordt gegeven. Allereerst gaat de auteur in op de ontwikkeling en het
psychometrisch onderzoek van de drie taakgerichte tests en de twee cloze tests. Vervolgens wordt de
ontwikkeling van de drie programma's besproken. De selectie van de scholen wordt verantwoord en dc
afname en resultaten van de voormeting komen daarna aan de beurt. Op grond van deze gegevens worden
de groepen van leerlingen gekozen. Voorts wordt aangegeven hoe de instructeurs (en dat zijn niet de
klasselecrkrachten) zijn verdeeld over de programma's en de scholen en op welke wijze zij zijn voorbe-
reid. Tenslotte wordt een korte evaluatie gegeven van de lessen en de programma's. Uit dit hoofdstuk
blijkt de gedegenheid waarmee het onderzoek is uitgevoerd.
In hoofdstuk V worden de gegevens cn resultaten van het onderzoek geanalyseerd. Aan de hand van de
genormeerde tests voor technisch lezen, begrijpend lezen, woordenschat en een indeling naar sociaal
niilieu wordt de representativiteit van de onderzoeksgroep nagegaan. Geconcludeerd wordt dat de
onderzoeksgroep waarschijnlijk hoger presteert dan de 'gemiddelde' Nederlandse school (leerjaar 4).
Gelet op verschillen tussen sociale milieus en tussen de acht scholen op dc vijf tests, blijkt dat deze in
beide gevallen significant zijn. Met dit gegeven wordt verder in het onderzoek eigenlijk niets gedaan, het
Wordt kennelijk 'volledigheidshalve' gesignaleerd. De auteur gaat dan na hoe het bij de onderzoeksgroep
's gesteld met de betrouwbaarheid van de tests. Hierbij blijkt ondermeer dat de correlaties tussen
Voormeting, nameting en retentiemeting vrij hoog zijn. De prestaties van de leerlingen zijn dus over de
'ijd gezien vrij stabiel (blz. 219). Vervolgens wordt de nodige aandacht besteed aan de validiteitsvraag.
Wanneer de variantiecomponenten van de vijf tests onder de loupe worden genomen, blijkt dat elk van de
^ijf tests nog wat anders meet dan 'technisch lezen', 'woordenschat' of 'begrijpend lezen' (blz. 261). Uit
een tweede analyse komt naar voren dat elk van de drie taakgerichte tests een specifiek aspect van het
begrijpend lezen meet (blz. 262). Analyse van de verandering in de prestaties op de ontwikkelde tests,
Zowel in de nameting als in de retentiemeting, levert op dat de vooruitgang op de verschillende tests
ongeveer even groot is cn dat de vooruitgang tussen voormeting en nameting groter is dan tussen
nameting en retentiemeting. Een analyse van individuele verschillen geeft ondermeer tc zien dat leeriin-
gen met een lage voormetingsscore relatief het sterkst vooruit gaan (blz. 278, 279). Hierna komt het
experimentele gedeelte aan de orde. De auteur formuleert drie hypothesen.
44 Boekbesprekingen
1) Elk programma geeft een specifiek effect of de corresponderende test.
2) Elk programma geeft geen specifiek effect op de twee andere taakgerichte tests.
3) Geen van de programma's geeft een specifieke verhoging op de cloze tests.
Deze laatste hypothese verbaast mij enigszins. Immers als men leestaken kan onderscheiden, dan moet
begrijpend lezen in het algemeen toch profiteren van een verbeterde beheersing van een afzonderlijke
taak. De auteur evenwel neemt aan dat slechts een reeks van taakgerichte programma's invloed kan
hebben op het begrijpend lezen in het algemeen (blz. 180). Er zijn dan twee mogelijkheden. Ten eerste,
begrijpend lezen in het algemeen is geen optelsom van taken (skills), maar dan ondergraaft de auteur zijn
eigen uitgangspunt. Ten tweede, de onderscheiden taken vormen slechts een zeer beperkt aspect van
begrijpend lezen in het algemeen. Dit laatste neemt de auteur kennehjk aan. Echter in dat geval komt de
vraag op hoeveel en welke taken beheerst moeten worden voordat begrijpend lezen in het algemeen
vooruit gaat. De toetsing van de drie hypothesen levert uiteindelijk op dat alleen het programma
Redeneren de gewenste effecten vertoont en de twee andere programma's niet of nauwelijks. Wat mij
betreft leert dit onderzoek ons derhalve dat leerlingen van de vierde klas in het basisonderwijs niet zo
goed uit de voeten kunnen met redeneertaken, doch dat het mogelijk is dit met een speciaal programma te
verbeteren. En voorts dat cloze taken geen groot beroep doen op logisch redeneren. In hoeverre de taak
Redenern als aspect van begrijpend lezen beschouwd mag worden is daarmee nog niet duidelijk. Maar
omgekeerd mag men m.i. ook niet concluderen dat de taak Hoofdgedachte en de taak Bedoeling met
begrijpend lezen niets van doen hebben. Zoveel wijzer heeft dit onderzoek ons niet gemaakt.
Hoofdstuk VI bevat een discussie van het onderzoek. De auteur doet hier een voorzichtige aanbeveling
van taakgericht onderwijs op het gebied van begrijpend lezen (blz. 306). Op grond van de resultaten van
dit onderzoek vind ik deze aanbeveling te optimistisch. Het falen van de programma's Hoofdgedachte en
Bedoeling wordt door de auteur toegeschreven aan de omstandigheid dat de programma's te sterk gericht
waren op het aanleren van strategische kennis, d.w.z. kennis met betrekking tot de wijze waarop de
betreffende leestaken en hun onderscheiden deeltaken kunnen worden uitgevoerd. De veronderstelling
wordt geopperd dat daarnaast meer aandacht besteed zal moeten worden aan dc ontwikkeling van
algemene of gestructureerde kennis. Deze vorm van kennis is fundamenteel van aard cn waarschijnlijk
van groter belang voor het leren uitvoeren van bepaalde leestaken dan eerder werd vermoed, aldus de
auteur. Dit inzicht dient denk ik als een zeer belangrijke opbrengst van dit onderzoek gezien te worden.
Niet dat anderen dit ook niet bedacht hadden (in dc literatuurbespreking komt dit uitgebreid aan de
orde). Maar de auteur zelf had op dit punt een gezonde twijfel. Op grond van zijn eigen onderzoek komt
hij tot verandering van inzicht. En dit is precies de waarde van goed onderzoek. Hierover wil ik namelijk
geen twijfel laten bestaan. Hoewel ik op diverse punten kritiek heb geleverd ben ik van mening dat de
kwaliteit van het onderzoek prima is.
Tot slot wil ik nog enkele opmerkingen maken. Uit de resultaten blijkt dat dc vier controle scholen het
op de diverse tests, cn met name de cloze tests, zeer goed doen in vergelijking met de experimentele
scholen. Aan deze kwestie besteedt de auteur te weinig aandacht. Een mogelijke verklaring is dat het
werken met speciale instructeurs het nadeel heeft dat de lessen tot op zekere hoogte een eigen leven gaan
leiden. Immers een leerkracht die steeds met een klas werkt k^n bij allerlei andere lessen teruggrijpen op
de in de leeslessen behandelde materie. In dc experimentele scholen bestond deze mogelijkheid voor de
klasseleerkracht niet of nauwelijks. M.a.w. de samenhang van het totale onderwijs kan in de experimen-
tele scholen geringer zijn geweest dan in de controle scholen. Wellicht verdient het aanbeveling experi-
mentele lessen toch door de eigen leerkracht te laten geven, ondanks de nadelen die daar experimenteel
gezien ook aan kleven.
En dan nog een algemene opmerking die opgaat voor veel dissertaties in de sociale wetenschappen. Ik
ben van mening dat in de sociale wetenschappen kwantiteit (in blz.) dikwijls teveel de nadruk krijgt
tegenover de kwaliteit (van inhoud). Ook dit boek maakt dc indruk van een moeizaam product waarin
vele uitwijdingen zijn gepleegd om tot een grote omvang te geraken. Dc kern van de zaak, het onderzoek,
raakt daardoor ondergesneeuwd. Ik beschouw dit niet in de eerste plaats als een fout van de auteur, maar
als een fout van het beleid bij promoties in de sociale wetenschappen. Ik leerde vroeger op school al dat
niet het vele goed, doch het goede veel is.
E. Bol
R.U. Utrecht
Tijdschrift voor Onderwijsresearch 9 (1984) nr. 1, pp. 45-46.
The Dutch Sociometric Society announces an
INTERNATIONAL CONFERENCE ON METHODOLOGICAL RESEARCH
University of Amsterdam
Amsterdam, October 3-5, 1984
Readers are invited to subrmt extended abstracts of (planned) papers before March 31, 1984. The papers
should concern the topics of sociometric research: operationalization, data collection, sampling, scaling,
'iata analysis.
Participation in the conference is open to all interested scholars. The registration fee is DFL. 50,-. You
can registrate by writing to the secretariat before February, 29.
More information is provided on request by the organizing secretariat: Kees Aarts, Methodology
Department FSW-A, Grimburgwal 10, building 5, 1012 GA Amsterdam (The Netherlands), phone:
(020)5252057 or 5252089.
Ontvangen publicaties
Bronneman-Helmers, R. Van school naar werk. Educatieve voorzieningen voor jongeren met weinig
opleiding (Stukwerk nr. 12). Rijswijk: Sociaal en Cultureel Planbureau, 1983.
Corte, E. de, & Span, P. Studies over onderwijsleerprocessen. Bijdragen aan een symposium ter gelegen-
heid van lien jaar Belgisch-Nederlandse samenweriiing. Leuven: Helicon, 1983.
Crombag, H.F.M., Gruijter, D.N.M. de. Bakker, E., & Brown, D.R. De studielast in de juridische
propedeuse: Een andere analyse. Leiden: Bureau Onderzoek van Onderwijs, Rijksuniversiteit
Leiden, 1983.
Fase, W., & Jong, M.J. de. De schakelklas. Beleidsgerichte evaluatie van het functioneren van de
schakelperiode (SVO project 0614). Rotterdam: Vakgroep Onderwijssociologie en Onder-
wijsbeleid. Erasmus Universiteit Rotterdam, 1983.
Groot, A.D. de, & Wijnen, W.H.F.W. Vijven en zessen. Cijfers en beslissingen: Het selectieproces in ons
onderwijs (10e druk). Groningen: Wolters-Noordhoff, 1983.
Kroonenbcrg, P.M. Three-mode principal component analysis. (M & T series, volume 2). Leiden: DSWO
Press, 1983.
Meijers, F. Van ambachtsschool lol L.T.S. Onderwijsbeleid en kapitalisme. Nijmegen: Socialistische
Uitgeverij Nijmegen, 1983.
Mensenkind en menselijk contact (themanummer). Pedagogisch Tijdschrift Forum voor Opvoedkunde,
1983, 8 (oktober).
Meulman, J. Homogeneity analysis of incomplete data (M & T series, volume 1). Leiden: DSWO Press,
1982.
Mirande, M.J.S., & Wardenaar, E. Scriptieproblemen (Onderwijskundige Informatie voor het Hoger
Onderwijs). Utrecht/Antwerpen: Spectrum, 1983. (Aula 813).
Stichting voor de leerplanontwikkeling. Jaarverslag 1982. Enschede: SLO, 1983.
Wainer, H., & Messick, S. (Eds.). Principals of modern psychological measurement. A Festschrift for
Frederic M Lord. Hillsdale, N.J.: Erlbaum, 1983.
SOCIOLOGENDAGEN 1984
Op woensdag 25 en donderdag 26 april 1984 worden in de Vrije Universiteit te Amsterdam de
'Sociologendagen 1984' gehouden. Doel van deze dagen is een overzicht te geven van recente ontwikke-
lingen in de sociologie en de antropologie in Nederland en Vlaams-België.
46 Mededelingen
Het algemene thema is 'De balans van de sociologie sinds 1970'.
De deelname aan de conferentie kost ƒ 140,- (Bfrs. 2600).
NSAV-, VVS-leden, doctoraal-studenten en werkloze sociologen en antropologen krijgen reductie.
Aanmelding en informatie: Secretariaat Sociologendagen: J. Dronkers en A.B. Veenstra-Berends,
SISWO, Postbus 19079, 1000 GB Amsterdam. Telefoon 020-240075.
Postacademische cursussen 'Omgaan met (wetenschappelijke) literatuur/informatie op het terrein van
onderwijs en opleiding'.
In het kader van het postacademisch onderwijs sociale wetenschappen (PAOS) vindt er een tweetal
cursussen plaats die zijn gericht op het leren omgaan met literatuur en informatiebronnen op het terrein
van onderwijs en opleiding.
Zij zijn bestemd voor onderwijsgevenden, medewerkers in de verzorgingsstructuur, ministeries, univer-
sitaire instituten, onderzoeksinstituten e.a., die willen Ieren om zelfstandig en efficiënt hun weg te vinden
in dit steeds omvangrijker en complexer wordend informatiegebied.
De basiscursus richt zich op kennismaking en oefening met de Nederlandse informatiebronnen: biblio-
theken, documentatiecentra, naslagwerken, bibliografieën etc. De cursus vindt plaats te 's-Gravenhage
en omvat twee dagen: 6 en 13 april 1984; de kosten bedragen ƒ 350,-.
Dc vervolgcursus richt zich op kennismaking en oefening met internationale informatiebronnen; daarbij
komt o.a. het zoeken van hteratuur met behulp van de computer aan de orde. De cursus vindt plaats te
's-Gravenhage en omvat drie dagen: 4 en 11 mei en 1 juni 1984; de kosten bedragen ƒ 450,-.
Cursusleiding: drs. C.A. Arnold (vakgroep vooriichtingskunde Wageningen) en drs. E.J. Boerma (vak-
groep onderwijskunde Groningen).
Nadere inlichtingen en inschrijving:
Postacademisch onderwijs Sociale Wetenschappen (PAOS)
Stationsweg 46
2312 AV Leiden
071-148333 tst. 2442.
Inhoud Pedagogische Studiën
Jaargang 60
November 1983
Ten geleide, door J.R.M. Gerris
'Een meer hoHstische visie is centrale opgave voor de onderwijskunde'. W.L. Wardekker cn J.F. Vos in
gesprek met Prof. Dr. J. Sixma.
'De cultuurpolitieke functies van het onderwijs verdienen meer aandacht'. J.M.G. Leune en P. Span in
gesprek met Prof Dr. J.A. van Kemenade.
'Ik sta het dichtst bij de onderwijstechnologie...', P. Span en J.M.G. Leune in gesprek met Prof. Dr.
A.M.P. Knoers.
December 1983
Schoolprestaties van kinderen van werkloze vaders. Een verkennend onderzoek, door D.B. Baarda,
A.P.M. Frowijn, M.P.M. de Goede en M.E. Postma
Attributiestijlen in het onderwijs. Theoretische achtergronden en beiivloedingsstrategieën, door J. van
den Bout.
Een onderwijsontwijckelingsproject in analyse, door J.M.C. Nelissen
Kronieken: Verslag van het AERA-Congres 1983 te Montreal, door P.N. Appclhof (red.), J.J.H. van den
Akker, G.J. van den Brink, J.L. Knip, T.A.M. van der Meer, Th. Oudkerk Pool en H.G. Schmidt.
Verslag van 'The Fifth World Conference on Gifted and Talented Children' 1983 te Manilla, door P.N.
Span.
ONDERWIJSRESEARCHDAGEN 1984
21 en 22 mei 1984, Katholieke Hogeschool Tilburg
Evenals in 1982 zullen ook in 1984 de OnderwijsResearchDagen plaats
vinden aan de Katholieke Hogeschool te Tilburg. De ORD'84 zullen een
aantal nieuwe elementen bevatten: Rond een aantal min of meer nauw
omschreven onderwerpen zullen symposia worden georganiseerd, waar-
aan door een beperkt aantal personen kan worden deelgenomen. Verder
zijn groepen onderzoekers aangezocht om over het onderzoeksterrein
waarop zij zich bewegen 'stand van zaken'-voordrachten voor te berei-
den. De deelnemers aan de ORD zal het interesseren dat zij in aanmer-
king komen voor een gratis congresbundel naar keuze. Tot slot heeft
de Vereniging voor OnderwijsResearch een aanmoedigingsprijs inge-
steld voor jonge onderzoekers die nog zonder vaste werkkring zijn. De
uitreiking hiervan zal tijdens de ORD plaats hebben. De prijs omvat
ondermeer een geldbedrag van f 1.000,— die door de onderzoeker kan
worden aangewend voor de eigen professionalisering.
De thema's van de ORD'84 zijn:
1. Onderwijs en informatietechnologie,
2. Historisch-sociologisch onderzoek van Onderwijsvernieuwing,
3. Kenmerken van studierichtingen in het hoger onderwijs,
4. Begeleiding en Onderzoek,
5. Zelfstandig leren,
6. Samenwerking en fusies van schoolorganisaties,
7. Curriculum: ontwerp en interpretatie,
8. Praktische vaardigheden in het beroepsonderwijs,
9. Leerproblemen en schooluitval,
10. Media en onderwijsinnovatie.
Eind januari/begin februari verschijnt de ORD'84 brochure, die aan
zo'n 3500 adressen zal worden toegezonden. Mocht u nadere informatie
wensen, of na 5 februari nog geen brochure ontvangen hebben, dan
kunt u zich telefonisch (alleen 's-ochtends van 09.00 - 12.30 uur!) in
verbinding stellen met het ORD'84-secretariaat: 013 - 662263.
(Advertentie)
BIJDRAGEN TOT DE ONDERWIJSRESEARCHDAGEN 1983 Onderwijsleeiprocessen: Onder redactie van J. J. Belshulzen, C. Hamaker, B. van Hout Wolters en INHOUD H. G. L. 0. Lodewijks: Onderzoek van Ondenwijsleerprocessen C. Hamaker en B. van Hout Wolters: Tekstverwerking R. A. Gerstel: De ontwikkeling van een zelfbeeld van lezen bij eerste klassers van de basisschool G. Seegers en H. Feenstra: Zinsvenwerking en verschillen ln Th. Boland en M. J. M. Voeten: Het faciliterend effect van het genereren van vragen bij de bestudering van een studietekst H. G. L. C. Lodewijks. Place-van Tongerloo en P. R. J. J. J. Beishuizen: Al doende leert men problemen oplossen problemen: analyse van hardopdenk-protocoilen C. Teyken: Een planningsheuristiek voor ontwerpprocessen toekomst? • A. van der Wissel: Betekenisrepresentatie, interne en externe D. van Dongen, A. Dickhout, G. Driessen en M. Mommers: De A. G. Bus: Training van foneemwaarneming: oorzaken van differentiële effekten |
BIJDRAGEN TOT DE ONDERWIJSRESEARCHDAGEN 1983 Schoolorganisatie, Onderlinge samenhang bi] Onder redactie van G. J. Bergenhenegouwen en G. M. E. Blom INHOUD G. J. Bergenhenegouwen en G. M. E. Blom: Ten Geleide THEMA 1: VERANDERING IN ONDERWIJSORGANISATIES Verandering in onderwijsorganisaties en aansluitingsproblemen praktijk, praktijk en beleid vernieuwingen in schoolorganisaties K. A. Beintema en A. M. A. C. van Greevenbroek: De THEMA 2: DIDACTISCHE KWALITEIT EN LEREN G. M. E. Blom: Inleiding H. Welmers en J. H. de Swart: Onderwijsrendement en W. van Os: Onderwijs geven en onderwijs volgen: wat levert het Th. J. ten Cate en Tfi. J. M. Tromp: Leren door doceren, een wezenlijke bijdrage van peer teaching het gespreksmodel THEMA 3: DIFFERENTIATIE P. de Koning: Inleiding |
IV+212 pp.
ISBN 90 265 0497 7
f 35,35
IV + 164 pp.
ISBN 90 265 04M 5
ƒ 35,35
Te bestellen bij de boeKhandel of door overmaking van het bedrag op girorekening
13984 t.n.v. Swets Publishing Service. Heereviieg 347b, 2161 CA Lisse,
noet vermelding van het vetgedrukte nummer.
Telex 41325
Telefoon 02521-19113
Postbus 820. 2160 SZ Lisse
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp. 49-60.
De School- en Beroepsloopbaan van KMBO- en
BBO-Leerlingen
Het onderzoelc naar de individuele schoolloopbaan en beroepsloopbaan van leerlingen van het Kort
Middelbaar Beroepsonderwijs (KMBO) en streekscholen voor Beroepsbegeleidend Onderwijs (BBO).
Jos de Jonge
instituut voor Onderwijskunde,
'Nijmegen
abstract
Education and Laljour of KMBO- and BBO-pupils
In 1979-1980 the first experimental vocational courses for 16 and 17 year-olds (KMBO: short
senior vocational training) started. In order to evaluate these courses the educational and
professional careers of pupils were analyzed and compared with the careers of pupils from
conventional vocational training courses (BBO). A sample of 1000 respondents was taken from
the KMBO and BBO populations. The research project is longitudinal and cross-sectional. The
first results of this project indicate that there are hardly any differences between these populations
(contrary to governmental intentions): they differ hardly with respect to variables such as sex, age,
socio-economic status, and educational career before entering the course. At the end of this article
five policy-oriented conclusions are presented.
INLEIDING
In het voorliggende artikel wordt verslag gedaan van de eerste meting van het School- en
Beroepsloopbaanonderzoek KMBO-BBO (Kort Middelbaar Beroeps Onderwijs en Be-
roepsbegeleidend Onderwijs).
De studie van individuele schoolloopbanen is de laatste jaren sterk in de belangstelling
gekomen (Jencks, 1972; Sewell & Hauser, 1976; Collaris & Kropman, 1978; Dronkers,
1978; Peschar, 1978). Deze belangstelling wordt vooral gevoed vanuit de verschillen in
Onderwijskansen van jongens en meisjes en van leerlingen uit de diverse sociale milieus.
Centraal hierbij staat de mate waarin de bestaande maatschappelijke ongelijkheid via het
onderwijs gereproduceerd, danwel doorbroken wordt. Soms wordt hierbij eigen materiaal
Verzameld (Peschar, 1975; Collaris & Kropman, 1978; Smulders, 1978), vaak gaat het ook
om secundaire analyse van bestaand materiaal (Dronkers, 1978) of om overzichtspublikaties
(Tesser, 1981).
Het voorliggende onderzoek vertrekt echter vanuit een heel andere optiek als de hierboven
genoemde publikaties. Het onderzoek is niet geïnitieerd vanuit een wetenschappelijke inte-
resse in de doorbreking c.q. reproductie van maatschappelijke ongelijkheid, maar juist vanuit
de actuele beleidsrelevantie van het KMBO.
Een ander verschil zit in de actualiteit van de studie. Dronkers (1978, p. 122) waarschuwt
ervoor dat de gegevens van bijvoorbeeld 'Van jaar tot jaar' verzameld zijn bij leerlingen die
hun scholing hebben gehad in de periode van vóór de mammoetwet en onder de toenmalige
50 School- en beroepsloopbaan van KMBO en BBO
economische omstandigheden hun intrede op de arbeidsmarkt hebben gedaan. Studies als die
van Jencks (1972), Sewell & Hauser (1976) hebben eveneens het nadeel dat ze gebaseerd zijn
op gedateerd materiaal. Het voordeel van de voorliggende studie is dat het hier gaat om
leerlingen die hun vooropleiding hebben genoten in het onderwijssysteem dat nu nog bestaat
en hun actuele scholing ontvangen in een experimentele onderwijsvorm die momenteel
beleidsrelevant is. Bovendien zal het gegevens op gaan leveren over het arbeidssucces van
deze jongeren onder de huidige economische omstandigheden.
Voordat op de onderzoeksopzet, de resultaten en de conclusies van het onderzoek wordt
ingegaan, zullen eerst de achterliggende beleidsvragen worden weergegeven.
Het KMBO is als nieuw beleid in 1978 geïntroduceerd (De Jong & Albeda, 1978). Het
KMBO is als nieuwe onderwijsvorm gaan functioneren in een complex van onderwijsvoorzie-
ningen voor 16-18 jarige LBO- en MAVO-schoolverlaters, vanuit het besef dat niet voor alle
potentiële leerlingen een passende opleiding voorhanden was. Het MBO kan niet alle school-
verlaters uit LBO en MAVO opvangen. Het leerlingwezen kan vanwege een tekort een
arbeidsplaatsen ook niet voldoen aan de behoefte aan vervolgonderwijs. Daarbij kwam anno
1978 een toenemende tendens van jongeren om langer full-time onderwijs te volgen. Het
potentieel van leerlingen zou dus stijgen (De Jong & Albeda, 1978, pag. 5 e.V.).
Dit waren de belangrijkste motieven om naast de bestaande onderwijsvormen het nieuwe
KMBO te starten. Het beleid stond een KMBO voor ogen dat:
- drempelloos zou moeten zijn doordat ook niet-gediplomeerden toegelaten zouden kunnen
worden;
- de doorstromingsmogelijkheden naar vervolgonderwijs zou moeten vergroten. (De door-
stromingspercentages van BBO en vormingswerk naar het MBO zijn te verwaarlozen).
Hiertoe zouden een tweetal programma's gemaakt moeten worden:
- Tweejarige beroepsopleidingen, te verbinden aan scholen voor middelbaar beroepson-
derwijs, en aan samenwerkingsverbanden van vormingswerk en beroepsbegeleidend on-
derwijs. Onder andere op grond van de beschikbaarheid van ruimte kunnen de tweejarige
beroepsopleidingen in bepaalde gevallen bij scholen voor lager beroepsonderwijs worden
ondergebracht.
- Indien noodzakelijk daaraan voorafgaande of daarmee te combineren oriëntatie en andere
programma's te verbinden aan samenwerkingsverbanden van vormingswerk en be-
roepsbegeleidend onderwijs (De Jong & Albeda, 1978, p. 13).
Met ingang van het schooljaar 1979-1980 zijn op een aantal locaties proefprojecten
KMBO gestart. De opleidingsmogelijkheden zijn minder divers dan die van de streekscholen
voor beroepsbegeleidend onderwijs. Er zijn naast de oriëntatie- en schakelprogramma's in
totaal een 16-tal opleidingsrichtingen. Meestal zijn er4 tot 7 mogelijke opleidingsrichtingen
per locatie.
Vanuit de beleidsintenties kwam de vraag naar cijfermatige informatie over de proefprojec-
ten naar voren. Hierbij zijn de volgende beleidsevaluatieve vragen gesteld:
- Bereikt het KMBO de doelgroep waarvoor het is ingesteld, en doet het dit beter dan de
bestaande onderwijsvormen?
- Het KMBO is ingesteld vanuit het besef dat voor LBO- en MAVO-schoolverlaters onvol-
doende mogelijkheden zijn om in full-time verband een vervolgopleiding te kiezen. Dit
wordt veelal omschreven als het gat in de mammoetwet. De vraag is of het KMBO er
daadwerkelijk in slaagt om het gat in de mammoetwet te dichten, en als zodanig een
verbetering is van de structuur van het voortgezet onderwijs?
- Binnen het totaal aan onderwijsvoorzieningen voor 16-18 jarigen neemt het beroepsbege-
-ocr page 55-Jos de Jonge 1239
leidend onderwijs een centrale plaats in. Binnen dit onderwijs worden ongeveer viermaal
zoveel jongens als meisjes opgenomen. Deze eenzijdige gerichtheid op jongensopleidin-
gen zou bij het KMBO voorkomen moeten worden omdat aan beide sexen even grote
kansen gegeven moeten worden. De vraag rijst in welke mate het KMBO hier daadwerke-
lijk in slaagt?
~ Het KMBO leidt evenals het BBO op tot beginnend beroepsoefenaar. In het kader van de
evaluatie van het KMBO is het van belang om na te gaan of het KMBO er daadwerkelijk in
slaagt om de eenmaal ingestroomde leerlingen de noodzakelijke kwalificatie bij te brengen.
Daarnaast is het uiteindehjke criterium, de vraag of de kwalificatie gevraagd wordt en op de
arbeidsmarkt tot een succesvolle intrede leidt.
In hoeverre de beleidsdoelstellingen gerealiseerd worden, kan worden afgeleid uit een be-
schrijving en analyse van leerlingkenmerken bij het KMBO, vooral gericht op achtergronds-
kenmerken, schoolloopbaankenmerken en beroepsloopbaankenmerken. Een vergelijking
Van deze gegevens met soortgelijke gegevens uit naastliggende onderwijsvormen zou tot de
mogehjkheden moeten behoren. Het onderwijs aan streekscholen voor Beroepsbegeleidend
Onderwijs (al dan niet in het kader van het leerlingwezen) kwam hiervoor het meest in
aanmerking, enerzijds vanwege de gemeenschappelijke gerichtheid op een opleiding tot
beginnend beroepsbeoefenaar, anderzijds vanwege het markante verschil tussen full-time
opleiding met stages (KMBO) en overwegend part-time opleiding met werk (BBO).
ONDERZOEKSOPZET
begeven de gestelde vragen kan het doel van het onderzoek als volgt worden omschreven.
Het doel van dit onderzoek is tweeledig. In eerste instantie wordt nagegaan in hoeverre het
KMBO de beoogde doelgroep bereikt en of het hierin beter slaagt dan de streekscholen. In
een volgende fase wordt de verdere school- en beroepsloopbaan van de leerlingen in kaart
gebracht, om zodoende na te gaan in hoeverre via dit onderwijs een vergelijkbare, betere of
slechtere positie op de arbeidsmarkt wordt verworven dan via het BBO.
In dit artikel wordt op de eerste doelstelling ingegaan. In het verloop van het onderzoek zal
Vooral aandacht worden besteed aan de verdere schoolloopbaan en beroepsloopbaan.
Vanuit de doelstelling Van het onderzoek zijn de individuele leerlingen als onderzoekseen-
heden gekozen. De totaalpopulaties van KMBO en BBO omvatten 5.700 resp. 97.000
leeriingen (CBS, 198 la). Hieruit is een steekproef getrokken van in totaal ± 1.000 leerlingen
500 KMBO, ± 500 BBO). De wijze waarop deze steekproef getrokken is, wordt in de
appendix weergegeven.
Het onderzoek is longitudinaal van karakter. Op meerdere momenten in de tijd worden
dezelfde leerlingen met vragen benaderd. De eerste meting is in september 1981 geweest,
volgende meetmomenten zijn mei 1982, september 1982 en september 1983. Bovendien is
net onderzoek cross-sectioneel van aard. Het KMBO (en BBO) heeft oriëntatiegroepen (of
schakelklassen) en le jaars en 2e jaars beroepsopleidingen. Van deze drie groepen zijn
'eerlingen in het onderzoek opgenomen. De belangrijkste motivatie hiervoor was een tijd- en
kostenbesparing. Indien alleen de le jaars groep (en de oriëntatiegroepen) zou worden
gevolgd, zou de meting van de beroepsloopbaan op 1 Va jaar na het schoolverlaten pas in
september 1984 kunnen plaatsvinden. Het erbij betrekken van de 2e jaars levert daarom een
[■jdwinst op van 1 jaar (en dito besparing), hetgeen zeker bij beleidsonderzoek van groot
belang geacht kan worden.
52 School- en beroepsloopbaan van KMBO en BBO
RESULTATEN
De resultaten bestaan uit:
1. een beschrijving van de leerlingpopulatie van het KMBO en een vergelijking met het
BBO;
2. analyse van de differentiële schoolkeuze van KMBO- en BBO-leerlingen.
Beschrijving van de leerlingpopulatie
In de onderstaande 5 tabellen worden een aantal gegevens verstrekt over de KMBO- en
BBO-instromers (cohort 81-82). Het gaat hierbij om een drietal achtergrondskenmerken
(geslacht, leeftijd en sociaal-economische status) en om een tweetal schoolloopbaankenmer-
ken (vooropleiding en toelaatbaarheid tot het MBO).
Tabel 1. Het aantal jongens en meisjes bij de KMBO- en BBO-instroom
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vergelijking KMBO en BBO geeft een = 4.2 bij df = 5 en a = 0.05 niet^ignificant. * |
Jos de Jonge 53
KMBO |
BBO | |
ongediplomeerd |
26.1% |
24.0% |
diploma LBO |
54.8% |
63.4% |
diploma MAVO |
18.1% |
11.8% |
overige |
1.0% |
0.8% |
X^ = 5.69 bij df = 3 en a = 0.05 niet significant. | ||
Tabel 5. Toelaatbaarheid tot het MBO van de KMBO- |
en BBO-instroom | |
KMBO |
BBO | |
^el toelaatbaar |
39.3% |
30.0% |
niet toelaatbaar |
60.9% |
70.0% |
IJ't de tabellen blijkt dat er ongeveer evenveel meisjes als jongens op het KMBO zitten en dat
dit onderwijs conform de doelstelling sterk gericht is op de 16-18 jarigen (90% van de
leerlingen is 16-18 jaar). Indien we over de milieu-achtergrond van deze jongeren spreken,
Z'en we dat de lagere milieus oververtegenwoordigd zijn (vergeleken met een dwarsdoorsne-
de van alle 17-jarige Nederlanders). (Kropman & Collaris, 1974, pag. 4.34).
Verder blijkt dat ruim een kwart van de leerlingen ongediplomeerd is en bijna 40%
toelaatbaar is tot het Middelbaar Beroeps Onderwijs.
Bij
een vergelijking van KMBO en BBO dient het volgende gesteld te worden.
Het KMBO is volle-tijds onderwijs en de meeste programma's van de streekscholen zijn
eperkt tot een of twee dagen per week onderwijs op school. Het BBO omvat veel meer
opleidingsrichtingen (veel technische beroepen waar vooral jongens interesse voor hebben)
dan het KMBO. In de onderzoekspopulatie van het BBO daarentegen zitten alleen die
opleidingsrichtinge n die ook in het KMBO voorkomen. Het blijkt dat er meer sprake is van
overeenkomsten dan van verschillen. Sterke overeenkomsten zijn er ten aanzien van geslacht
en Sociaal-economische status. Enige, hoewel beperkte, verschillen zijn er ten aanzien van de
toelaatbaarheid tot het MBO en de leeftijd. Het KMBO heeft gemiddeld een jongere groep in
huis dan het BBO. Opmerkelijker is het verschil in vooropleiding. Het blijkt dat 39.3% van de
MBO-groep in principe toelaatbaar is tot het MBO. Bij onze vergeHjkingsgroep op het
Bo was dit percentage 30. Naast de verschillen tussen KMBO en BBO is er een vergelijking
gemaakt tussen de KMBO-instroom en de doelgroep. De doelgroep is hierbij gedefinieerd als
e groep LBO- en MAVO-schoolverlaters voorzover zij niet in een of andere vorm van
""-time of part-time onderwijs terecht komen.
f^1^ jaarlijkse publikaties van het CBS over de overgangen binnen het onderwijs en de intrede
|n de maatschappij geven hier gegevens over (CBS: Onderwijsmatrix, 1979). In deze pu-
ol'katie worden de aantallen LBO- en MAVO-schoolverlaters gegeven (CBS, 1981b, bijlage
^n 2). Hierbij zijn vooropleiding en geslacht van de LBO- en MAVO-schoolverlaters
ekend. Vanwege onze omschrijving van de doelgroep worden die op grond van bovenge-
noemde omschrijving van de doelgroep worden die leeringen uit de CBS gegevens geselec-
.^fd die niet meer naar volledig dagonderwijs of part-time onderwijs gaan. Een verdere
' splitsing is vanwege de aard van de CBS gegevens niet mogelijk.
54 School- en beroepsloopbaan van KMBO en BBO
Tabel 6 geeft aan hoeveel jongens en meisjes het LBO en MAVO verlaten en niet naar een
of andere vorm van vervolgopleiding gaan. Hierbij wordt tevens aangegeven of de leerlingen
gediplomeerd zijn. ,
Tabel 6. Vooropleiding van de doelgroep uitgesplitst voor jongens en meisjes. | ||||||||||||||||||||||||||||||||||||
|
In onderstaande tabel worden dezelfde gegevens van de actuele instroom in het KMBO
gegeven.
Tabel 7. Vooropleiding van de KMBO-instroom uitgesplitst voor jongens en meisjes. | |||||||||||||||||||||||||||||||||||||||||||||||||
|
Als we tabel 6 en 7 met elkaar vergelijken, komen we tot de volgende conclusies:
- De verhouding jongens:meisjes is ongeveer gelijk. Toetsing levert geen significant verschil
op. Dit kan betekenen dat de KMBO's zich niet sterker op een van de beide geslachten
richten.
- De doelgroep kent iets meer ongediplomeerden. Dit verschil is echter niet significant.
Analyse van de schoolkeuze
Voor een analyse van de schoolkeuze is een discriminant analyse uitgevoerd. Het doel van
deze analyse is na te gaan waarin de beide groepen het sterkst verschillen. Uit de bovenstaan-
de populatiebeschrijving is duidelijk geworden dat verschillen niet zozeer in achtergronds-
kenmerken en schoolloopbaankenmerken liggen.
Onze veronderstelhng bij deze analyse was, dat die variabelen die het sterkst de verschillen
tussen de KMBO- en BBO-populaties bepalen ook het meest expliciet in staat zijn de
verschillen in schoolkeuze te verklaren.
Jos de Jonge 55
Bij een analyse met twee groepen wordt slechts één discriminantfunctie gegeven. Deze functie
heeft de volgende algemene vorm (Klecka, 1980).
ffcm = Uo + UiXikm + U2X2kn, + - + "pipkin
. waarbij
^km = de score op de discriminantfunctie voor respondent m in groep k (k = 1.2)
^ikm = de score op de discriminantvariabele Xj voor respondent m in groep k
"i = functiecoëfficiënt die de gewenste waarden in de functie aangeeft.
Deze functiecoëfficiënten bepalen het belang van de score Xj^n, op de functie. Via standaar-
disatie kunnen de coëfficiënten onderHng vergelijkbaar worden gemaakt.
De volgende variabelen zijn in de analyse betrokken:
Achtergrondskenmerken
1- geslacht
2. sociaal-economische status (voor deze variabele is gewerkt met zogenaamde dummy's
van de indeling in 6 klassen volgens de ITS-beroepenklapper)
3. leeftijd per 1 september 1981.
ö Schoolloopbaankenmerken
1- toelaatbaarheid tot MBO
2. diplomeringsniveau (al dan niet gediplomeerd)
3. diploma MAVO (al dan niet diploma MAVO)
4. diploma LTS (al dan niet diploma LTS)
5- diploma LHNO (al dan niet diploma LHNO)
6- diploma LEAO (al dan niet diploma LEAO)
C Beroepsloopbaankenmerken
L het al dan niet gewerkt hebben voor de intrede in KMBO/BBO
2. sollicitatie-ervaring
3. inschrijving op arbeidsbureau
^ Houdingen
1- factor toekomstgerichtheid*
2. factor gerichtheid op algemene vorming en oriëntatie*
3. t/m 8 de overige 6 items* uit de schoolkeuzelijst
In tabel 8 worden de gestandaardiseerde functiecoëfficiënten op de discriminantfunctie
Begeven. Hierbij zijn alleen die variabelen opgenomen die uit de analyse naar voren kwamen
®n een zekere bijdrage geven aan de discriminantfunctie.
Voor een aantal variabelen bleek de invloed (na aftrek van de reeds ingevoerde variabelen)
de discriminant zo klein, dat men hier niet meer over significante verschillen kan spreken.
De discriminantfunctie bevatte uiteindelijk 11 van de 22 ingevoerde variabelen. Tussen
scores van beide groepen op de discriminantfunctie was het verschil significant (x^ = 322.8,
® ^ -05 bij df = 11). De door de discriminantfunctie verklaarde variantie bedroeg 49%.
56 School- en beroepsloopbaan van KMBO en BBO
Tabel 8. Gestandaardiseerde discriminantfunctiecoëfficiënten per variabele.
variabele |
functiecoëfficiënt |
A2 sociaal-economische status |
-.11 |
A3 leeftijd |
.13 |
B3 diploma MAVO |
.08 |
B4 diploma LTS |
-.26 |
Cl het al dan niet gewerkt hebben | |
voor intrede KMBO/BBO |
.49 |
C2 sollicitatie-ervaring |
.37 |
C3 inschrijving op het arbeidsbureau |
.65 |
Dl factor toekomstgerichtheid |
.38 |
D2 factor gerichtheid op algemene | |
vorming en oriëntatie |
.10 |
D5 ik ben naar deze school gegaan omdat | |
ik niet weet wat ik wil worden |
.13 |
D6 ik ben naar deze school gegaan omdat | |
ik niet naar een andere school kon |
.16 |
De hoogte van de gestandaardiseerde functiecoëfficiënten geeft aan hoe groot de bijdrage van
elk van de variabelen is aan het verschil tussen KMBO en BBO.
De variabelen met de grootste standaard functiecoëfficiënten (Uj>.35) zijn Cl, C2, C3 en
Dl. Hieruit blijkt dat vooral bij de variabelen uit het cluster beroepsloopbaankenmerken en
de factor toekomstgerichtheid duidelijke verschillen zijn af te lezen tussen de KMBO- en
BBO-groep. Concluderend kan gesteld worden dat de keuze voor KMBO of BBO in veel
mindere mate bepaald wordt door achtergrondskenmerken en karakteristieken van school-
loopbanen, maar veel meer door factoren die rechtstreeks in verband staan met het werk (het
al dan niet gewerkt hebben, sollicitatie-ervaring).
Deze verschillen moeten dan zo geïnterpreteerd worden dat bij het KMBO de leerlingen
veel minder werk- en sollicitatie-ervaring hebben en sterker toekomstgericht zijn.
CONCLUSIES EN AANBEVELINGEN
Aan de hand van de hiervoor gegeven informatie zijn door de onderzoekers een aantal
conclusies en beleidsgerichte aanbevelingen geformuleerd.
Conclusie
De vraag of het KMBO de beoogde doelgroep bereikt moet bevestigend beantwoord worden.
De KMBO-instroom bestaat inderdaad voor het allergrootste deel uit T6-18 jarigen. Het zijn
bijna allemaal LBO- en MAVO-schoolverlaters. De jongens en de meisjes zijn gelijkelijk
verdeeld. Bij een,.vergelijking met de doelgroep (45.000 LBO- en MAVO-schoolverlaters)
blijkt het KMBO niet meer of minder gekwalificeerden danwel onevenredig veel jongens of
meisjes te herbergen. De vraag in hoeverre het KMBO een andere doelgroep bereikt dan de
streekscholen kan slechts beantwoord worden voor die opleidingsrichtingen die zij gemeen-
schappelijk hebben (en dus in het onderzoek zitten). Uit de vergelijking van beide populaties
Jos de Jonge 57
naar een aantal achtergrondskenmerken blijkt dat er meer overeenkomsten dan verschillen
^ijn. AUeen ten aanzien van de vooropleiding blijkt er een verschil te zijn. Het KMBO
herbergt meer leerhngen met een hoog kwaUficatieniveau (toelaatbaar tot het MBO = LBO
•net drie of meer vakken op C-niveau en MAV04) dan het BBO.
Conclusie 2
De vraag of de meisjes op het KMBO evenredig veel kansen krijgen kent twee kanten,
nameUjk roldoorbreking en vergroting van de mogelijkheden van traditionele meisjesoplei-
dingen.
Ten aanzien van de roldoorbreking het volgende. Het KMBO slaagt er niet in (evenmin als
het BBO) de geslachtsspecifieke verdeUng over opleidingen te doorbreken. Op beide school-
typen komen er weinig jongens voor op traditionele meisjesopleidingen en omgekeerd.
Ten aanzien van de vergroting van de mogeUjkheden van traditionele meisjesopleidingen
kan het volgende gesteld worden. Op het KMBO zowel als op de onderzochte groepen van het
ÖBo komen ongeveer evenveel meisjes als jongens voor. De landelijke cijfers van het BBO
daarentegen wijzen uit dat daar viermaal zoveel jongens als meisjes aanwezig zijn (CBS,
1981 a). Dit wordt veroorzaakt door de specifieke veelal technisch gerichte opleidingsrichtin-
gen (lees: jongensopleidingen). Het KMBO heeft dus een pakket opleidingen dat vergeleken
"let het BBO veel meer gericht is op meisjes.
Conclusie 3
het onderzoek is een verschiUend schoolkeuzepatroon naar voren gekomen. De keuze
hhjkt niet zozeer af te hangen van conditionerende variabelen als geslacht en diplomeringsni-
veau, maar veeleer bepaald te worden door zaken die rechtstreeks verband houden met het
Werk (werkervaring, soUicitatie-ervaring e.d.). Men zou dit kunnen omschrijven als een
gerichtheid op de wereld van de arbeid. Bij de BBO-leerlingen komt deze gerichtheid veel
sterker naar voren dan bij de KMBO-leerlingen. Complementair hieraan is de gerichtheid op
d^ algemene vorming en oriëntatie en de toekomstgerichtheid. Deze blijkt juist bij KMBO-
eerUngen veel duidelijker aanwezig te zijn. Hieruit is af te leiden dat het KMBO in zekere
"late in de behoefte voorziet van een groep jongeren die nog een full-time opleiding willen
Volgen en nog niet gericht zijn op het werk om zodoende de intrede in de arbeidsmarkt uit te
stellen.
Aanbevelingen
f" hoeverre het KMBO een effectief instrument is om het 'gat in de mammoetwet' te dichten,
kan niet eenduidig worden beantwoord. Het KMBO is bezig met het verzorgen van volle-tijds
onderwijs voor 16- 18-jarige LBO- en MAVO schoolveriaters. Streekscholen voorzien in een
ehoefte aan onderwijs in deeltijd-verband. Daarnaast kennen de streekscholen ook een
eperkt aantal volle-tijds opleidings- en schakelvariaties.
Naar een aantal markante eigenschappen zijn de KMBO-leeriingen identiek aan die van de
^^rgelijkbare opleidingsrichtingen van het BBO.
Tenzij aangetoond kan worden dat de beroepsloopbaan van KMBO-leerlingen beter is,
Verdient het op basis van deze informatie geen aanbeveling de ontwikkeling van het KMBO
sterker te stimuleren dan die van het onderwijs voor BBO en het leerlingwezen. Wat dit
aatste betreft is een uitbreiding van de mogeUjkheden voor de streekscholen in combinatie
"let het leerlingwezen naar volletijdsonderwijs wellicht een meer effectieve en goedkopere
Oplossing.
'-'h het onderzoek is voorts gebleken dat 40% van de huidige KMBO-popuIatie een
-ocr page 62-58 School- en beroepsloopbaan van KMBO en BBO
zodanig kwalificatieniveau heeft dat een toelating tot het MBO een mogelijkheid voor hen
zou kunnen zijn. Het gaat ogenschijnlijk om leerlingen die '... in eerste aanleg de voorkeur
geven aan een kortere beroepsgerichte opleiding ...' (De Jong & Albeda, 1978, p. 8). Voor
deze groep is een fasering in de opbouw van het huidige MBO met een korte en uitgebreide
variant een mogelijk alternatief.
Kortom, het verdient aanbeveling om alvorens over te gaan tot een integrale invoering van
het KMBO, de voor- en nadelen, kosten en baten hiervan te vergelijken met die van de andere
alternatieven.
APPENDIX
De trekking van de steekproef
Voor het samenstellen van de onderzoekspopulade is een steekproef getrokken van ± 500
KMBO-leerlingen en ± 500 BBO-leerlingen (zowel oriëntatiegroepen als le- en 2e jaars).
Bij dit onderzoek is gebruik gemaakt van de techniek van trapsgewijze trekkingen. Bij de
eerste trap heeft een selectie van de regio's plaatsgevonden. Hierbij zijn in eerste instantie die
regio's gekozen (regio-indeling van de Commissie Planprocedure) waar zowel een streek-
school als een KMBO-project aanwezig was. Daarna zijn uit deze regio's er een vijftal
uitgeselecteerd. De criteria bij deze selectie waren:
- jeugdwerkloosheidsgraad;
- toename/afname van het aantal 16-18 jarigen;
- urbanisatiegraad;
- aanwezigheid van onderwijsvoorzieningen voor deze doelgroep;
- de verhouding tussen alle 16-18-jarigen en de 16-18 jarigen die geen volledig dag onder-
wijs volgen.
De regio's zijn zo gekozen dat een spreiding op de verschillende criteria gegarandeerd was.
Uiteindelijk werden de regio's Groningen, Deventer, Den Haag, Middelburg en Heerlen
geselecteerd. Binnen deze regio's zijn de streekscholen en de KMBO's benaderd.
Bij deze scholen is vervolgens de tweede trap getrokken, namelijk de selectie van de
klassen. Daarbij zijn alle leerlingen die op het moment van de eerste meting in de klas
aanwezig waren, in het onderzoeksbestand opgenomen.
Bij de tweede trap is gekozen voor een proportionele stratificatie. Het stratificatiecriterium
was de verdeling over de opleidingsrichtingen. Hierbijjs gestreefd naar een representativiteit
op de hoofdclusters van opleidingsrichtingen (Oriëntatie en Schakel, Technische sector,
Dienstveriening, Verzorging). Bij de trekking van de klassen van het BBO is vooral de
vergelijkbaarheid met de onderzochte opleidingsrichtingen van het KMBO nagestreefd.
Representativiteit is hierbij geen criterium geweest.
Het resultaat van de steekproef was een onderzoekspopulatie van 517 KMBO- en 444
BBO-leerlingen, verdeeld over de Oriëntatie- en Schakelgroep en de opleidingsrichtingen
voor Bouw en Hout, Electro, Metaal, Motorvoertuigen, Consumptieve technieken. Admini-
stratie, Detail, Uiterlijke verzorging en Verzorgingsassistente.
De representativiteit van de KMBO-onderzoekspopulatie is nagegaan naar een drietal
criteria, namelijk geslacht, vooropleiding en opleidingsrichting. Hiervoor is een vergelijking
gemaakt tussen de actuele instroom in het KMBO (O&W, 1982) en vergelijkbare cijfers van
de onderzoekspopulatie op genoemde variabelen.
Voor de toetsing van de significantie van de verschillen is gebruik gemaakt van de bino-
-ocr page 63-Jos de Jonge 59
miaal-toets (Nijdam & Van Buren, 1981, p. 303) bij 2x2 tabellen en van de chi-kwadraattoets
nx2 tabellen (Nie et al., 1975, p. 223).
Tabel Al: Representativiteit naar geslacht
steekproef landelijk
z-waarden -.567 en -.678 niet significant bij a = 0.05 (binomiaal-toets)
Tabel A2. Representativiteit naar opleidingsrichting
steekproef landelijk
oriëntatie & schakel 21.9 22.7
technische opleidingen 26.4 26.6
dienstverlenende opleidingen 36.7 38.7
chi-kwadraat = 2.56 niet significant bij a = 0.05 en 3 vrijheidsgraden (x^-toets)
Tabel A3 Representativiteit naar vooropleiding
steekproef landelijk
diploma le cyclus VO 73.9 71.4
^ = -.898 en -1.02 niet significant bij a = 0.05 (binomiaal-toets)
Uit deze berekeningen blijkt dat de verschillen tussen de gegevens van steekproef en landelijk
'nstromers niet significant zijn. Hierdoor kan de conclusie getrokken worden dat de
steekproef representatief is voor het KMBO anno 1981-1982.
REFERENTIES
CBS (1981 a). Statistiek voor hel beroepsonderwijs 1979/89 - Beroepsbegeleidend Onderwijs/Leerlingwe-
zen. Den Haag: Centraal Bureau voor de Statistiek.
CBS (1981b): Overgangen binnen het onderwijs en intrede in de maatschappij. Onderwijsmatrix 1979.
Den Haag: Centraal Bureau voor de Statistiek, 1981.
Collaris, J. W. M. & Kropman, J. A. (1978). Van jaar tol jaar: tweede fase. Nijmegen: Instituut voor
Toegepaste Sociologie.
"fonkers, J. (1978). Manipuleerbare variabelen in de schoolloopbaan: een toepassing van het Wis-
consin-model op het Nederlandse primaire en sekundaire onderwijs. Mens en Maatschappij, 53,
116-143.
60 School- en beroepsloopbaan van KMBO en BBO
Interim Programma Adviescommissie Participatie-onderwijs (1980). Advies aan de Minister van Onder-
wijs en Wetenschappen over de programmering van het sectoronderzoek 1980 en 1981. Utrecht.
Jencks, C. S. (1972). Inequality. A reassessment of the effect of family and schooling in America. New
York: Basic Books.
Jong, K. de, & Albeda, W. (1978). Proefprojecten nieuwe onderwijsvoorzieningen voor 16-18 jarigen.
Den Haag.
Jonge, J. de (1980). Het school- en beroepsloopbaanonderzoek KMBO-BBO; eerste voortgangsverslag.
Nijmegen: NIVOR.
Jonge, J. de. Knijper, H., Haen, M., & Ritzen, J. (1982). School- en beroepsloopbaanonderzoek KMBO-
BBO; tweede voortgangsverslag. Nijmegen: Instituut voor Onderwijskunde.
Klecka, W. R. (1980). Discriminant analysis (Quantitative Applications in the Social Sciences, no. 19).
Beverly Hills/London: Sage.
Kropman, J. A., & Collaris, J. W. (1974). Van jaar tot jaar. Onderzoek naar de school- en beroepskarrière
van jongens en meisjes die in 1965 het lager onderwijs verlieten; eerste fase. Nijmegen:
Instituut voor Toegepaste Sociologie.
Nie, N. H., Huil, C. H., Jenkins, J. O., Steinbrenner, K., & Bent, D. (1975). SPSS. Statistical package for
the social sciences. (2nd). New York: McGraw-Hill.
Nijdam, B., & Buuren, H. van (1981). Statistiek voor de sociale wetenschappen (deel I en 2). Alphen aan
den Rijn/Brussel.
Peschar, J. L. (1975). Milieu, school, beroep: Een achteraf-experiment over de periode 1958-1973 naar de
invloed van het sociaal milieu op school- en beroepsloopbaan. Groningen: Tjeenk Willink.
Peschar, J. L. (1978): Kanttekeningen bij recent Amerikaans onderzoek naar stratificatie in school en
beroep. Mens en Maatschappij, 53, 79-105.
Sewell, W. H., & Hauser, R. M. (1975): Education, occupation and earnings. Achievement in the early
career. New York: Academic Press.
Smulders, R. (1979). CBS-onderzoek: schoolloopbaan en herkomst van leerlingen bij het voortgezet
onderwijs. Paper Onderwijsresearchdagen 1979. Voorburg, Centraal Bureau voor de Statistiek.
Tesser, P. (1981). Schoolloopbaanonderzoek in Nederland. Nijmegen: Instituut voor Toegepaste So-
ciologie.
Manuscript ontvangen 18-10-1982
Definitieve versie 14-10-1983
-ocr page 65-Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp. 61-70.
Een Onderzoek naar de Effectiviteit van een
Iteratieve Item Bias Detectie Methode bij Groepen
met een Verschillend Treknivo.
Henk van der FHer1
Subfaculteit Psychologie van de Vrije Universiteit, Amsterdam
Gideon J. Mellenbergh
Universiteit van Amsterdam
Herman J. Adèr
Subfaculteit Psychologie van de Vrije Universiteit, Amsterdam
The effectiveness of an iterative item bias detection method applied to groups differing in mean
ability
hem bias studies investigate whether different ethnic, racial cultural, etc., groups show different
response behavior lo lest items. An item is unbiased if the probability of a correct response is the
same for all subjects of a given ability level. A major problem in item bias detection is that the ability
level is assessed using all items in a test, including the biased ones. To escape this circularity an
iterative procedure has been developed, based on the log-linear model. The validity of the procedure
is investigated in a Monte Carlo study, where responses on biased and unbiased items are generated
varying the amount of bias and the trait-level for the groups distinguished. The results show that the
iterative log-linear method does a good job.
Met betrekking tot het probleem van discriminerend testgebruik wordt in de Beroepsethiek
Voor Psychologen (N.I.P., 1976) als eis geformuleerd dat
■■• personen bij gelijke geschiktheid ook gelijke kansen krijgen, welke verschillen zij ook mogen hebben
'n etnisch opzicht, qua sociale klasse, leeftijd, huidskleur, sexe, sexuele voorkeur, godsdienstige of
Politieke overtuiging of anderszins' (art. 2.5.1.).
Of geschiktheid moet worden geïnterpreteerd als gebleken geschiktheid dan wel als voorspel-
de geschiktheid blijft daarbij in het midden. Duidelijk is wel dat het niet gaat om gelijke
kansen als zodanig. Hoewel de constatering dat een bepaalde bevolkingsgroep relatief vaak
^ordt afgewezen voor een functie of opleiding wel vaak de aanleiding zal vormen voor
onderzoek naar de eerlijkheid of zuiverheid van de gevolgde selectieprocedure, behoeft dit
nog niet te betekenen dat er ook werkelijk sprake is van discriminatie. Van discriminatie, in
termen van de NlP-ethiek, kan pas worden gesproken wanneer de voorwaardelijke kansen
(gegeven het geschiktheidsnivo) om aangenomen of toegelaten te worden blijken te verschil-
len voor de onderscheiden groepen.
1 Thans verbonden aan de Sector Bedrijfspsychologie van de Nederlandse Spoorwegen.
Moreelsepark 1, Postbus 2025, 3500 HA Utrecht.
52 Iteratieve item bias detectie metliode
Een soortgelijke gedachtengang, maar dan gericht op de afzonderlijke test-items, vormt het
uitgangspunt voor de z.g. conditionele (voorwaardelijke) item bias modellen. De voorwaarde
waaraan een unbiased of zuiver item volgens deze modellen moet voldoen is dat gegeven het
nivo van de gemeten ofte meten trek de kans op een juist (positief gescoord) antwoord in de
verschillende groepen gelijk is. Treknivo kan worden geoperationaliseerd als de geschatte
latente trekpositie (Lord, 1977) of, eenvoudiger, als de waargenomen testscore* (Scheune-
man, 1979; Mellenbergh, 1982).
Een belangrijk probleem bij deze modellen, dat in een wat andere vorm ook geldt voor
eerder ontwikkelde, onvoorwaardelijke, modellen, is dat als de test een groot aantal on-
zuivere items bevat ook de totaalscore waarop geconditioneerd wordt onzuiver zal zijn. Dit
kan tot gevolg hebben dat sommige onzuivere items niet als zodanig worden geïdentificeerd
en andere, zuivere items ten onrechte als onzuiver worden gekwalificeerd. De resultaten van
een recentelijk afgesloten onderzoek door Van der Flier, Mellenbergh, Adèr en Wijn (1984),
waarbij gebruik werd gemaakt van gesimuleerde data, laten echter zien dat in veel gevallen
betere resultaten kunnen worden verkregen door toepassing van een iteratieve procedure.
De iteratieve procedure
Kort gezegd houdt de procedure in dat bij opeenvolgende iteraties het aantal items dat als
onzuiver wordt geclassificeerd en niet meetelt bij de bepaling van de totaalscore steeds met
één toeneemt. Dus na de eerste iteratie wordt het meest discriminerende item geïdentificeerd.
Dan wordt de analyse overgedaan zonder dat dit item meetelt bij de bepaling van de
totaalscore. Vervolgens worden de twee meest discriminerende items geïdentificeerd en
worden deze niet meegerekend bij de bepaling van de totaalscore, enz. Items die in een
eerdere fase als onzuiver worden geclassificeerd kunnen in een latere fase weer deel gaan
uitmaken van de groep zuivere items. De procedure stopt na een door de gebruiker op te
geven maximaal aantal iteraties, of wanneer alle onzuivere items (items waarbij de toet-
singsgrootheid een te specificeren grenswaarde overschrijdt) als zodanig zijn ingedeeld.
Bij elke iteratie wordt voor elk item een drie-dimensionele contingentietabel opgesteld met
als randvariabelen scorecategorie (1), groepslidmaatschap (2) en item response (3). De
indeling in sc'orecategorieën vindt plaats op grond van de totaalscore over de (nog) niet>als
onzuiver geclassificeerde items, waarbij de score op het betreffende item buiten beschouwing
wordt gelaten. Zoveel mogelijk wordt gestreefd naar een uniforme verdeling van de totale
groep proefpersonen over de categorieën. Proefpersonen met scores op de grens tussen twee
categorieën worden indien nodig aselect, volgens de gewenste verhouding verdeeld over deze
categorieën. In geval van lege cellen worden alle frequenties in de tabel verhoogd met .5. Een
voorbeeld is het eerste item van een Figuur Exclusie test afgenomen aan steekproeven
Kenyaanse en Engelse eind-lagere school leerlingen (zie Van der Flier, 1980):
De tabellen worden geanalyseerd aan de hand van een log-lineair model van de vorm
ln fijk = U -i- Ui(i, -i- U2(j, -i- U3(k, -(- Ui2(ij, -i- U,3(ik, , (1)
«
waarin Fjjk staat vopr de frequentie in de cel corresponderend met scorecategorie i, subgroep j
en item response k (zie Mellenbergh, 1982). Het model bevat achtereenvolgens een constante
(u), de hoofdeffect parameters voor iedere variabele (ui(jj, U2(j) en U3(k)) en de parameters
voor score x groep interactie (u, 2(ij,) en score x response interactie (u i3(ik,). De passing van het
model wordt uitgedrukt in een aannemelijkheidsverhouding (G^-waarde), welke asympto-
Henk van der Flier et al. 63
tisch chi-kwadraat verdeeld is. De waarde geeft aan in welke mate de niet in het model
opgenomen parameters voor groep x response interactie (u23(jk)) en score x groep x response
interactie (u,23(jjk)), die als indicatoren voor item onzuiverheid worden beschouwd, afwijken
van nul. De berekeningen kunnen worden uitgevoerd m.b.v. het programma BIASIT (Adèr,
1982). De iteratieve methode is inmiddels met succes toegepast binnen cross-cultureel
onderzoek (Van der Flier, 1983) en op langs experimentele weg verkregen data (Kok, 1982).
In het eerder genoemde simulatie-onderzoek (Van der Flier, Mellenbergh, Adèr en Wijn,
1984) werden antwoordpatronen gegenereerd voor een test bestaande uit 14 zuivere en 15
onzuivere items. De mate van item onzuiverheid werd gevariëerd. Zowel bij een geringe mate
van onzuiverheid als bij een sterke en zeer sterke mate van onzuiverheid bleek de iteratieve
methode aanzienlijk betere resultaten op te leveren dan de niet-iteratieve log-lineaire metho-
de. Ook in vergelijking met twee bekende onvoorwaardelijke item bias methoden, de delta
methode (Angoff en Ford, 1973) en de ANOVA arcsinus methode (Plake en Hoover, 1979)
bleek de iteratieve log-lineaire methode superieur.
Een beperking van dit onderzoek is wel dat de verdeling van de te meten (latente) trek in de
onderscheiden groepen steeds constant werd gehouden. Geobserveerde verschillen tussen de
groepen waren daardoor behalve aan toeval uitsluitend toe te schrijven aan de invloed van
item onzuiverheid. Het valt echter niet aan te nemen dat dit voor empirische gegevens ook
altijd zal gelden, en het is nog maar de vraag of de iteratieve methode in geval van ongelijke
nivo's wel zo goed werkt. Problemen zouden met name kunnen ontstaan ten gevolge van
verschillen in scorcverdeling t/Vinen de scorecategorieën, en deze problemen zouden mogelijk
nog eens versterkt worden door het iteratieproces. Het lijkt daarom wenselijk het simulatie
onderzoek uit te breiden in die zin dat ook het treknivo van de onderscheiden groepen wordt
gevariëerd. Het hierna te rapporteren onderzoek betreft een dergelijke uitbreiding.
Simulaties
Gebruik wordt gemaakt van dezelfde 29-item test als in het voorgaande onderzoek -15 van de
Items zijn onzuiver. Item responsen worden gegenereerd uitgaande van het drie-parameter
normaal-ogief model (Lord, 1980):
a(0 - b)
P(0) = c-Kl-c) ƒ <p(t)dt (2)
— 00
De item parameters (a, b en c-waarden) zijn zo gekozen dat de test min of meer representatief
's voor een redelijk betrouwbare, uit vijf-keuze items bestaande, powertest. De a-waarden
variëren rond .723, de b-waarden lopen van - 2.954 tot 1.693 en als raadkans (c) wordt
steeds .20 aangehouden (zie ook Van der Flier, 1980, p. 89). Item onzuiverheid wordt
geintroduceerd door in bovenstaande formule de term
ln principe zou men ook kunnen conditioneren op een te voorspellen criteriumscore. Een dergelijke
procedure is, voorzover de auteurs bekend, echter nog niet toegepast. Wel werd in een onderzoek van
^"cpard, Camili en Averill (1981), waarin verschillende intelligentietests op item onzuiverheid werden
onderzocht, één van de tests gebruikt als 'extern' criterium m.b.t. de items in de overige tests.
64 Iteratieve item bias detectie metliode
Tabel 1. Aantallen juiste en onjuiste antwoorden per scorecategorie voor Kenyaanse en
Engelse leerhngen.
Kenyaanse steekproef |
Engelse steekproef | ||||
(N |
= 567) |
(N = 389) | |||
Goed |
Fout |
Goed Fout | |||
0 - |
12 |
92 |
105 |
25 17 | |
Testscore |
12- |
15 |
107 |
51 |
53 28 |
minus |
15 - |
18 |
114 |
30 |
80 15 |
itemscore |
18 - |
25 |
56 |
12 |
158 13 |
a(e - b)
(1 - c) ƒ <p (t) dt
-00
met een voor de te vergelijken groepen verschillende factor te vermenigvuldigen. Voor de
referendegroep heeft de factor steeds de waarde 1.00. In de hiermee te vergelijken groepen
zijn de waarden resp. 1.00, .75, .50, .25 en .00. In het eerste geval is er dus geen sprake van
item onzuiverheid; in het laatste geval geldt voor de 15 onzuivere items dat P(0) gelijk is aan
de raadkans (c).
Subject parameters worden aselect getrokken uitgaande van een standaard-normaal ver-
deelde trek 0. Verschillen in treknivo tussen de groepen worden gecreëerd door bij de
getrokken waarden steeds een constante op te tellen. Voor de referentiegroep heeft de
constante de waarde .00. In de hiermee te vergelijken groepen zijn de waarden resp. — 1.00,
- .50, .00, .50 en 1.00. In het eerste geval ligt de betreffende groep voor wat betreft de te
meten eigenschap één standaarddeviatie fcenede« de referentiegroep, in het laatste geval één
standaarddeviatie boven de referentiegroep. Om verwarring met de onzuiverheidsfactor te
voorkomen worden de nivo's van de constante als volgt met letters aangeduid; // (- 1.00), /
(- .50), g (.00), h (.50) en hh (1.00).
Combinatie van de vijf nivo's van latente trekpositie met de vijf nivo's van item onzuiver-
heid levert in totaal 25 verschillende condities op. Per conditie worden 500 scorepatronen
gegenereerd. In Tabel 2 worden de gemiddelden en standaarddeviaties van de totaalscores op
de 29-item test onder de diverse condities weergegeven. Zoals te zien lopen de gemiddelden
op van II tot hh, en af van onzuiverheidsfactor 1.00 tot .00.
Ook de referentiegroep (overeenkomend met conditie g en onzuiverheidsfactor 1.00) bevat
500 scorepatronen. De gemiddelde testscore in deze groep is 17.76, en de standaarddeviatie
5.57.
RESULTATEN
De gesimuleerde data worden geanalyseerd m.b.v. het iteratieve item bias detectie prog-
ramma BIASIT. De totaalscores worden steeds ingedeeld in 5 scorecategorieën, het
maximale aantal iteraties wordt vastgesteld op 17, en de kritieke G^-waarden (correspon-
derend met een 5% en een 1% significantienivo) zijn 11.070 en 15.086.
Henk van der Flier et al. 65
Tabel 2. Gemiddelden en standaarddeviaties (tussen haakjes) van de scores op de 29-item
test bij verschillende nivo's van de onzuiverheidsfactor en de verdeling op de latente
trek.
Onzuiverheids- Nivo verdeling op de latente trek
factor Hl g ft hh
1.00 |
13.32 |
15.43 |
17.39 |
20.09 |
22.24 |
(4.78) |
(5.14) |
(5.17) |
(5.12) |
(4.70) | |
.75 |
12.33 |
14.19 |
16.18 |
18.24 |
20.13 |
(4.45) |
(4.77) |
(4.80) |
(4.70) |
(4.37) | |
.50 |
11.38 |
12.90 |
14.22 |
16.51 |
18.09 |
(4.05) |
(4.27) |
(4.37) |
(4.25) |
(3.94) | |
.25 |
10.42 |
11.72 |
13.10 |
14.60 |
15.93 |
(3.54) |
(3.73) |
(3.80) |
(3.73) |
(3.49 | |
.00 |
9.43 |
10.48 |
11.62 |
12.85 |
13.91 |
(3.14) |
(3.26) |
(3.25) |
(3.14) |
(2.91) |
De resultaten voor de niet-iteratieve procedure (eerste iteratie) en de iteratieve procedure
(laatste iteratie) worden gepresenteerd in de Tabellen 3,4 en 5. Tabel 3 geeft de percentages
juist geclassificeerde items voor de verschillende condities. Voor de niet-iteratieve procedure
zijn de resultaten over het geheel genomen niet erg bevredigend. De percentages blijken in de
meeste gevallen sterk te dalen van// naarhh. Vooral het identificeren van items die discrimi-
neren tegen een groep met een gelijk of een hoger treknivo levert dus problemen op.
Toepassing van de iteratieve procedure blijkt deze problemen echter in bijna alle gevallen op
te kunnen lossen. Alleen in de situatie waarin sprake is van een geringe mate van bias tegen
een groep met een aanzienlijk hogere latente trek positie {hh .75) werkt het iteratieproces de
Verkeerde kant op en wordt het resultaat nog slechter dan het bij toepassing van de niet-itera-
tieve methode al is. Voor de eerste vijf condities, waarin de onzuiverheidsfactor gelijk is aan
1-00, zijn de succespercentages behoorlijk hoog, vooral wanneer een 1% significantie nivo
Wordt aangehouden. Dit geldt zowel voor de iteratieve methode als voor de niet-iteratieve
methode. Geconcludeerd kan dus worden dat in situaties waarin alle items zuiver zijn, maar
de groepen verschillen qua nivo de kans op 'vals alarm' niet al te groot is.
Een meer gedetailleerd beeld van de uitkomsten van de analyses wordt gegeven in Tabel 4.
Per conditie en type procedure worden bij een 5% en een 1% significantie nivo de aantallen
missers en foute positieven vermeld. Te zien is dat de slechte resultaten van de niet-iteratieve
methode bij groepen met een hoger trek nivo vooral een gevolg zijn van het ten onrechte als
Onzuiver classificeren van zuivere items.
In Tabel 5 tenslotte worden de mediane G^-waarden van de zuivere en onzuivere items
Vermeld. De relatief sterke toename van deze waarden van ll naar hh bij de niet-iteratieve
methode ondersteunt de conclusie op grond van de voorgaande tabel. Toepassing van de
'teratieve procedure blijkt overigens niet alleen te leiden tot afname van de G^-waarden van
de zuivere items, maar evenzeer tot een sterke toename van de waarden voor de onzuivere
items.
66 Iteratieve item bias detectie metliode
Tabel 3. Percentages juiste classificaties. 29-itenis. Niet-iteratieve en iteratieve procedure. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
DISCUSSIE
Uit de tabellen 3, 4 en 5, eerdere simulaties (van der Flier et al., 1983) en experimenteel
onderzoek (Kok, 1982) blijkt de iteratieve procedure redelijk tot goed in staat te zijn
onzuivere items te detecteren. Dat neemt niet weg dat er nog een aantal problemen opgelost
moeten worden. Een belangrijke vraag betreft bijvoorbeeld het onderscheidingsvermogen
van de procedure: de kans onzuivere items te detecteren bij gegeven steekproefgrootte,
significantie- en onzuiverheids-niveau. Dit is met name van belang voor dc opzet van empi-
risch onderzoek naar item onzuiverheid; bij gespecificeerd onderscheidingsvermogen, signifi-
Henk van der Flier et al. 67
Tabel 4. Aantallen gemiste en ten onrechte als onzuiver geclassificeerde items. Niet-itera-
tieve en iteratieve procedure.
Conditie
5%
1%
Niet- Iteratief Niet- Aantal iteraties iteratief Iteratief 5% 1% | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
cantie- cn onzuiverheids-niveau kan men dan bepalen hoe groot de steekproef moet zijn.
In het voorafgaande is het begrip item onzuiverheid op informele wijze gehanteerd. De
volgende formele defmitie wordt voorgesteld: Een item is zuiver in relatie tot de variabelen
Z2.....Zj, als
(3)
P(X=l|e, ó|, Ó2, ..., V z„ Z2, ..., z,) = P(X = 1|0, 6„ 62, ..., óp).
-ocr page 72-68 Iteratieve item bias detectie metliode
Tabel 5. Mediane G^-waarden van zuivere en onzuivere items. Niet-iteratieve en iteratieve
procedure.
Conditie Niet-iteratief onzuiver* zuiver |
Iteratief (5%) |
Iteratief (1%) |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
* Behalve wanneer de onzuiverheidsfactor gelijk is aan 1.00. |
Hierin is X een stochastische variabele, die de waarde 1 aanneemt «Is het item goed is
beantwoord en anders O, 0 is de waarde op de latente trek, ö,, Ó2. ■■■. öp zijn item parameters
en Z|, Z2, ..., Zp zijn waarden op de variabelen. In woorden betekent deze formule dat voor
personen met de/elfde waarde op de trek - of één en dezelfde persoon met herhaalde
metingen - de kans het item goed te beantwoorden «;e/ afhangt van de variabelen Z,, Z2,...,
Zjj. In het simulatie-onderzoek is deze definitie als volgt geschonden: P(0) uit formule (2) is in
termen van (3) P(X= 1|0, a, b, c, z), waarin z de mate van gesimuleerde bias aangeeft, — 1.00,
.75, .50, .25, .00. Bij vergelijking van de referentie groep (bias factor 1.00) met een groep met
Henk van der Flier et al. 59
bias factor kleiner dan 1.00 geldt dus voor een onzuiver item:
P(X=1| e, a, b, c, z) ^ P(X= 1| 0, a, b, c), (4)
d.w.z. de kans het hem goed te beantwoorden is mede afhankehjk van de bias factor.
Item onzuiverheid is met behulp van formule (3) scherp te definiëren: een item is onzuiver
als de kans het item goed te beantwoorden mede afhankelijk is van een z-variabele. De
iteratieve procedure is efficiënt in het detecteren van onzuivere items en bovendien is de
procedure relatief eenvoudig, omdat er geen latente parameters geschat worden. Deze
prettige eigenschappen impliceren echter niet dat empirisch onderzoek naar item onzuiver-
heid eenvoudig is. In de eerste plaats moet men in empirisch onderzoek de z-variabelen
specificeren: sexe, leeftijd, godsdienst, cultureel-raciale achtergrond, etc. Een test die bij-
voorbeeld sexe-zuiver is, is noodzakelijkerwijs nog niet cultuur-, godsdienst-, of leeftijd-
zuiver; voor elke z-variabele van belang moet dit opnieuw onderzocht worden. In de tweede
plaats is de konstatering dat een item onzuiver is - en dus meer dan één of een andere trek
meet - nog geen verklaring. Van der Flier (1983) vond bij de eerder genoemde Figuur
Exclusie test dat Keniaanse eind lagere school leerlingen in vergelijking met Engelse leerlin-
gen relatief veel foute antwoorden gaven op items waarbij de eerste van de serie figuren niet in
het rijtje thuis hoorde. Geconcludeerd werd dat Keniaanse leerlingen waarschijnlijk meer
moeite hebben met het loslaten van een eenmaal (op grond van de eerste figuren uit de serie)
gevormde hypothese. In de meeste gevallen is een verklaring echter moeilijk te geven en is
apart empirisch onderzoek hiernaar geboden. Tenslotte geldt, enigszins paradoxaal gezien de
in het voorafgaande ontwikkelde definities, dat onderzoek naar item onzuiverheid meer
garanties biedt m.b.t. de vergelijkbaarheid van testprestaties naarmate in de test duidelijker
sprake is van een systematische representatie van item typen en oplossingsprincipes. Qua
inhoud homogene tests, waarbinnen de items uitsluitend of voornamelijk variëren in com-
plexiteit, bieden wat dit betreft dus relatief weinig mogelijkheden.
LITERATUUR
Adèr, H.J. (1982) BIASIT: Iterative program to select biased items. Amsterdam: Vrije Universiteit,
Subfaculteit Psychologie.
Angoff, W.H., & Ford, S.F. (1973). Item-race interaction on a test of scholastic aptitude. Journal of
Educational Measurement, 10, 95-106.
Flier, H. van der Vergelijkbaarheid van individuele testprestaties. Lisse: Swets & Zeitlinger.
Flier, H. van der (1983). Some applications of an iterative method to detect biased items. In J.B.
Deregowski, S. Dziurawiec, & R.C. Annis (Eds.), Expiscations in cross-cultural psychology (p.
174-188). Lisse, The Netherlands: Swets & Zeitlinger.
Flier, H. van der, Mellenbergh, G.J., Adèr, H.J., & Wijn, M. (1984). An iterative item bias detection
method. Journal of Educational Measurement, (ter perse).
Kok, F.G. (1982). Het partijdige item; een vergelijkend onderzoek naar het funktioneren van verschillende
item bias detectie procedures en een evaluatie van het effect van inadequate vaardigheidsschatters
in dit verband. Amsterdam: Psychologisch Laboratorium, Universiteit van Amsterdam.
Lord, F.M. (1977). A study of item bias, using item characteristic curve theory. In Y.H. Poortinga (Ed.),
Basic problems in cross-cultural psychology (p. 19-29). Amsterdam: Swets and Zeitlinger.
Lord, F.M. (1980). Applications of item response theory to practical testing problems. Hillsdale, N.J.:
Erlbaum.
Mellenbergh, G.J. (1982). Contingency table models for assessing item bias. Journal of Educational
Slatistics, 7, 105-118.
70 Iteratieve item bias detectie metliode
N.I.P. (1916), Beroepsethiek voor psychologen, Amsterdam: N.I.P.
Plake, B. S., & Hoover, H. D. (1979). An analytic method of identifying biased test items. The Journal of
Experimental Education, 48, 153-154.
Scheuneman, J. (1979). A method of assessing bias in test items.your/ia/ of Educational Measurement, 16,
143-152.
Shepard, L., Camilli, G., & Averill, M. (1981). Comparison of six procedures for detecting test item bias
using both internal and external ability criteria, tourna/ of Educational Statistics, 6, 317-375.
Manuscript ontvangen 27-5-1983
Definitieve versie 29-9-1983
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp. 71-83.
De Functie van Deel-Geheel Schema's
in het Rekenonderwijs: Een terugblik
Miriam A. D. Welters
Ontwikkelingspsychologie SPA W, Rijksuniversiteit Utrecht
abstract
The role of a part-whole line-diagram in arithmetic.
A review of research.
This article consists of a review of work done by Dutch and Belgian researchers on arithmetical
problems, especially word-problems, involving addition and subtraction. The purpose of this
review is to synthesize the research on the relationship between instruction in the part-whole
line-diagram and the solution of arithmetical problems. In the discussion-part of this paper these
findings are interpreted from a logical (mathematical) as well as a psychological point of view.
In een lezing over de ontwikkeling van het getalbegrip komt Resnick (1981) tot de volgende
conclusie:
"Aangetoond is dat het deel-geheel schema de basis vormt voor het oplossen van redactiesommen,
puntsommen en optellen cn aftrekken bij overschrijding van een tiental (...). Het lijkt zeer waarschijn-
lijk dat dc ontwikkeling van het wiskundig denken bij kinderen bevorderd kan worden door expliciet
onderwijs te geven in het schema cn het gebruik ervan".
De afgelopen jaren is er in Nederland en België onderzoek gedaan naar de invloed van het
gebruik van deel-geheel schema's op het maken van rekenopgaven door leerlingen. Het
onderzoek had betrekking op puntsommen (bijv. De Corte & Verschaffel, 1980) en redac-
tiesommen (bijv. Assink & Verloop, 1977: Wolters, 1978; Van den Berge & Bleek, 1982).
Dit onderzoek is op gang gekomen dank zij het werk van de Sovjet-psychologe Mikulina
(1969). Het kernidee van haar werk is dat het mogelijk moet zijn de prestaties op redactie-
sommen te verbeteren door leerlingen bij het oplossen van deze sommen een deel-geheel
schema te leren gebruiken.
Een deel-geheel schema is een visuele representatie van een deel-geheel relatie in de vorm
van een lijn-diagram. Een voorbeeld van zo'n representatie is gegeven in fig. 1. In fig. 1 wordt
het geheel voorgesteld als c, opgebouwd uit de delen a cn b.
In dit artikel willen we het onderzoek bespreken dat in Nederland en België gedaan is naar
de invloed van training in het gebruik van een deel-geheel schema op het oplossen van
rekenopgaven, in het bijzonder redactieopgaven. We zullen allereerst een classificatie in
typen redactieopgaven bespreken. Daarna vergelijken we de resultaten van de verschillende
Adres auteur: Heidelberglaan 1, 3584 CS Utrecht.
-ocr page 76-72 Deel-Geheel schema's in het rekenonderwijs
Fig. 1. Voorbeeld van een deel-geheel schema.
onderzoeken die gedaan zijn met een trainingsprogramma op het oplossen van redactieopga-
ven in het algemeen. Vervolgens willen we, voor zover dat mogelijk is, dezelfde resultaten per
type redactieopgave vergelijken. Het artikel wordt afgesloten met een discussie waarin naar
mogelijke verklaringen op theoretische en empirische gronden gezocht wordt voor de ver-
schillende resultaten.
CLASSIFICATIE VAN REDACTIE-OPGAVEN
Redactiesommen waarin optel- en/of aftrekoperaties moeten worden uitgevoerd kunnen als
volgt geklassificeerd worden: erbij-eraf opgaven, deel-geheel opgaven en vergelijkingsopga-
ven (Wolters, 1978). Ook buiten Nederiand en België wordt eenzelfde classificatie gehan-
teerd. Men spreekt dan over respectievelijk: joining - separating, part-whole en comparison
problems (bijv. Carpenter, Herbert & Moser, 1981; Heller & Greeno, 1978; Nesher &
Greeno, 1981; Riley, Greeno, & Heller, 1981; Vergnaud, 1981).
"Erbij-eraf opgaven zijn opgaven waarbij een oorspronkelijke hoeveelheid verandert
door een uitgevoerde operatie. Een voorbeeld is: "Leroy heeft a snoepjes. Hij geeft erb aan
Jenny. Hoeveel snoepjes heeft hij nog over?" (a - b).
"Deel-geheel" opgaven waarbij het om ecn statische relatie (toestand) gaat waarin twee
gescheiden hoeveelheden delen van een geheel vormen. Een voorbeeld is: "Er schaatsen a
jongens en b meisjes. Hoeveel kinderen schaatsen er in totaal?" (a -f- b).
"Vergelijkingsopgaven" hebben betrekking op het vergelijken van twee hoeveelheden.
Daaronder vallen eenvoudige opgaven waarin het verschil tussen twee hoeveelheden gevon-
den moet worden en de meer complexe opgaven waarbij één van de hoeveelheden en het
verschil tussen de twee hoeveelheden is gegeven en de andere hoeveelheid gevonden moet
worden.
Een voorbeeld is: Ralf heeft a stukjes gum. Sjef heeft er b meer. Hoeveel stukjes gum heeft
Sjef?" (a + b).
Bij het voorleggen van deze opgaven blijkt dat de erbij-eraf opgaven hetjeenvoudigst zijn, dan
volgen de deel-geheel opgaven en tenslotte de vergelijkingsopgaven (bijv. Carpenter et al.,
1981; Nesher & Greeno, 1981).
Een dergelijke klassificatie komt tot stand op grond van de semantische structuur van de
opgaven. De typen opgaven volgens deze klassificatie noemen we dan ook semantische
structuurtypen (zie ook De Corte & Verschaffel, 1982).
Het is echter ook mogelijk redactie-opgaven te klassificeren volgens de mathematische
structuur van de opgave. In de boven gegeven voorbeelden is te zien dat een klassificatie
volgens semantische structuur niet overeen hoeft te komen met een klassificatie volgens
Miriam A. D. Wolters 73
niathematische structuur. Zo heeft het boven gegeven voorbeeld van een deel-geheel opgave
dezelfde mathematische structuur als het voorbeeld van de vergelijkingsopgave (a+b). Het is
zelfs betrekkehjk eenvoudig een erbij-eraf opgave te formuleren met dezelfde mathematische
structuur: "Leroy heeft a snoepjes. Hij krijgt eri van Jenny. Hoeveel snoepjes heeft hij nu?"
(a + b).
ONDERZOEK NAAR DE INVLOED VAN TRAINING IN HET GEBRUIK VAN
EEN DEEL-GEHEEL SCHEMA OP HET OPLOSSEN VAN REKENOPGAVEN
Beschrijving van het trainingsprogramma
We beginnen met de beschrijving van het trainingsprogramma dat gebruikt is door tweede-
klassers. Voor een gedetailleerde beschrijving van het trainingsprogramma voor tweede-
klassers verwijzen we naar Assink en Verloop (1977) en Van den Berge en Bleek (1982).
Hier geven we de grote hjn van het trainingsprogramma weer ter bevordering van de
begrijpelijkheid van ons betoog.
Het trainingsprogramma voor tweedeklassers bestond uit twee delen:
(a) Het vergelijken van objecten op grootheden (± 6 lessen);
(b) Representatievormen van de deel-geheel relatie (± 9 lessen).
De lessen uit deel (a) werden besteed aan het leren gebruiken van notaties voor de relaties
"gelijk aan" (=), "ongelijk aan (+), "groter dan" (>) en "kleiner dan" (<). Met deze
symbolen kan het resultaat van een vergelijking van twee objecten op verschillende groot-
heden worden weergegeven.
Deel (b) van het programma was gewijd aan het deel-geheel schema. Begonnen werd met
een introductie van de begrippen "deel" en "geheel" aan de hand van concreet materiaal
waarbij de relativiteit van deze twee begrippen (gehelen in de situatie kunnen delen zijn in een
andere situatie) werd benadrukt.
Vervolgens werd een schematiseringsproces opgeroepen, d.w.z. deel-geheel relaties wer-
den eerst weergegeven met natuurgetrouwe afbeeldingen van de betreffende objecten en
Vervolgens werd naar een meer schematische afbeelding toegewerkt. De relatie "het geheel is
gelijk aan de som van de delen" werd daarbij aanvankelijk voorgesteld zoals in fig. 2 wordt
aangegeven.
Fig. 2. Visuele representatie van een deel-geheel relatie.
Na deze weergave, waarin de delen en het geheel nog gescheiden gerepresenteerd werden.
Volgde een weergave waarbij delen en het geheel op één lijn werden gerepresenteerd, een
zogenoemd lijndiagram (zie fig. 3).
De leerlingen werden in de laatste fase van deel b van het programma aangemoedigd alle
mogelijke formules te bedenken bij zo'n lijndiagram. Aanvankelijk werden de leerlingen
74 Deel-Geheel schema's in het rekenonderwijs
b c
Fig. 3. Lijndiagram als weergave van een deel-geheel relatie.
Vul in: "DEEL" of "GEHEEL"
... c is even groot als ... a
zonder ... b en zonder ... d.
Fig. 4. Koppehng van een lijn-diagram aan een formule (Assink & Verloop, 1977).
daarbij nog gedeehelijk gestuurd door middel van invuloefeningen (zie fig. 4).
Een deel-geheel relatie kan op drie verschillende manieren in een formule weergegeven
worden: de som van de delen is gelijk aan het geheel (b-i-c=a), of een van de delen kan
uitgedrukt worden in het geheel en het andere deel (a-c=b, a-b=c). In de genoemde
formules staan de operaties aan de linkerkant van het is-gelijk-tcken. Maken we gebruik van
de symmetrische eigenschap van de is-gelijk-relatie, dan komen we tot nog drie formules nl.
a=b-t-c, b=a—c en c=a—b. Hoewel er wiskundig gezien geen verschil bestaat tussen de eerste
drie formules en de laatste drie, zijn ze voor kinderen aan wie de eigenschappen van een
is-gelijk relatie niet expliciet zijn onderwezen wel degelijk verschillend. Door bovendien
gebruik te maken van de commutatieve eigenschap van de optelling komen er nog twee extra
formules bij,'te weten c-t-b=a en a=c-l-b.
In totaal kunnen we dus acht verschillende formules onderscheiden bij een lijndiagram
zoals weergegeven in Fig. 3.
Het trainingsprogramma voor de derde- en vierdeklassers was aanzienlijk langer dan dat
voor de tweedeklassers. Na de al beschreven twee delen van het programma volgde nog een
deel (c) dat ±11 lessen in beslag nam en vrijwel geheel besteed werd aan het vertalen van
redactieopgaven in lijndiagrammen en/of formules en omgekeerd. In de eerste fase van deel
(c) worden de leerlingen gevraagd een lijndiagram te maken bij een verhaaltje, bijv.: "Er zijn
a zeilboten en b roeiboten in de haven. In totaal zijn er c boten in de haven". Mogelijke
diagrammen voor die situatie zijn te vinden in fig. 5.
Als de leerlingen de verschillende door hen gemaakte diagrammen (zic voorbeelden)
vergelijken, komen ze al redenerend tot de conclusie dat ze alle drie goedzijn, omdat a en b de
delen zijn en de grootte van die delen er niet toe doet.
In de tweede fasp van deel (c) krijgen de leerlingen een diagram of een formule waarbij zij
een verhaal moeten bedenken. De verhalen en de diagrammen worden ingewikkelder door in
de laatste fase meer dan twee delen te gaan gebruiken en een onbekende te introduceren. Het
gevolg hiervan is dat er vergelijkingen met twee operaties ontstaan. Voor een gedetailleerde
beschrijving van het trainingsprogramma voor derde- en vierdeklassers, zie Wolters 1978.
Miriam A. D. Wolters 75
ab ab
Fig. 5.
RESULTATEN
Resultaten van tweedeklassers bij het oplossen van redactieopgaven
Assink en Verloop (1977) en Van den Berge en Bleek (1982) gingen het effect van het
trainingsprogramma op het oplossen van redactieopgaven na bij tweedeklassers. Het onder-
zoek van Van den Berge en Bleek is een replicatie van het onderzoek van Assink en Verloop.
In tabel 1 geven we de gemiddelden op een voor- cn natoets met redactie-opgaven uit het
onderzoek van Assink en Verloop en de gemiddelden op voor- en natoets van Van den Berge
en Bleek.
In tabel 1 zien we dat de resultaten uit het onderzoek van Assink en Verloop meer in de
Verwachte richting liggen dan de resultaten van Van den Berge en Bleek. Toch is dit
onderzoek een replicatie van het onderzoek van Assink en Verloop en hadden we minstens
mogen verwachten dat de experimentele groep van Van den Berge meer vooruitgang zou
boeken dan de controlegroep. Het tegendeel is echter het geval, de controlegroep boekt meer
Vooruitgang dan de experimentele groep al is deze vooruitgang nog niet significant te noemen.
Datzelfde geldt echter voor de experimentele groep uit het onderzoek van Assink en Verloop.
Ook daar is de weliswaar flinke vooruitgang van de experimentele groep nog net niet
significant.
Hierbij moeten we opmerken dat in het onderzoek van Assink en Verloop werd gewerkt
met twee experimentele condities: een letterconditie en een cijferconditie. De experimentele
Icttcrconditie kreeg het trainingsprogramma zoals dat beschreven is. De experimentele
cijferconditie kreeg het programma maar dan zonder letters, d.w.z. overal waar in het
programma met letters gewerkt werd, bijv. om delen dan wel gehelen aan te geven, werden
cijfers gebruikt. De experimentele groep die opgevoerd is in tabel 1 is de experimentele
letterconditie, dit om een vergelijking met de resultaten van derde- en vierdeklassers mogelijk
te maken. In het onderzoek van Van den Berge en Bleek werd gewerkt met vier condities, te
weten een experimentele letterconditie, ccn experimentele cijferconditie, een controle let-
terconditie en een controle cijferconditie. Het opsplitsen van dc experimentele c.q. con-
trolegroep in twee condities was gedaan om ook het effect van het gebruik van letters c.q.
getallen na te kunnen gaan. Aangezien het ons hier alleen gaat om het effect van het gebruik
van een deel-geheel schema op het oplossen van redactiesommen hebben we één experimen-
tele cn één controle-conditie opgevoerd. Om de resultaten te kunnen vergelijken met het
onderzoek van Wolters (1978) met derde- en vicrde-klassers is cr gekozen voor de experi-
mentele letterconditie en de controle-cijferconditie.
Voor wc ingaan op de merkwaardige verschillen in deze onderzoeksresultaten bespreken we
eerst de resultaten van de derde- cn vierdeklassers op het oplossen van redactieopgaven.
76 Deel-Geheel schema's in het rekenonderwijs
Tabel 1. Gemiddelden op een voor- en natoets met redactiesommen. | ||||||||||||||||||||||||||||||
|
Resultaten van derde- en vierdeklassers bij het oplossen van rekenopgaven
Resultaten bij redactieopgaven
De redactieopgaven die gebruikt werden voor de voor- en natoets en tijdens de training waren
opgaven met twee bewerkingen. Deze bewerkingen waren optel- en/of aftrekoperaties. Een
voorbeeld van zo'n opgave is: "Drie getallen zijn samen 381. Het derde getal is 138. Het
eerste getal is 92. Wat is het tweede getal?". (Deel-geheel opgave volgens de semantische
structuur).
In tabel 2 geven we de gemiddelden op een voor- en natoets met redactie-opgaven van de
derde- en vierdeklassers.
De data van de derde- en vierdeklassers zijn statistisch geanalyseerd met een covariantie-
analyse waarbij de voortoets als covariant gebruikt werd. Door middel van deze techniek
krijgen we informatie over het verschil in vooruitgang tussen experimentele en controlegroep.
Dit verschil blijkt voor de derdeklassers significant te zijn (p=0.001) en voor de vierdeklas-
sers niet (p=0.156). Dit betekent dat de derdeklassers meer vooruitgang laten zien vergele-
ken met de controlegroep. Bij de vierdeklassers is dit'niet het geval.
Resultaten bij puntsommen
Na het programma werd de leerlingen van de experimentele groep (n=264) en de controle-
groep (n=244) een aantal toetsen voorgelegd. Een van die toetsen was een transfertoets
waarin drie puntsommen waren opgenomen. De resultaten daarvan zijn weergegeven in tabel
3.
Uit tabel 3 kunnen we opmaken dat het trainingsprogramma een positief (significant) effect
heeft op het oplossen van puntsommen bij derde- en vierdeklassers.'
1. De Corte en Verschaffel (1980) gingen het effect van een trainingsprogramma in een deel-geheel-
schema na, op het oplossen van puntsommen bij eersteklassers. Uit de resultaten die zij vonden blijkt
dat een dergelijk trainingsprogramma een positieve invloed heeft op het oplossen van puntsommen.
77
Miriam A. D. Wolters
Tabel 2. Gemiddelden op een voor- en natoets met redactieopgaven (Wolters, 1978).
3e klas
Natoets
max.sc.= 10
Voortoets
max.sc. = 10
p-waarde
Exp. groep
(n=146)
2.78
5.16
Contr. groep
p=0.001
1.77
3.12
(n=128)
4e klas
Exp. groep
(n = 118)
6.04
3.89
Contr. groep
(n=116)
p=0.156
4.36
5.95
Tabel 3. Percentage goede antwoorden op drie puntsommen voor de experimentele en de controlegroep | ||||||||||||||||||||
|
Resultaten op itetns, waarbij gebruik gemaakt moet worden van de transitiviteit van een
deel-geheel relatie
Een sterke aanwijzing dat inzicht is verkregen in de deel-geheel relatie vinden we wanneer
leerlingen problemen aankunnen, waarin sprake is van transitiviteit van relaties. Leerlingen
moeten het schema dan noodzakelijkerwijs herhaald gebruiken.
In fig. 6 staan de twee voorgelegde items waarin transitiviteit een rol speelt. De resultaten
zijn gegeven in tabel 4.
Tabel 4 wijst uit dat meer dan de helft van de ppn. uit de experimentele groep de
transitiviteitsitems goed oplost. Van de proefpersonen uit de controlegroep lost iets meer dan
een kwart de opgaven goed op. We kunnen veronderstellen dat de instructie in feite naar het
goede antwoord leidt (alleen de letters O en S konden maar gebruikt worden en hun volgorde
in het alphabet gaf ook de ordening in grootte weer). Dit argument geldt echter ook voor de
controlegroep.
Tabel 4. Percentage goede antwoorden op de transitiviteitsitems voor de experimentele en controle-
groep (Wolters, 1978).
'ransitiviteits-
Problemen
p-waarde
contr. groep
(n = 244)
exp. groep
(n = 264)
(1)
(2)
62
57
29
28
0.000
0.000
78 Deel-Geheel schema's in het rekenonderwijs
O is een deel van P.
P is een deel van S.
(i) Dus:... is een deel van ... Ge mag niet zeggen wat cr al staat!).
Maak dit sommetje.
Kijk naar de tekening.
V is een deel van U.
W js een deel van V.
(2) Dus:... (je mag niet zeggen wat er al staat!).
Fig. 6. De twee voorgelegde items waarin sprake is van transitiviteit.
-ocr page 83-Miriam A. D. Wolters 79
DISCUSSIE
Nadere analyse van de onderzoeksresultaten
De resultaten van besproken onderzoeken laten zien dat een trainingsprogramma gericht op
het gebruik van een deel-geheel schema een positief effect heeft op het oplossen van punt-
sommen.
Derde- en vierdeklassers bleken na het trainingsprogramma in staat de transitiviteit van de
deel-geheel relatie te kunnen gebruiken. Ook bleken de derdeklassers als gevolg van het
trainingsprogramma significante vooruitgang te boeken op het oplossen van redactieopgaven,
•n tegenstelling tot de tweedeklassers waar dit niet het geval was. De meest voor de hand
liggende verklaring voor het verschil tussen klas twee en klas drie is dat de laatste expliciet
getraind zijn in het oplossen van redactieopgaven met behulp van het deel-geheel schema
(lijndiagram) - deel (c) van het trainingsprogramma. De tweedeklassers hebben uitsluitend
deel (a) en (b) van het trainingsprogramma gehad.
Deze verklaring geeft echter geen duidelijkheid over het merkwaardige verschil in resulta-
ten bij de tweedeklassers, te weten het verschil in onderzoeksresultaten van Assink en
Verloop (1977) en Van den Berge en Bleek (1982). We zullen daarom deze onderzoeksre-
sultaten wat nader bestuderen.
Semantische en mathematische structuurtypen van redactieopgaven
In het onderzoek van Assink en Verioop (1977) en Van den Berge en Bleek (1982) zijn de
sommen in voor- en natoets geconstrueerd en gevarieerd op basis van hun mathematische
structuur. De natoets was een parallelvcrsie van de voortoets met als criterium de mathema-
tische structuur van de som. Dit betekent dat het mogelijk kan zijn dat een som uit de
voortoets weliswaar qua mathematische structuur gelijk kan zijn aan een som uit de natoets
maar dat ze qua semantische structuur kunnen verschillen. Dit is precies wat er gebeurd is in
het onderzoek van Van den Berge en Bleek. Som 2 uit de voortoets luidde: "76 mensen waren
in het zwembad aan het zwemmen. 26 Zwemmers waren volwassenen. Er waren.....kinderen
aan het zwemmen", (a - b, deel-geheel opgave). Som 2 uit de natoets luidde: "Tom heeft 30
stickers. Hij geeft er 17 aan Nettie. Nu heeft hij er nog.....over", (a - b, erbij-eraf opgave).
De reden dat in de onderzoeken niet gevarieerd werd volgens semantische structuurtypcn is
simpelweg dat pas sinds 1978 een dergelijke indeling ontdekt en gehanteerd wordt in binnen-
en buitenland. We zullen nu gaan bekijken wat dc invloed is van een trainingsprogramma in
het gebruik van een deel-geheel schema op redactieopgaven met een verschillend semantisch
structuurtype.
De invloed van hel trainingsprogramma op het oplossen van redactie-opgaven met een
Verschillend semantisch structuurtype
Wc beginnen met de resultaten van de derde- en vierdeklassers die tijdens het programma
expliciet getraind werden op het oplossen van redactie-opgaven met behulp van een deel-
geheel schema (Wolters, 1978). Dc redactiesommen die gebruikt werden in het trainings-
programma, dc voortoets en dc natoets waren sommen met twee operaties. Die operatics
waren optel- en aftrckopcratics.
We hebben de gegevens uit het onderzoek geanalyseerd naar semantisch structuurtype. De
resultaten van deze analyse gaven ecn beeld tc zien dat voor ons in eerste instantie onverwacht
en raadselachtig was. In tabel 5 worden die resultaten weergegeven.
Naar aanleiding van de gegevens uit tabel 5 lezen wc dat de experimentele 3e klas een
behoorlijke vooruitgang boekt gelet op het succesvol oplossen van de deel-geheel opgaven.
80 Deel-Geheel schema's in het rekenonderwijs
Tabel 5. Percentage goede oplossingen van derde- en vierdeklassers op een voor- en natoets en de | ||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
De vooruitgang van deze groep op de erbij-eraf en de vergelijkingsopgaven is aanzienlijk
minder. Precies het tegenovergestelde beeld zien we optreden bij de controlegroep. Bij deze
derdeklassers constateren we een aanzienlijke vooruitgang op de erbij-eraf en de vergelij-
kingsopgaven, maar minder op de deel-geheel opgaven. Hetzelfde, maar in iets sterkere mate,
zien we gebeuren bij de vierdeklassers. Er is zelfs sprake van een achteruitgang bij de
experimentele groep om de erbij-eraf opgaven.
Uit deze resultaten zouden we kunnen afleiden dat er een verband bestaat tussen type
(semantische structuur) opgave en trainingsprogramma-effect. Het trainingsprogramma lijkt
een gunstig effect te hebben op het oplossen van deel-geheel opgaven en een ongunstig effect
op het oplossen van erbij-eraf en vergelijkingsopgaven. We zullen op dezelfde manier de
resultaten analyseren uit het onderzoek van Assink en Verloop (1977).
We hebben de analyse beperkt tot die opgaven waarbij gebruik gemaakt kan worden van
één rekenkundige bewerking. Bij opgaven waarvoor meer bewerkingen vereist zijn worden
de formuleringen vaak zo lang en ingewikkeld dat ook de taalfactor mee gaat spelen. Er
blijven dan twee typen opgaven over, deel-geheel opgaven en vergelijkingsopgaven. De
resultaten zijn weergegeven in tabel 6.
Ondanks het feit dat er niet getraind is op het oplossen van redactieopgaven (de tweede-
klassers kregen alleen deel (a) en (b) van het trainingsprogramma) zien we in tabel 6 dat het
trainingsprogramma ook hier weer een gunstig effect heeft op het oplossen van deel-geheel
Tabel 6. Percentage goede oplossingen op een voortoets en natoets met redactiesommen voor res- | ||||||||||||||||||||
|
Miriam A. D. Wolters 81
opgaven en geen effect op het oplossen van vergelijkingsopgaven. Het ongunstige effect,
waarschijnlijk als gevolg van extra training, blijft hier achterwege.
Het opnieuw analyseren van de resultaten van het onderzoek van Van den Berge en Bleek
(1982) stelde ons voor de nodige problemen. Om een analyse op basis van een indehng in type
opgaven te kunnen uitvoeren hebben we de resultaten per opgave uit de voor- en natoets
nodig. Dit was alleen het geval voor de natoets van de experimentele groep. Van een
heranalyse zoals met de gegevens uit het onderzoek van Assink en Verloop kon dus geen
sprake zijn. Wel was het mogelijk na te gaan of de verschillende typen opgaven vertegen-
woordigd waren en welk deel ze uitmaakten van de totale toets. Het bleek dat in de voortoets
twee van de 28 opgaven van het deel-geheel type waren, maar in de natoets kwam er geen
enkele deel-geheel opgave meer voor. En daarmee hebben we eigenlijk ook de verklaring
voor de merkwaardige verschillen in onderzoeksresultaten van Assink en Verloop (1977) en
Van den Berge en Bleek (1982). (Vergelijk tabel 1).
Het hjkt aannemelijk op grond van het voorgaande te veronderstellen dat het trainings-
programma een positief effect heeft op het oplossen van deel-geheel opgaven. Als er in de
natoets dan geen deel-geheel opgaven opgenomen zijn, zoals het geval is in het onderzoek van
Van den Berge en Bleek, dan zou ook het effect van het trainingsprogramma niet waarneem-
baar zijn. En dat is inderdaad het geval. De vooruitgang die geboekt wordt door de experi-
mentele groep van Van den Berge en Bleek is verwaarloosbaar. In het onderzoek van Assink
en Verloop bestond de helft van de opgaven uit de natoets uit deel-geheel opgaven en het
effect van het trainingsprogramma is dan ook waarneembaar (zie tabel 1).
Ook een trainingsprogramma waarin niet expliciet getraind is op het oplossen van redac-
tieopgaven met behulp van deel-geheel schema's kan interfereren bij het oplossen van
erbij-eraf en vergelijkingsopgaven. Dit is af te leiden uit de resultaten van een extra controle-
conditie uit het onderzoek van Van den Berge en Bleek. In deze extra controle-conditie werd
Wel getraind op het gebruik van letters bij het oplossen van redactieopgaven en niet in een
deel-geheel schema. Het voortoetsgemiddelde van deze groep is: 16.33, het natoetsgemid-
delde is: 20.27. Een vooruitgang die significant is. Een verklaring zou kunnen zijn dat in deze
extra controle-conditie niet de interfererende effecten van een training in een deel-geheel
schema optreden en wel de positieve effecten van het gebruik van letters bij het oplossen van
redactie-opgaven.^
Interpretatie
We hebben aan de hand van empirische gegevens geconstateerd dat het trainingsprogramma
een negatief effect heeft op het oplossen van vergehjkingsopgaven en erbij-eraf opgaven.
Blijkbaar interfereert het deel-geheel schema in het oplossingsproces bij deze opgaven zoals
te constateren valt in tabel 5. Waarom treedt een dergehjke interferentie op? In het trainings-
programma wordt een groter dan (>) en een kleiner dan (<) relatie ingevoerd via de regel
"een deel is altijd kleiner dan een geheel en een geheel is altijd groter dan een deel". In een
vergelijkingsopgave gaat het echter niet altijd om deze groter dan, kleiner dan relatie, maar
Vaak om een relatie tussen de delen onderling. Dat betekent dat de zwakke resultaten op de
Vergelijkingsopgaven in feite veroorzaakt worden door het trainingsprogramma. In het
trainingsprogramma hebben wc expliciet gewezen op het feit dat niet de grootte van een deel
er toe doet maar wel het feit dat de som van de delen gehjk is aan het geheel.
Dit alles geeft nog geen verklaring voor het negatieve effect van het trainingsprogramma op
2. Jammer genoeg is in dc M.O.-B. scriptie (1979) van Van den Berge-Scheygrond en Bleek-Way niet te
vinden wat er plaats vond in deze controle-letterconditie.
82 Deel-Geheel schema's in het rekenonderwijs
de erbij-eraf opgave. Een analyse van de context van een erbij-eraf opgave en het verschil met
de context van een deel-geheel opgave kan misschien bijdragen tot een verklaring. Herscovics
en Bergeron (1982) onderscheiden twee soorten situaties waarin optel- en/of aftrek-opera-
ties voorkomen.
De eerste soort situatie kan sequentieel genoemd worden; d.w.z. dat een uitgangssituatie
verandert doordat een handeling plaatsvindt. Een kind heeft bijv. een aantal knikkers, gaat
spelen, wint of verliest een aantal knikkers en heeft tenslotte een aantal knikkers dat
verschillend is van het oorspronkelijke aantal. In de beschrijving van deze situatie kunnen de
termen (de aantallen) niet verwisseld worden. De tweede soort shuatie noemen we niet
sequentieel. Een voorbeeld is de situatie dat twee kinderen besluiten hun knikkers bij elkaar
te doen voordat ze tegen een ander gaan spelen. In dit geval zijn de termen wel verwisselbaar.
Of kind A of kind B het eerst genoemd wordt in de situatie doet er niet toe. Hoewel het gevolg
van beide situaties numeriek gezien hetzelfde kan zijn, zijn de processen die hiertoe leiden wel
degelijk verschillend. Dit kan het beste toegelicht worden in termen van de respectievelijke
inverse operaties. Om een situatie te herstellen waarin drie knikkers gewonnen zijn, moeten
er drie verloren worden en aftrekken is hier dan de inverse van optellen. Het herstel van het
bij elkaar doen van knikkers is het geheel weer opdelen in de oorspronkelijke aantallen. Het
verdelen is hier dan de inverse van compositie. De mentale handelingen die het kind moet
uitvoeren in de twee situaties zijn compleet verschillend.
De sequentiële situatie beschrijft het beste de erbij-eraf opgaven. De niet sequentiële
situatie beschrijft het beste de deel-geheel opgaven. Het zal duidelijk zijn dat het trainings-
programma de kinderen een instrument gaf (een deel-geheel schema) waarmee hun denken in
een bepaalde richting gestuurd werd en wei in de richting van het oplossen van één type
opgave, de deel-geheel opgave. En dit instrument was geen hulpmiddel voor de niet-sequen-
tiële situaties, voor het oplossen van de erbij-eraf opgaven. In deze situaties zal het deel-
geheel schema juist interfereren. En daarmee kunnen we ook het negatieve effect van het
trainingsprogramma op de erbij-eraf opgaven verklaren.
Tot slot
Het aanleren van een deel-geheel schema kan een hele nuttige functie hebben in het reken-
onderwijs. Het schema heeft, in de hier gerapporteerde onderzoeken, zijn diensten bewezen
voor puntsommen en deel-geheel opgaven. We moeten ons wel bewust zijn van de schadelijke
bijwerkingen op andere onderdelen van het rekenonderwijs (erbij-eraf opgaven en vergelij-
kingsopgaven als typen redactieopgaven). In het licht van het verrichte onderzoek in Neder-
land en België lijkt de conclusie van Resnick zoals deze in de inleiding geciteerd is wat
voorbarig.
Het blijkt een analyse van de psychologische processen te zijn, die ons op het spoor heeft
gebracht van een verklaring voor de negatieve resultaten op de erbij-eraf en de vergelijkings-
opgaven. Dit betekent dat analyses vanuit de wiskunde als systeem, d.w.z. analyses van de
mathematische structuur van een opgave, te beperkt zijn daar waar het gaat om denkproces-
sen van kinderen bij het wiskunde bedrijven (zie bijv. Treffers, 1978;.Van den Brink, 1981).
LITERATUUR
Assink, E. M. H., & Verloop, N. (1977). Het aanleren van deel-geheel relaties in het aanvankelijk
rekenonderwijs. Pedagogische Studiën, 54, 130-142.
Miriam A. D. Wolters 83
Brink, J. van den (1981). Kinderlijke denkbeelden over substitueren. De wereld van het jonge kind, nov.
68-72.
Carpenter, I. P., Herbert, J., & Moser J. M. (1981). Problem structure and firstgrade children's initial
solution processes for simple addition and subtraction problems. Journal for Research in
Mathematics Education, 12, 27-39
De Corte, E., & Verschaffel, L. (1980). Een exploratief onderwijsexperiment met aanvankelijke reken-
opgaven bij 6 ä 8-jarige kinderen. Pedagogische Studiën, 57, 433-438.
De Corte, E., & Verschaffel, L. (1982). Eersteklassers en het spel der schoolvraagstukken. Willem
Bartjens, 4, 167-171.
Herscovics, N., & Bergeron, J. C. (1982). Pourquoi et comment decrire Ie comprehension de la ma-
thématique. Bulletin de l'AMQ (Association Mathématique du Quebec), 22 (1).
Heller, J. I., & Greeno, J. G. (1978, May). Semantic processing in arithmetic word-problem-solving. Paper
presented at the Midwestern Psychological Association Convention. Chicago, IL.
Mikulina, G. G. (1982). Psychologische mogelijkheden voor het oplossen van opgaven met lettergege-
vens. Davydov, V. V., Psychologische capaciteiten van de leerlingen van de lagere school bij het
leren van wiskunde. 1969. In M. A. D. Wolters (ed.), Vertalingenbundel Russische Psychologie,
Utrecht: SPAW.
Nesher, P., & Greeno, J. G. (1981). Semantic categories of word-problems reconsidered. The 5th
Conference of the I.G.P.M.E. (International Group for the Psychology of Mathematical Educa-
tion). Grenoble, 63-68.
Resnick, L. B. (1981). The development of number representation in children. The 5th conference of the
I.G.P.M.E. Grenoble, 69-75.
Riley, M. S., Greeno, J. G., & Heller, J. I. (1982). Development of children's problem-solving ability in
arithmetic. In H. P. Ginsburg (ed.). Development of mathematical thinking. New York; Aca-
demic Press.
Treffers, A. (1978). Wiskobas doelgericht. Dissertatie I.O.W.O., Utrecht.
Van den Berge-Scheijgrond, J. N., & Bleek-Way, M. W. (1979). Het oplossen van redactie-opgaven
opnieuw onderzocht. Scriptie MO-B Pedagogiek, Tilburg.
Van den Berge-Scheijgrond, J. N., & Bleek-Way, M. W. (1982). Het oplossen van redactie-opgaven.
Pedagogische Studiën, 59, 71-80.
Vcrgnaud, G. (1981). A classification of cognitive tasks and operations of thought involved in addition
and subtraction problems. In T. P. Carpenter, J. M. Moser, & T. Ramberg (Eds.), Addition and
subtraction: Developmental perspective. Hillsdale, N. J.: Erlbaum.
Wolters, M. A. D. (1978). Van rekenen naar algebra. Een ontwikkelingspsychologische analyse. Utrecht
(dissertatie).
Wolters, M. A. D. (1983). The part-whole schema and arithmetical problems. Educational Studies in
Mathematics, 14, 127-138.
Manuscript ontvangen 16-7-1982
Oefmitieve versie 5-12-1983
-ocr page 88-Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp. 84-90.
berekening van (quasi) f-ratio's in variantie-analyse
F. C. van Ginkel
Universiteit van Amsterdam
1, inleiding
Bij uitvoering van variantie-analyse volgens een niet-gefixeerd model is het vaak lastig de
juiste berekeningswijze van de toetsingsgrootheden te vinden of zijn de in de literatuur
aangeboden procedures erg omslachtig of onvolledig. Na een bespreking van de drie modellen
die in de variantie-analyse onderscheiden worden en een uiteenzetdng van de moeilijkheden
waar men op kan stuiten, zal een simpele manier aan de hand worden gedaan om in een aantal
veel voorkomende gevallen snel de toetsingsgrootheden te kunnen berekenen.
In de variantie-analyse onderscheidt men;
1. Gefixeerde effecten
2. Aselecte effecten
Een effect noemt men 'gefixeerd' als uitsluitend naar de in het onderzoek opgenomen nivo's
van de betreffende factor gegenerahseerd wordt. Een effect noemt men 'aselect' als van de
betreffende factor slechts een deel van alle mogelijke nivo's in het onderzoek vertegenwoor-
digd is en naar alle mogelijke nivo's gegeneraliseerd wordt. Idealiter zouden die opgenomen
nivo's een aselecte steekproef uit een populatie van mogelijke nivo's moeten zijn. Kortheids-
halve zal voortaan van 'gefixeerde' resp. 'aselecte' 'factoren' worden gesproken. Bij aselecte
factoren vqrmt de generalisering van de opgenomen naar alle mogelijke nivo's een extra
generalisatiestap. Als dan de toetsingsgrootheid berekend zou worden als bij gefixeerde
factoren, zou de overschrijdingskans onder de nulhypothese een onderschatting zijn van de
kans op een fout van de eerste soort. Als er aselecte factoren in het spel zijn, moet men dan
ook die toetsingsgrootheden anders berekenen dan bij uitsluitend gefixeerde factoren. Men
onderscheidt drie modellen:
1. Het gefixeerde model: alle factoren zijn gefixeerd.
2. Het aselecte model: alle factoren zijn aselect.
3. Het gemengde model: tenminste één factor is gefixeerd en tenminste één aselect.
Voor alle modellen geldt dat als toetsingsgrootheid een (quasi) F-ratió bepaald wordt als een
quotiënt waarvan de teller en noemer onder nulhypothese dezelfde verwachtingswaarde
hebben. De samenstelling van die teller en die noemer kan onder model 2 en 3 anders zijn dan
onder model 1.
In de literatuur wordt de eigenlijke berekening van de toetsingsgrootheden behandeld aan
de hand van model 1. De rekenschema's die daar gegeven worden voor twee- en driefactorop-
zetten zijn zonder meer generaliseerbaar naar alle meerfactoropzetten. De rekenschema's
F. C. van Ginkel 85
voor model 2 en 3 voor twee- en driefactoropzetten, als ze al gegeven worden, zijn dat niet.
De algemene regels om tot zo'n rekenschema te komen zijn omslachtig en onvolledig. Ook
de computer laat je vaak in de steek. Het veel gebruikte subprogramma van SPSS 'Anova'
(Nie e.a., 1975) bijv. kent slechts model 1. Dat subprogramma levert echter wel de in model 2
en 3 te gebruiken MS-termen (Mean Square).
Wat is precies het probleem?
Voor de berekening van de toetsingsgrootheid geldt onder model 1 steeds dat voor een
bepaald effect (hoofd- of interactie) de verwachtingswaarde van de MS-term voor dat effect
onder nulhypothese altijd gelijk is aan MS-error. Voor model 2 en 3 geldt dat niet altijd. Er
zijn daar drie mogelijkheden:
1. Van de MS-term van een bepaald effect is de verwachtingswaarde onder de nulhypothese
gelijk aan MS-error. Net als in model 1.
2. Van de MS-term van een bepaald effect is de verwachtingswaarde onder de nulhypothese
gelijk aan een andere MS-term dan MS-error.
3. Voor een bepaald effect moeten voor teller en noemer MS-termen gezocht worden
zodanig, dat de verwachtingswaarden van de som van de voor de teller geselecteerde
MS-termen enerzijds en van de som van de voor de noemer geselecteerde MS-termen
anderzijds onder nulhypothese aan elkaar gelijk zijn.
Het quotiënt van de onder 3 bedoelde sommen wordt een quasi F-ratio genoemd. Die heeft
onder nulhypothese bij benadering een F-verdeling.
In voorkomende gevallen kun je niet zo zien welke van de drie mogelijkheden gekozen
moet worden. Daar heb je een verwachtingswaardentabel voor nodig. Winer (1970) geeft
regels om zo'n tabel zelf op te stellen. Blijkt uit die tabel dat voor een bepaald effect de derde
mogelijkheid gekozen moet worden, dan heeft Winer, wat betreft de selectie van de termen
Voor teller en noemer, geen betere raad dan net zo lang zoeken en proberen tot het klopt. Het
's heel begrijpelijk dat de eenvoudige gebruiker, die dit niet dagelijks bij de hand heeft, het
spoor bijster raakt en in de verleiding komt zijn niet-gefixeerde model maar als een wei-ge-
fixeerd model te behandelen. Het is echter heel goed mogelijk enkele simpele regels op te
stellen met behulp waarvan men uitsluitend op grond van de kwalificaties van dc factoren en
enkele hulpbegrippen rechtstreeks, zonder de omweg van de verwachtingswaardentabel,
zonder proberen mechanisch, dus programmeerbaar, snel de juiste vulling van teller en
noemer kan bepalen. Daarover gaat deze notitie.
2. Begrippen cn symbolen
Nesting en kruising
Behalve als gefixeerd of aselect dient men de factoren te kwalificeren in termen van nesting en
kruising. Als van twee factoren elk nivo van de ene factor gecombineerd voorkomt met elk
nivo van de andere, noemt men die factoren gekruist. Als van een bepaalde factor bepaalde
nivo's slechts voorkomen binnen één nivo van een andere, spreekt men van nesting.
Bijv.: factor A heeft 2 nivo's, B 6. Van B komen de nivo's 1,2 en 3 slechts voor binnen nivo 1
Van A, de nivo's 4, 5 en 6 van B slechts binnen nivo 2 van A. Dan is A de nestende factor en B
de geneste. Ook binnen B kan weer kan weer een volgende factor genest zijn. Het aantal
nestingen is in principe onbeperkt.
gg Notities en commentaren
2.2. Torens
Als er geneste factoren zijn, is het nodig te gaan denken in termen van 'torens'. Een complex
van een nestende factor met alle daarin geneste factoren zullen wij een 'toren' noemen.
Daarin vormt de nestende factor de bovenste laag en de diepst geneste de onderste. Zo'n
toren kun je uit verschillende standpunten bekijken. Bijv.: Binnen de factor A is B genest en
binnen B weer C. Dan is er nog een factor D die met A, B en C gekruist is. Vanuit A bekeken
bestaat toren ABC slechts uit B en C. Vanuit B bekeken slechts uit C. Vanuit D uit A, B en C.
Het is niet mogelijk een toets uit te voeren voor de interactie tussen de verschillende lagen
van dezelfde toren.
Zulke torens kunnen ook uit interacties opgebouwd zijn. In het zojuist gegeven voorbeeld
zou dat de toren bestaande uit de interacties AD, BD en CD kunnen zijn.
Een factor of combinatie van factoren zonder nestingen kunnen wij beschouwen als een
éénlaagstoren.
In het voorbeeld noemen wij de toren ABC bekeken vanuit A de 'eigen' toren. De toren D
is bekeken vanuit A een 'kruisende' toren.
2.3. Elats
Als een toren, bekeken vanuit een bepaald standpunt, aselecte termen bevat, kunnen wij voor
dat standpunt in die toren de eerst lagere aselecte term (elat) vaststellen. Als in het voorbeeld
A, B en D aselect zijn en C gefixeerd, dan is in de toren ABC bekeken vanuit A de elat B,
bekeken vanuit B is er geen elat en bekeken vanuit D is de elat A. Zou echter A gefixeerd zijn,
dan zou vanuit D bekeken B de elat zijn.
In een toren bestaande uit interacties is een term aselect als alle erin deelnemende factoren
aselect zijn. Voegen wij aan het voorbeeld nog een kruisende factor (of toren) E toe, dan is in
de toren bestaande uit AD, BD en CD bekeken vanuit E de elat AD. Zou echter A gefixeerd
zijn, dan zou vanuit E bekeken BD de elat zijn.
2.4. Orde
Hoofdeffecten noemt men van de orde 0 (nul). Interactieëffecten van twee factoren van de
orde 1. In het algemeen is van een combinatie van j factoren de orde Oj gelijk aan j-1. Zijn er t
verschillende torens met als hoogste laag een niet geneste factor, dan is de hoogst mogelijk
orde gelijk aan t-1.
3. De regels
3.1. Termen voor de teller.
tl. In de teller van de (quasi) F-ratio voor een bepaald effect komt in elk geval de MS-term
voor dat effect.
t 2. Voorts komen in de teller de MS-termen voor de interacties tussen de elats uit de eigen
toren enerzijds en de elats uit alle kruisende torens anderzijds voorzover die bestaan en
voorzover die interacties van een orde Oj zijn die voldoet aan Oj < O max (uiteraard) en
Oj = Oj - 1 + h X 2 waarin 0^ de orde van het effect en h een hulpvariabele is die
achtereenvolgens de waarden 1, 2, 3 etc aanneemt.
t 3. Tenslotte komen in de teller de MS-termen voor de interacties tussen de betreffende
factor of combinatie van factoren enerzijds en de elats uit de kruisende torens anderzijds
voorzover die interacties bestaan en voorzover die van een orde zijn die voldoet aan
Oj < O^ax en Oj = Oe + h x 2.
F. C. van Ginkel 87
^■2. Termen voor de noemer
In de noemer van de (quasi) F-ratio voor een bepaald effect komt uitsluitend MS-error als er
m de eigen en in de kruisende torens geen elats zijn. Anders komen in de noemer:
n 1. De MS-term voor de elat uit de eigen toren, als die bestaat tenminste,
n 2. De MS-termen voor de interacties tussen de elat uit de eigen toren enerzijds en de elat uit
de kruisende torens anderzijds voorzover die bestaan en voor zover die interacties van
een orde zijn die voldoet aan Oj < O^ax en Oj = -(- h x 2.
n 3. De MS-termen voor de interacties tussen de betreffende factor of combinatie enerzijds
en de elats uit de kruisende torens anderzijds voor zover die bestaan en voor zover die
interacties van een orde zijn die voldoet aan 0| = Oe - 1 + h x 2.
4. Voorbeelden
1- Vier factoren A, B, C en D. Volledig gekruist. Alleen C gefixeerd. In de teller van F (CD)
komt uit hoofde van t 1 MS (CD), t 2 is hier niet van toepassing. Bekeken vanuit CD bevat
alleen de toren AC een elat AC waarmee de interactie ABCD van de juiste orde is. Uit hoofde
van 13 komt in de teller dus ook nog MS (ABCD). De teller wordt dan
MS (CD) -I- MS (ABCD). Voor de noemer zijn n 1 en n 2 niet van toepassing. Bekeken vanuit
CD bevatten de torens A en B beide een elat, A en B, waarmee de interacties, ACD en BCD,
Van de juiste orde zijn. Uit hoofde van n 3 komt in de noemer dus MS (ABCD). De noemer
wordt dan MS (ABD) -t- MS(BCD). F(CD) = (MS(CD)-I-MS(ABCD))/(MS
(ACD)-^MS(BCD)).
2. Vijf factoren A, B, C, D en E. B is genest binnen A en C is weer genest binnen B. Het
geheel is gekruist met D en E. A, B en D zijn aselect, C en E gefixeerd. In de teller van F(A)
komt uit hoofde van n 1 MS(A) te staan. De elat uit de eigen toren is B. Bekeken vanuit B
bevat alleen de toren D een elat, D waarmee de interactie BD van de juiste orde is. Uit hoofde
Van 12 komt in de teller dus ook nog MS(BD). Bekeken vanuit A is er geen toren die een elat
bevat waarmee de interactie van de juiste orde is. Uit hoofde van t 3 komen er geen
MS-termen bij. De teller wordt MS(A) -i- MS(BD).
In de noemer komt uit hoofde van n 1 MS(B). Bekeken vanuit B is er geen toren die een elat
bevat waarmee de interactie van de juiste orde is. Uit hoofde van n 2 komen er geen
MS-termen voor de noemer bij. Bekeken vanuit A bevat de toren D een elat D waarmee de
interactie van de juiste orde is. Uit hoofde van n 3 komt in de noemer dus ook MS(AD). De
noemer wordt MS(B) -H MS(AD).
F(A)=(MS(A) -t- MS(BD))/(MS(B) + MS(AD)).
5. Vrijheidsgraden
Het aantal vrijheidsgraden van een som van MS-termen bepaalt men als volgt:
noem de termen Tj, T2........Tj met vrijheidsgraden dfi, dfj........dfj.
^fsotnTj = (som Tj)Vsom(Tj^/df) afgerond op het dichtstbijzijnde gehele getal.
In F(CD) in het voorbeeld is het aantal vrijheidsgraden vqpr de teller:
gg Notities en commentaren
(MS(CD) + MS(ABCD))2
(MS(ABCD))^
(MS(CD))2
(c-l)x(d-l) (a-l)x(b-l)x(c-l)x(d-l)
6. Tenslotte de twee voorbeelden geheel uitgewerkt.
MS(A) + MS(ABD)
MS(AB) + MS(AD)
MS(B) + MS(ABD)
MS(AB) + MS(BD)
MS(C) + MS(ABC) + MS(ACD) + MS(BCD)
MS(AC) + MS(BC) + MS(CD) + MS(ABCD)
MS(D) + MS(ABD)
MS(AD) + MS(BD)
MS(AB)
MS(ABD)
MS(AC) + MS (ABCD)
MS(ABC) + MS (ACD)
MS(AD)
MS(ABD)
MS(BC) + MS(ABCD)
MS(ABC) + MS(BCD)
MS(BD)
MS(ABD)
MS(CD) + MS(ABCD)
MS(ACD) + MS(BCD)
MS(ABC)
MS(ABCD)
MS(ABD)
MS(error)
Voorbeeld 1
F(A)
F(B)
F(C)
F(D)
F(AB)
F(AC)
F(AD)
F(BC)
F(BD)
F(CD)
F(ABC)
F(ABD)
MS(ACD)
F. C. van Ginkel 89
F(ACD) = F(A) F(B) F(C) F(D) F(E) F(AD) F(BD) F(CD) F(AE) F(BE) F(CE) |
MS(ABCD) MS(BCD) MS(ABCD) MS(ABCD) MS(error) MS(A) + MS(BD) MS(CD) MS(AD) MS(E) + MS(ADE) MS(AE) + MS(DE) MS(AD) MS(BD) MS(BD) MS(error) MS(CD) MS(error) MS(AE) MS(ADE) MS(BE) MS(BDE) MS(CE) MS(CDE) |
MS(DE)
90 Notities en commentaren
F(DE)
F(ADE)
F(BDE)
F(CDE)
MS(ADE)
MS(ADE)
MS (error)
MS(BDE)
MS(error)
MS(CDE)
MS(error)
LITERATUUR
Nie, N.H., Hull, H.C., Jenkins, J.G., Steinbrenner, K., & Bent, D. (1975).5^55, Statistical package for the
social sciences (2nd ed.). New York: McGraw-Hill.
Winer, J.B., (1970). Statistical principles in experimental design. London: McGraw-Hill.
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp. 91-93.
Pieter Koele
Gissen en Beslissen.
Academisch Proefschrift, Universiteit van Amsterdam, 1982.
OORDEELSKONSISTENTIE: NOODZAKELIJK MAAR NIET VOLDOENDE
Kunnen mensen Ieren van hun ervaringen? Zo langzamerhand groeit de stapel psychologische literatuur
Waarin op deze vraag een pessimistisch antwoord wordt gegeven. Een belangrijk artikel in dit verband,
geschreven door de Zweedse research psycholoog Brehmer (1980), is zelfs expliciet getiteld: "In one
Word: not from experience". Hij verdedigt daarin de stelling - mede op basis van een reeks eigen
onderzoekingen - dat het mensen in het algemeen ontbreekt aan adekwate strategieën om met probabi-
listische informatie om te gaan. In oordeelssituaties nu waar de te beoordelen "stand van zaken" (het
kriterium) imperfekt samenhangt met de "voorhanden informatie" (z.g. cues) zal derhalve de beoordc-
lingsprestatie achterblijven bij hetgeen theoretisch mogelijk zou zijn, indien de beoordelaar het probabi-
listisch karakter van de oordeclssituatie op juiste waarde zou weten tc schatten. Een centraal onder-
zoeksparadigma op dit gebied - ook gehanteerd door Brehmer - staat bekend als "Multiple Cue
Probability Learning" (MCPL), gebaseerd op het door Brunswik in 1955 geïntroduceerde "lensmodel":
proefpersonen moeten op grond van een of meer cucs de waarde op een kriterium voorspellen dat
■niperfekt met de cue-verzameling samenhangt. Na iedere voorspelling wordt de "ware" waarde van het
kriterium aan de proefpersoon meegedeeld, zodat deze van zijn ervaringen kan leren. Dit nu gebeurt
onvoldoende om - naar Brchmer veronderstelt - dc eerder genoemde reden. In zijn proefschrift "Gissen
en Beslissen" vecht Koele Brehmer's verklaring ten aanzien van de rol van probabilistisch denken aan.
Hij doet dit door "een methodologische analyse" - ik citeer hier de ondertitel van het bock - van het
MCPL-paradigma, in het bijzonder aan dc hand van een kritische bespreking van opzet en interpretatie
Van een aantal experimenten van Brchmer, gevolgd door de presentatie van eigen empirisch onderzoek.
Alvorens daartoe over te gaan geeft Koele een kort overzicht van het onderzoek naar informatieverwer-
king in het algemeen en in probabilistische situaties in het bijzonder. Een overzicht dat eerder als
joegespitst op de specifieke onderzoeksvraagstelling dan als volledig kan worden gekenschetst. Zoals ik
'n het onderstaande zal beargumenteren, leidt deze onvolledigheid tot problemen bij de interpretatie van
Kocle's resuhaten in ccn breder informatieverwerkingskader. Speciale aandacht krijgt vanzelfsprekend
het lensmodel van Brunswik dat uitgebreid door Koele wordt toegelicht. In de formulering daarvan als
een statistisch regressiemodel zijn - als komponenten van de "prestatie" van de proefpersoon, d.w.z. de
korrelatie tussen het kriterium cn het oordcel-dc volgende grootheden relevant voor MCPL-onderzock:
de multiple korrelatie tussen de cues cn het kriterium (Rlc]) enerzijds, die tussen de cues cn het oordeel
(R[s]) anderzijds en tenslotte de korrelatie tussen de regressie van het kriterium op de cues en de regressie
Van het oordcel op dezelfde cues (G). Terwijl R(e] iets van de omgeving (dc "ekologie") op zich zegt, is in
Ris] en G het gedrag van dc proefpersoon betrokken. Deze indexen worden dan ook gewoonlijk
Respektievelijk als "konsistentie" en "taakkennis" benoemd. Zowel in de inleiding als in het konklude-
fend hoofdstuk dingt Koele op theoretische cn empirische gronden op zulke "gedragsinterpretaties" af.
Hoewel de redenering terzake mijns inziens op een aantal punten feilen vertoont, zal ik me ter voorko-
ming van een minutieuze exegese tot twee hoofdzaken beperken.
Allereerst doet Koele het op zijn minst voorkomen alsof veel MCPL-onderzoekers, inzonderheid
Brehmer, het lensmodel als afspiegeling van het kognitief funktioneren beschouwen in plaats van als
handig raamwerk om een aantal onderlinge (on)voorspelbaarheden tussen omgevingsinformatie en
oordeclsgegevens te beschrijven. Misschien bedoelt Koele het niet zo, maar dan was een grotere
Zorgvuldigheid in de formulering wel op zijn plaats geweest, temeer daar uitgerekend Brehmer (1979)
Z'ch in zijn ook door Koele aangehaalde artikel "Preliminaries to a psychology of inference" expliciet
tegen een dergelijke 'context of discovery'-interpretatie uitspreekt (o.e., p. 199). Met de gesignaleerde
92 Boekbespreking
onduidelijlcheid ten aanzien van de pretenties van liet lensmodel hangt ook het volgende punt samen. Als
er in de omgeving betrouwbare niet-lineaire relaties tussen de cues en het kriterium bestaan die ook door
de beoordelaar in zijn oordeelsvorming worden meegenomen, kan de index G een onderschatting van de
"taakkennis" en de index R[s] een onderschatting van de "konsistentie" geven. Dus, waarschuwt Koele,
pas op met "gedragsinterpretaties" van beide. Echter, binnen een bescheiden 'context of justification'-
pretentie is het strikt legitiem te onderzoeken hoe goed een eenvoudig lineair model "past" bij de
gegevens. Ben je geïnteresseerd in het konsistent voorspellen door de proefpersoon van niet-lineaire
relaties in de omgeving, dan wel in het door hem/haar konsistent oordelen volgens niet-lineaire relaties -
of die nu in de omgeving aanwezig zijn of niet -, dan kunnen niet-lineaire funkties van de cues altijd als
termen in het lineair model worden "meegenomen". Koele bespreekt dit uitgebreid en hanteert deze
techniek ook in zijn eigen experimenten. Het wekt dan ook des te meer bevreemding dat in het
slothoofdstuk een nieuwe maat voor "konsistentie" wordt ingevoerd en empirisch met R[s] wordt
vergeleken. Een maat die in essentie bestaat uit het gemiddelde absolute verschil tussen oordelen op
herhaalde afnamen van dezelfde oordeelstaak. Een soort test-hertest "korrelatie" derhalve waar niet -
zoals bij gewone korrelaties - voor verschil in niveau en spreiding wordt gekorrigeerd. Hoewel ook op dit
aspekt valt af te dingen, is de meer principiële vraag wat eigenlijk het toegevoegde nut van de nieuwe maat
is, daar het eenvoudige verschil tussen een gewone test-hertest korrelatie en R[s] in feite al de relevante
informatie over de voorspelbaarheid van de beoordelaar volgens een eenvoudig lineair model verschaft.
En het lijkt mij relevanter vervolgens te onderzoeken welke redelijk eenvoudige konfigurele aspekten de
test-hertest korrelatie mede bepalen dan de gehele verzameling van mogelijke konfiguraliteiten in een
enkele nieuwe konsistentiemaat ongedifferentieerd mee te nemen. Het is dan ook niet verbazingwekkend
dat bij de empirische vergelijking van R[s] mef de nieuwe maat de laatste anders uitvalt. Het zijn niet
"twee maten voor hetzelfde begrip" (Koele, pag. 128), maar gewoon twee verschillende grootheden, die
onderscheiden informatie representeren. Overigens valt het met konsistente konfiguraliteit bij beoorde-
laars in praktische settings nogal tegen. Uitgebreid empirisch onderzoek zowel door Goldberg - die dan
ook ten onrechte door Koele op zijn laatste pagina wordt gewraakt - als anderen laat zien dat konfigurele
aspekten van oordeelsgedrag (b.v. als moderatoren in een regressie-formule opgenomen) kruisvalidatie
doorgaans niet overleven (zie voor een uitgebreide dokumentatie: Wiggins, 1980). En tenslotte, als het
gaat om een goede oordeelsprestatie is konsistente konfiguraliteit alleen maar interessant, voorzover dat
een reële weerspiegeling van de konfiguraliteit in de taakstruktuur betreft. Het is verstandig om een
operatie konsistent volgens het boekje uit te voeren, maar het kriterium is natuurlijk dat de patiënt het er
levend afbrengt.
Nu ik toch in een meer inhoudelijk dan formeel vaarwater verzeild ben geraakt, ben ik in de positie om
mijn hoofdzakelijk inhoudelijke kritiek op Koele's empirisch onderzoek te bespreken. Want, wat dc
methodiek van het onderzoek betreft. Koele laat zich kennen als een gedegen methodoloog die de kunst
van het methodisch ontrafelen van de experimenten van Brehmer en het methodisch goed opzetten en
rapporteren van eigen onderzoek beheerst. Ik heb er dan ook geen moeite mee hem te volgen in zijn
analyse op grond waarvan hij Brehmer's experimenten als onvoldoende steun bestempelt voor diens
opvatting dat gebrekkige noties over waarschijnlijkheid bij-beoordelaars leidt tot suboptimale prestaties
in MCPL-experimenten. Het in het begin van deze recensie genoemde artikel van Brehmer (1980)
echter, waar ook Koele vanuit gaat, berust op meer empirisch onderzoek dan alleen diens eigen
MCPL-experimenten en is mijns inziens alleszins overtuigend. Ik vind het dan ook verwonderlijk dat
Koele zich voor het aanvechten van Brehmer's opvatting alleen op enkele nieuwe variaties in het
MCPL-paradigma baseert zonder Brehmer's overige argumentaties in de beschouwing te betrekken.
Bovendien maakt Koele het punt niet dat hij skoren wil. In een reeks van drie MCPL-experimenten wordt
de invloed van het betekenisvol etiketteren van cues en kriterium, de mate vaniineariteit in de taakstruc-
tuur en het informeren van de proefpersonen over de te verwachten voorspellingsfout bij het oordeel als
onafhankelijke variabelen op voorspellingsprestatie als afhankelijke variabele onderzocht. Wat blijkt?
De enige variabele die rechtstreeks op noties over waarschijnlijkheid slaat - informatie over de voorspel-
lingsfout - heeft geen effekt, klaarblijkelijk, zoals Koele veronderstelt, omdat de taak in het ene
experiment te gemakkelijk en in het andere te moeilijk was. Zodat Brehmer's opvatting nog niet weerlegd
is. "Betekenisvol etiketteren" heeft in Koele's onderzoek wél invloed, echter alléén op R[s] (konsisten-
tie) en niet op G (taakkennis). Dit nu heeft niets met probabilistisch denken te maken maar alles met het
konsistent toepassen van een reeds bekende theorie die in de etiketten op een presenteerblaadje wordt
93 Boekbespreking
aangereikt: de relatie tussen Intelligentie en Prestatiemotivatie als cues en tentamenresultaat als krite-
rium. In het eerste experiment spreekt de taakstruktuur de verwachtingen bovendien nauwelijks tegen, in
het laatste wel - een U-vormige relatie tussen prestatiemotivatie en tentamenresultaat -, hetgeen het de
proefpersonen ook iets moeilijker maakte om, zoals Koele met betrekking tot het eerste experiment
rapporteert, een "omgekeerd U-vormige" relatie te "ontdekken". De meerderheid hield zich echter -
getuige de vragenlijst achteraf - wel aan een "monotoon stijgende". Dit alles zou ook verwacht moeten
Worden op grond van o.a. het uitgebreide onderzoek van Chapman en Chapman en Jennings, Amabile en
Ross, waaruit blijkt dat mensen in "betekenisloos" materiaal korrelaties grotelijks onderschatten en in
"betekenisvol" materiaal de verwachte korrelaties ten onrechte waarnemen. Een en ander is theoretisch
en empirisch uitvoerig gedokumenteerd door o.a. Nisbett en Ross (1980) in hun bekende boek "Human
■nference", waarvan het ontbreken op de literatuurlijst bij een dissertatie als de onderhavige in elk geval
bij mij bevreemding wekt. Zowel het artikel van Brehmer als het boek van Nisbett en Ross leiden
derhalve bij mij ten aanzien van Koele's resultaten tot de herhaling van Brehmer: "In one word, not from
experience". Koele kan natuurlijk tegenwerpen dat de informatie in de door hem posthoc afgenomen
Vragenlijsten anders doet vermoeden, al ben ik ook daar niet geheel zeker van gezien zijn beduchtheid
Voor "post-experimentele sensitisatie" (p. 74). Feit blijft, dat vanuit het proefschrift zo'n tegenwerping
Onvoldoende onderbouwd kan worden, al was het alleen maar omdat nauwelijks aandacht wordt besteed
aan de problemen rond het akkuraat kunnen rapporteren van interne processen, iets waar we sinds
Nisbett en Wilson (1977) - niet door Koele geciteerd - moeilijk meer om heen kunnen. Waar het om gaat
's niet welk gewicht proefpersonen zeggen toe te kennen aan welke cue en welke funktionele vorm ze
^fggen te gebruiken, maar wat ze feitelijk doen. Daarvoor heb je de bêta-gewichten uit de regressie van
het oordeel op de cues nodig, maar die geeft Koele niet! Terwijl, zoals Brehmer en Kuylenstiema (1980)
'aten zien, juist het konsistent gaan hanteren van specifieke gewichten volgens je theorie bij een
betekenisvolle taak - ook al kloppen die gewichten niet met de aangeboden taakstruktuur - verantwoor-
delijk kan zijn voor de algehele konsistentieverhoging.
Het zal duidelijk zijn dat ik "Gissen en Beslissen" niet als een afgewogen monografie over beslissen in
onzekere situaties kan aanbevelen. Desalniettemin valt er voor degene die ervan houdt om een weten-
schappelijk boek in zijn redeneringen en zijn konklusies uit empirisch onderzoek kritisch op zijn waarde
'e toetsen veel van te leren. En het is ook zeker zo dat het als specimen voor een technisch goed opgezet
onderzoek zijn diensten kan bewijzen. In beide gevallen zal de lezer dan wel het ruimschoots meer dan
niodale aantal vaak hinderlijke typefouten voor lief moeten nemen.
LITERATUUR
Brehmer, B. (1979). Preliminaries to a psychology of inference. Scandinavian Journal of Psychology, 20,
193-210.
Brehmer, B. (1980). In one word: not from experience./lc<a Psychologica, 45, 223-241.
Brchmer, B. & Kuylenstiema, J. (1980). Content and consistency in probabilistic inference tasks.
Organizational Behavior and Human Performance, 26, 54-64.
Nisbett, R. E., & Ross, L. (1980). Human inference: strategies and shortcomings in social judgment,
Englewood Cliffs, N.J.: Prcntice Hall.
•Nisbett, R. E., & Wilson, T. D. (1977). Telling more than we can know: verbal reports on mental
processes. Psychological Review, 84, 231-259. ^
Wiggins, J. S. (1980). Personality and prediction: principles of personality assessment (2nd ed.). Reading,
Mass.: Addison-Wesley.
l^ico Smid
Subfaculteit Psychologic
'Rijksuniversiteit Groningen.
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 2, pp 94-95
Ontvangen publikaties
Akkermans, P.W.C. en J.M.G. Leune (red.). Het bestuur van het openbaar onderwijs. Den Bosch:
Malmberg, 1983. Thans Lisse: Swets & Zeitlinger.
Blok, H. Estimating the reliability, validity and invalidity of essay ratings. Amsterdam: SCO, 1983. (SCO
Cahier).
Bronneman-Helmers, R. De arbeidsmarkt voor hoger opgeleiden. Ontwikkelingen en vooruitzichten.
Rijswijk: Sociaal Cultureel Planbureau, 1984. (Stukwerk nr. 15).
Dekker, H. en P. Licht (red.). Didactische werkvormen. Amsterdam: Vereniging universitaire leraren-
opleiding Nederland, 1983.
Gedrags- en Maatschappijwetenschappen. Beleidsnota. Den Haag: Staatsuitgeverij, 1983. (Ministerie van
Onderwijs en Wetenschappen).
Grift, W. van de, G. de Vries en J. Baltzer. De externe evaluatie van het landelijk leerplaatsenproject.
Amsterdam, SCO, 1983.
Haenen, J. en B. van Oers (red.). Begrippen in het onderwijs. De theorie van Davydov. Amsterdam:
Pegasus, 1983.
Hout-Wolters, B. van, J. Jongepier en A. Pilot. Studiemethoden. Utrecht etc.: Spectrum, 1983. (Aula
812).
Israels, H. 'Helpt" studentenbegeleiding?. Leiden: Bureau onderzoek van onderwijs Rijksuniversiteit,
1983. (Rapport nr. 26).
Israels, H. Het studieadvies en de propedeuse: een waardeloze wettelijke formaliteit. Leiden: Bureau
onderzoek van onderwijs Rijksuniversiteit, 1983. (Rapport nr. 27).
Jansen, F. Veranderend leerkrachtgedrag en sociale ontwikkeling van leerlingen. Harlingen: Flevodruk,
1983. (SVO-reeks nr. 73).
Kley, P. van der. Zeg tui, jij!. Purmerend: Muusses, 1983.
Kosters, J., J. Weterings, D. van der Ploeg en H. Franssen. Gezocht: een nieuwe methode. Ontwikkeling
van een handleiding ter ondersteuning van keuzeprocessen voor onderwijsleerpakketten voor het
basisonderwijs. Utrecht: Vakgroep Onderwijskunde, 1984. (Eindrapport van het project SVO
0500).
Moonen, J. en F. Gastkemper. Computergestuurd onderwijs. Utrecht etc.: Spectrum, 1983. (Aula 811).
Schmidt, H. G. en P.A.J. Bouhuijs. Onderwijs en taakgerichte groepen. Utrecht etc.: Spectrum, 1980
(Aula 803).
Van tekentafel tot levend geheel. Advies over schoolwerkplanontwikkeling in het basisonderwijs. Zeist:
Onderwijscentrum, 1983.
(Adviesraad voor het basisonderwijs, het speciaal onderwijs en de opleidingen en naschohng
voor de onderwijsgevenden in het basisonderwijs en het speciaal onderwijs).
Vries, G. C. de. De school beleefd. Een verkennend onderzoek naar ervaringen van leerlingen in LBO en
MA VO te Deventer en Olst in het kader van het voorlopig onderwijsvoorrangsbeleid. Am-
sterdam: SCO, 1983.
Mededelingen 95
Inhoud Pedagogische Studiën
Jaargang 61
Januari 1984
Ten geleide, door G. Kanselaar
Burgerinformatica; leren over informatietechnologie in de eerste fase van het voortgezet onderwijs, door
Tj. Plomp en G.J.E. van de Wolde.
Ondersteuning van het gebruik van computers in het onderwijs, door J. Moonen.
I^e computer als leermiddel in het lager onderwijs, door J.J. Beishuizen en A. Dirkzwager.
LOGO: Achtergronden, evidentie en mogelijkheden, door H. Kunst.
Kroniek: De opening van het Centrum voor Onderwijs en Informatietechnologie (C.O.I.), door G.
Kanselaar.
Februari 1984
Periodiek onderzoek naar de kwaliteit van het onderwijs: enige praktische ervaringen en methodologi-
sche problemen, door W.J. van der Linden en W.J. Pelgrum.
Didactiek en inhoud van het leesonderwijs in de 19e eeuwse volksschool, door K. Abelman, H. de
Frankrijker en W. Verhey.
Kronieken: Curriculum-innovatie in Ontario, Canada, door P. N. Appelhof en T.A.M. van der Meer.
De NLO's en de eerste-graadslerarenopleiding. Een reactie op J.H.G.I. Giesbers 'Beiaard
en de universitaire lerarenopleiding', door F.J. Krips.
Naschrift bij de reactie van F.J. Krips, door J.H.G.I. Giesbers.
Oproep Prof. dr. H.C J. Duijkerfonds
Het prof. Duijkerfonds is door de Universiteit van Amsterdam ingesteld om door het doen van uitkerin-
Een de beoefening van de toegepaste psychologie te bevorderen.
Voor het jaar 1985 is een bedrag in de orde van ƒ 25.000,- beschikbaar ten behoeve van een of meer
onderzoekprojecten. De bedoeling is kwalitatief goed onderzoek mogelijk te maken, dat anders niet
gerealiseerd zou worden omdat de middelen ontbreken.
Te denken valt bijvoorbeeld aan financiële steun voor:
- de kosten van een niet omvangrijk onderzoekproject of deelproject
- de kosten van een voorstudie of vooronderzoek, eventueel ook van de uitwerking van een onder-
zoekopzet
- de aanschafkosten van onmisbare apparatuur, literatuur enz.
de kosten van inschakeling van tijdelijke hulpkrachten.
Subsidie-aanvragen moeten worden ingediend op een aanvraagformulier, dat door het secretariaat op
Verzoek wordt toegestuurd.
Aanvragen moeten vóór 1 oktober 1984 in 10-voud worden gericht aan:
De Adviescommissie van het Prof. Duijkerfonds
t a.v. Dr. A. Jansen
p/a Stichting ISBP
Handboogstraat 2
1012 XM Amsterdam
(tel: 020-525.3528) (tevens adres voor nadere informatie)
I'ostacademisch Onderwijs Sociale Wetenschappen (PAOS):
Programma 1984.
Het programma 1984 van het postacademisch onderwijs sociale wetenschappen is onlangs verschenen.
Het bevat korte aankondigingen van enkele tientallen cursusaktiviteiten, en is verkrijgbaar bij het
Centraal Bureau PAOS, Stationsweg 46, 2312 AV Leiden.
(Advertentie)
BIJDRAGEN TOT DE ONDERWIJSRESEARCHDAGEN 1983 Onderwijsleeiprocessen: Onder redactie van J. J. Belshutzen, C. Hamaker, B. van Hout Woltera en INHOUD H. G. L C. Lodewijks: Onderzoek van Onderwijsleerprocessen C. Hamaker en B. van Hout Wolters: Tekstverwerking R. A. Gerstel: De ontwikkeling van een zelfbeeld van lezen bij eerste klassers van de basisschool G. Seegers en H. Feenstra: Zinsverwerking en verschillen in Th. Boland en M. J. M. Voeten: Het fadliterend effect van het genereren van vragen bij de bestudering van een studietekst H. G. L. C. Lodewijks, M. Place-van Tongerloo en P. R. J. J. J. Beishuizen: Al doende leert men problemen oplossen problemen: analyse van hardopdenk-protocollen grammatika problemen A. van der Wissel: Betekenisrepresentatie, interne en externe differentiële effekten |
BIJDRAGEN TOT DE ONDERWIJSRESEARCHDAGEN 1983 Schoolorganisatie, Onderlinge samenhang bij Onder redactie van G. J. Bergenhenegouwen en G. M. E. Blom INHOUD G. J. Bergenhenegouwen en G. M. E. Blom: Ten Geleide THEMA 1: VERANDERING IN ONDERWIJSORGANISATIES Verandering in onderwijsorganisaties en aansluitingsproblemen praktijk, praktijk en beleid vernieuwingen in schoolorganisaties K. A. Beintema en A. M. A. C. van Greevenbroek: De THEMA 2: DIDACTISCHE KWALITEIT EN LEREN G. M. E. Blom: Inleiding H. Welmers en J. H. de Swart: Ondenwjsrendement en W. van Os: Onderwijs geven en ondenvijs volgen: wat levert het Th. J. ten Cate en Th. J. M. Tromp: Leren door doceren, een wezenlijke bijdrage van peer teaching het gespreksmodel THEMA 3: DIFFERENTIATIE P. de Koning: Inleiding |
IV+212 pp.
ISBN 90 265 0497 7
/ 35.35
IV + m pp.
ISBN 90 265 04M5
I 35,35
Te bestellen bij de boekhandel of door overmaking van het bedrag op girorekening
13984 t.n.v. Swets Publishing Service, Heereweg 347b, 2161 CA Lisse,
met vermelding van het vetgedrukte nummer.
Telex 41325
Telefoon 02521-19113
Postbus 820, 2160 SZ Lisse
Tijdschrift voor Onderwijsresearch 9 (1984), nr. 3, 97-111.
De Houding van Laatstejaarsleerlingen uit het
Algemeen Vormend en Technisch Secundair
Onderwijs in België tegenover Moderne Vreemde
Talen
Luc Delbeke en Agnes Sente
l^atholieke Universiteit te Leuven
abstract
Attitudes of Belgian students toward foreign languages
Items measuring attitudes toward foreign languages (French, English, German, Dutch) were
presented to a sample of 1940 subjects. This sample consisted of Dutch-, French- and German-
speaking students in their last year of secondary education in Belgium (average age: 18 to 19 years
depending on the type of orientation: general formative or technical orientation). By using
Bechtel's multidimensional preference scaling model the items could be related to a number of
underlying dimensions, such as: instrumental interest in a language, several forms of integrative
interest, the degree of easiness in dealing with a language, the attractiveness of a language. These
dimensions were weighted differently when different languages were judged on the items. This
was true for each of the three different language speaking groups. Also, these dimensions were
weighted differently when the same language was judged on the items by different language
speaking groups.
1. INLEIDING
Het onderzoek waarover dit artikel verslag uitbrengt maakt deel uit van een globaal onder-
zoeksproject naar de belangstelling voor en de behoefte aan moderne talen in België'. Het
totale project omvat drie onderzoekingen:
- De belangstelling voor moderne talen in het secundair onderwijs
~ De behoefte aan moderne talen in bedrijven en overheidsdiensten.
~ De behoefte aan moderne talen in de universiteiten.
De uitwerking van het totale project werd geïnspireerd door een onderzoek dat in Nederiand
Werd verricht door het Instituut voor Toegepaste Sociologie (I.T.S.) te Nijmegen.
In dit artikel wordt een deel van de resultaten van het onderzoek in het secundair onderwijs
besproken. Hieraan namen 1940 leeriingen in het laatste jaar van het algemeen vormend en
het technisch secundair onderwijs van het schooljaar 79-80 deel, nl. 861 nederiandstalige,
724 franstalige en 355 duitstalige leeriingen. Het beroepsonderwijs werd niet in het onder-
1 • Het onderzoek wordt verricht aan het Centre de Recherches Sociologiques van de Université Catholi-
que de Louvain, in samenwerking met het Centrum voor Mathematische Psychologie en Psychologi-
sche Methodologie van de Katholieke Universiteit te Leuven. Het project wordt gesubsidieerd door
het Nationaal Fonds voor Kollectief Fundamenteel Onderzoek.
Adres auteurs: Faculteit der Psychologie en Pedagogische Wetenschappen, Tiensestraat 102, B-3000
Leuven (België).
98 Belgische leerlingen en Moderne vreemde talen
zoek betrokken omwille van de zeer beperkte plaats die de moderne talen innemen in het
programma van dit onderwijs.
Aan deze laatstejaarsleerlingen werd een schriftelijke vragenlijst aangeboden, waarin naast
een aantal persoonskenmerken o.m. gevraagd werd naar hun talenachtergrond (moedertaal,
eventueel andere perfect beheerste talen, langdurig verblijf in anderstalige gebieden, talen-
kennis van de ouders), hun beoordeling van het gekregen talenonderwijs, hun verwachtingen
ten aanzien van het toekomstig gebruik van moderne talen en tenslotte hun attitude t.o.v. de
moderne talen. In dit artikel wordt enkel nader ingegaan op deze attitude van de leerlingen
t.o.v. de talen. Het is duidelijk dat de talenachtergrond van de leerlingen een belangrijke rol
speelt bij het vormen van hun opinies t.o.v. deze talen. Anderzijds zal hun attitude t.o.v. de
talen hun beoordeling van het gekregen talenonderwijs en hun toekomstverwachtingen voor
het gebruik van moderne talen beïnvloeden. Het bestuderen van de attitudes vormt dus een
belangrijk onderdeel van het onderzoek in het secundair onderwijs.
Lambert (1972) maakt in zijn theorie over het leren van vreemde talen, waarin de nadruk
wordt gelegd op de sociaal-psychologische aspecten van dit leerproces, een onderscheid
tussen instrumentele en integratieve motieven voor het leren van een vreemde taal. Hij
spreekt van instrumentele motieven indien het gebruik van een taal ten behoeve van studie en
beroep, of het belang van de kennis van een taal voor het maken van promotie, domineren. Er
is sprake van integratieve motieven indien er interesse is voor de cultuur van de andere
taalgemeenschap, indien men direct contact wil met diegenen die de taal spreken. Bovendien
meent Lambert dat voor het succesvol leren van een vreemde taal een positieve integratieve
houding ten opzichte van die taal nodig is.
2. DE ATTITUDE-UITSPRAKEN
Om de houding van de leerlingen ten opzichte van de moderne talen te onderzoeken werd een
lijst met attitude-uitspraken opgesteld. Voor de nederiandstalige leerlingen werd hun attitude
gevraagd t.a.v. het Frans, het Engels en het Duits; voor de franstalige leerlingen t.a.v. het
Nederlands, het Engels en het Duits; en voor de duitstalige leerlingen t.a.v. het Nederlands,
het Frans en het Engels.
Voor het formuleren van de uitspraken werd gesteund op het onderzoek gedaan door het
l.T.S. in Nederland, op literatuur in verband met attitudes ten opzichte van moderne talen
(Lambert) en op een open-houdingsvraag in een vooronderzoek. Er werd gepoogd om in de
uitspraken drie soorten motieven aan bod te laten komen, nl.:
- instrumentele motieven,
- integratieve motieven,
- taalvaardigheid, interesse voor de taal als dusdanig.
De 15 uitspraken die uiteindehjk werden weerhouden staan vermeld in tabel 1. Voor het
Frans bij de nederlandstaligen en het Nederlands bij de franstaligen Werd een 16de uitspraak
bijgevoegd i.v.m. het communautair aspect. Voor het formuleren van deze uitspraak werd
gesteund op een open-houdingsvraag in het vooronderzoek over het Frans in het neder-
landstalig taalstelsel en het Nederlands in het franstalig stelsel. De antwoorden op deze
open-houdingsvraag hielden veelal verband met de kennis van de andere landstaal in beide
taalgebieden. Bij elke uitspraak dienden de leerlingen hun antwoord aan te kruisen op een
7-puntenschaal gaande van 'zeer onjuist' tot 'zeer juist'. Om bepaalde antwoordpatronen (b.v.
altijd 'juist' antwoorden) bij de leerlingen te vermijden werden de uitspraken zowel negatief
als positief geformuleerd. Voor de verwerking zijn de antwoorden op negatief geformuleerde
Luc Delbeke en Agnes Sente 99
uitspraken (4, 5, 11, 13 en 14) gespiegeld, d.w.z. 'zeer onjuist' wordt 'zeer juist', 'onjuist'
Wordt 'juist', enz. Tabel 1 geeft voor de uitspraken i.v.m. de drie talen het percentage
leerlingen dat de betreffende uitspraak beoordeelt als 'eerder juist', 'juist' of 'zeer juist'.
Uit deze tabel blijkt dat de nederlandstalige, franstalige en duitstalige leerlingen in hun
beoordelingen van de talen verschillen.
Enkele vaststelhngen:
~ zowel de nederlandstahgen als de franstahgen hebben, globaal genomen, de meest posi-
tieve houding ten opzichte van het Engels. Bij de duitstaligen komt het Frans op de eerste
plaats (een duidelijke uitzondering hierop vormt uitspraak 11), gevolgd door het Engels;
~ bij uitspraak 16 valt op dat zowel de nederlandstaligen als de franstahgen het in grote mate
eens zijn met een passieve tweetaligheid (84% en 80%);
de houding van de nederlandstaligen t.o.v. het Frans is minder positief dan deze van de
duitstahgen;
indien we voor het Nederlands, het Engels en het Duits de verschillen tussen de drie
taalgroepen bekijken, liggen deze anders voor de verschillende uitspraken. Om een beter
beeld te krijgen van deze verschillen wordt in de volgende paragraaf de toepassing van
Bechtel's multidimensioneel schaalmodel op onze gegevens besproken.
3. TOEPASSING VAN BECHTEL'S MULTIDIMENSIONEEL SCHAALMODEL
VOOR DE ANALYSE VAN VOORKEURGEGEVENS
In de eerste plaats werd via zes factoranalyses nagegaan of de 3 motieven die in de attitude-
ti'tspraken zouden aan bod komen, kunnen teruggevonden worden. Deze zes analyses hadden
betrekking op de gegevens van twee taalgroepen, nederlandstahgen en franstahgen, tegen-
over resp. Frans of Nederlands, Engels en Duits. Deze zes analyses leverden geen bevredi-
gend resultaat op, d.w.z. de hypothese i.v.m. de 3 soorten motieven werd niet bevestigd.
Bovendien waren de aantallen factoren en (geroteerde) factorpatronen verschillend voor de
diverse analyses. Evenmin konden de uitspraken gegroepeerd worden in termen van andere
consistent interpreteerbare motivatiefactoren. Tot op zekere hoogte konden de gegevens
'elkens verklaard worden door slechts één globale houdingsfactor die aan de basis ligt van de
attitude van de leerlingen ten opzichte van de moderne talen.
Nochtans blijkt uit tabel 1 dat de beoordelingen van de nederlandstaligen, franstahgen en
duitstaligen voor de verschillende talen verschillen opleveren. Nu zijn er wel verschillen
'ussen de uitspraken wat betreft de mate waarin een leerling een bepaalde uitspraak als juist of
onjuist beoordeelt . D.w.z. dat een leerling die een positieve houding heeft t.o.v. een bepaalde
globaal genomen alle uitspraken eerder als juist zal beoordelen (indien ze allemaal
Positief geformuleerd zijn), maar dat hij bepaalde uitspraken bijv. als 'zeer juist' zal beoorde-
en en andere als 'eerder juist'. Die leerling zou een uitgesproken positieve houding hebben
•o.y. een bepaalde taal voor bepaalde aspecten (motieven) en een minder uitgesproken
Positieve houding voor andere aspecten (motieven). Gelijkaardig zou een leerling die een
negatieve houding heeft voor een bepaalde taal, bepaalde uitspraken als 'zeer onjuist'
eoordelen en andere als 'eerder onjuist'. Op die manier zouden we wel verschillende
motieven kunnen onderscheiden in de houding t.o.v. een bepaalde taal. Factoranalyse -
oegepast binnen elke dataset afzonderlijk - is dan wellicht een niet al te gevoelige methode
nidat we dan uitsluitend steunen op de correlaties tussen de verschillende uitspraken. Bij
^ er onderzoek van de correlatiematrices blijkt trouwens dat praktisch alle correlaties
positief zijn.
Tabel 1 Percentage leerlingen dat een uitspraak beoordeelt als eerder juist, juist of zeer juist.
1. ... is belangrijk voor je later beroep
2. Ik vind... een mooie taal om te horen
3. Ik wil... leren om directe contacten te
kunnen leggen met de mensen die die
taal spreken
4. ... trekt me erg aan'
5. ... boeken en verhalen kun je beter in
de oorspronkelijke versie lezen dan in
het Nederlands (Frans/Duits)'
6. Ik vind het de moeite waard om... te
leren omdat ik dan ... films en liedjes
beter begrijp
7. Ik vind het belangrijk ... te leren
omdat dit de communicatie met de ...
talige Belgen bevordert^
8. ... lezen vergt weinig inspanningen
9. Ik vind het de moeite waard ... te
leren om de manier van leven en
denken van .. taligen beter te leren
kennen
10. Het is interessant om te leren hoe deze
taal in elkaar zit
11. Het is makkelijk voor een
nederiandstalige (franstalige/duitstalige)
om ... te spreken en te verstaan'
12. De kennis van het ... is belangrijk in
verband met de eenmaking van Europa
13. Wanneer je verder gaat studeren, heb je "
veel aan de kennis van ...'
14. ... schrijven levert weinig
moeilijkheden op'
15. Indien ik er goed mijn brood kon
verdienen dan zou ik bereid zijn in een
... talig gebied te gaan wonen en er in
het ... te werken
16. Alle nederlandstaligen zouden Frans
moeten verstaan (niet noodzakelijk
spreken) en alle franstaligen
Nederlands, zodat ieder zijn eigen taal
zou kunnefi blijven spreken
' Deze uitspraken waren in de vragenlijsten negatief geformuleerd. Voor de verwerking zijn de
antwoorden gespiegeld: 'zeer onjuist' wordt 'zeer juist', 'onjuist' wordt 'juist', enz----
2 Voor het Engels wordt deze uitspraak: Ik vind het belangrijk Engels te leren omdat het gebruik van
deze taal het best de communicatie tussen de nederlands-, frans- en duitstalige Belgen bevordert.
-ocr page 105-
Nederlandstaligen Franstaligen Duitstaligen | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
80
84
102 Belgische leerhngen en Moderne vreemde talen
Aangezien er verschillen zijn tussen de uitspraken voor de graad waarin de leerlingen de
uitspraken 'juist' of'onjuist' beoordelen, kan men per paar van uitspraken A en B nagaan hoe
dikwijls A verkozen wordt boven B (d.w.z. hoe dikwijls A een hogere score krijgt dan B). Op
deze wijze worden de uitspraken op ipsatieve wijze t.o.v. elkaar afgewogen, los van hun
gemiddeld beoordehngsniveau. Bijvoorbeeld: wanneer de uitspraken 1 en 2 vanwege sub-
ject X de scores meekrijgen ZJ (zeer juist) en J (juist), en vanwege subject >»: J en ZJ, dan
neutraliseren deze observaties elkaar. Wanneer voor die beide uitspraken de gemiddelde
score zich evenwel situeert bij 'eerder juist', dan werken deze beide observaties een positieve
correlatie in de hand. Deze paarsgewijze scoring laat bovendien toe de gegevens gezamenlijk
op groepsniveau te bekijken, en na te gaan of op grond van deze groepsgegevens de voorop-
gestelde structuur terug te vinden is. Vandaar dat dan geopteerd werd voor een toepassing van
Bechtel's multidimensioneel schaalmodel voor de analyse van voorkeurgegevens. Eerst volgt
een korte beschrijving van Bechtel's modeP. Nadien worden de gegevens beschreven waarop
Bechtel's model werd toegepast en tenslotte vindt men de bespreking van de resultaten.
1. Korte beschrijving van Bechtel's model
Als uitgangspunt van Bechtel's model moet men beschikken over voorkeursterktes die
aangeven in welke mate het subject (of de groep van subjecten) i stimulus j verkiest boven
stimulus k. Met Bechtel's multidimensioneel schaalmodel worden dan deze paarsgewijze
voorkeuroordelen voor de n stimuli herleid tot een kleiner aantal keuzecriteria die de
voorkeur bepalen.
Men kan in Bechtel's model 2 stappen onderscheiden, nl.:
- het lineair utihteitsmodel,
- het scalair productmodel'.
Het lineair utihteitsmodel gaat er van uit dat de voorkeuren van de subjecten lineair zijn in
de utiliteitswaarden (of voorkeurschaalwaarden) van de stimuli, d.w.z.:
waarin V;y = de utiliteitswaarde van stimulus j voor subject i,
v,i = de utiliteitswaarde van stimulus k voor subject i,
•ijk = het gebrek aan schaalbaarheid van het stimuluspaar (/', k) of m.a.w.
een systematische fout,
ejyt = een toevallige fout.
Voor een uitvoeriger en meer technische beschrijving van het model verwijzen wc naar Bechtel (1976)
en naar Delbeke en Janssen (1979), waarin Bechtel's model werd toegepast om het verband na te gaan
tussen het belang dat eerstejaarsstudenten psychologie en pedagogische wetenschappen hechten aan
bepaalde studiemotieven enerzijds, en de afstudeerrichting die ze kiezen anderzijds.
2
We bespreken hier alleen het scalair productmodel en niet het afstandsmodel. We hebben dit laatste
model niet toegepast op onze gegevens omdat er alleen een bevredigende oplossingstechniek bestaat
voor het geval de schaalwaarden der items vooraf bekend zijn. Dit was hier niet het geval. Bij de
beschrijving van Bechtel's model houden we ons in dc paragraaf 3.1 in eerste instantie aan de
terminologie zoals ze door Bechtel werd geïntroduceerd. Vertaald naar onze gegevens toe betekent dit
dat de term subject steeds verwijst naar een groep subjecten (bijv.: de groep nederlandstaligen bij het
beoordelen van het Frans). De teim stimulus verwijst naar ctnuitspraak, en de term voorkeur of utiliteit
verwijst naar de mate waarmee een groep subjecten zich akkoord kan verklaren met een uitspraak bij
het beoordelen van een bepaalde taal (cf. par. 3.2.)
3
-ocr page 107-Luc Delbeke en Agnes Sente 103
Met behulp van dit model worden uit de voorkeursterktes Pijk de utiliteitswaarden geschat
Via variantie-analyse kan het geformuleerde model op aangepastheid aan de geobserveer-
de gegevens getoetst worden, d.w.z. dat men de nulhypothese kan toetsen om te onderzoeken
of er geen systematische fouten zijn. Men kan bovendien ook de nulhypothese toetsen dat bij
een subject alle v,y-waarden gelijk zijn aan elkaar, d.w.z. dat er geen betekenisvolle voorkeur
zou bestaan voor een stimulus boven een andere.
Met het scalair productmodel worden de voorkeuren voor de n stimuli herleid tot een
kleiner aantal keuzedimensies. Een stimulus/ zou des te meer verkozen worden door subject i
naargelang hij meer met de keuzedimensie r vereenzelvigd kan worden en naargelang het
subject 1 meer belang hecht aan deze dimensie r. Via het scalair productmodel kan men zowel
de stimuli als de subjecten voorstellen door punten in een ruimte. De dimensionaliteit/ van die
ruimte is gelijk aan het aantal keuzedimensies. Het model kan als volgt geformuleerd worden;
1
V// = 2 a^^j, + e,i (2)
Waarin = de projectie van subjectpunt i op dimensie r, d.i. het belang dat subject i
hecht aan de keuzedimensie r,
bjr = de projectie van stimuluspunt / op dimensie r, d.i. de mate waarin
stimulus j kan vereenzelvigd worden met de keuzedimensie r,
tij = een foutenparameter.
Bechtel's multidimensioneel schaalmodel wordt in ons onderzoek toegepast om na te gaan
of de attitude-uitspraken kunnen herleid worden tot een kleiner aantal dimensies of motie-
ven. Bovendien wordt onderzocht of er verschillen zijn tussen de nederiandstalige, franstalige
en duitstalige leerlingen bij de beoordeling van de verschillende talen wat betreft het belang
dat ze hechten aan deze motieven.
Gegevens
Bij de beschrijving van Bechtel's model werd gezegd dat men moet beschikken over voor-
keursterktespiy* die aangeven in welke mate het subject i stimulus/ verkiest boven stimulus k.
Bij de toepassing van het model op onze gegevens wordt niet gewerkt met individuele
subjecten, maar met groepen van subjecten, nl. de nederiandstalige, franstalige en duitstalige
leerlingen. In deze toepassing van het model wordt het subscript i dus gebruikt voor een groep
Van subjecten i.p.v. een enkelvoudig subject. De leerlingen uit elke taalgroep moesten telkens
hun houding aangeven voor 3 talen, nl.:
~ Voor de nederiandstalige leerlingen: Frans, Engels, Duits;
~ voor de franstalige leerlingen: Nederlands, Engels, Duits;
~ voor de duitstalige leerlingen: Nederlands, Frans, Engels.
'n de analyse zal dan ook gewerkt worden met 9 'groepen', nl. de oordelen van 3 taalgroepen
Voor telkens 3 talen. Als stimuli fungeren de attitude-uitspraken. Daar deze uitspraken
dezelfde moeten zijn voor de verschillende groepen, werden slechts 14 uitspraken weerhou-
den in de analyse. Uitspraak 7 valt weg omdat de formulering voor het Engels afwijkt van de
'ormulering voor het Nederlands, Frans en Duits. Uitspraak 16 valt weg omdat deze niet bij
groepen voorkomt. (Deze uitspraken werden wel gebruikt in andere analyses die hier niet
gerapporteerd worden.) Voor elke groep wordt een proportiematrix opgesteld waarin, voor
paar van attitude-uitspraken, wordt ingevuld welke proportie van de leerlingen de ene
104 Belgische leerlingen en Moderne vreemde talen
uitspraak verkiezen boven de andere (d.w.z. aan de ene uitspraak een hogere score toekennen
dan aan de andere)'*. Deze porporties worden dan getransformeerd naar voorkeursterktes/7,yt
op de volgende wijze:
Pijk = 3 bg sin (propp)V2 - (3ji/4) (3)
waarbij de boogsinuswaarde wordt uitgedrukt in radialen. De bedoehng van deze transfor-
made is o.m. verschillen tussen extreme propordes (bijv. 0,95 t.o.v. 0,90) beter tot hun recht
te laten komen dan dezelfde verschillen tussen middelmatige propordes (bijv. 0,55 ten
opzichte van 0,50). Voor de aldus getransformeerde voorkeursterktes geldt dat:
1) Pijk - O als propy^ = 0,50 d.w.z. als groep i onverschillig is tussen de uitspraken j en
k (ook geldt dat pta = 0);
2) Pijk > O als prop,yi > 0,50 d.w.z. als groep i uitspraak j verkiest boven uitspraak
3) Pijk < O als propy^t < 0,50 d.w.z. als groep i uitspraak k verkiest boven uitspraak j;
4) Pijk = - Pikj.
3. Resultaten
In een eerste stap wordt met behulp van het hneair utiliteitsmodel nagegaan in hoeverre er
verschillen zijn binnen de 9 groepen naar hun voorkeur voor de attitude-uitspraken. Daarom
worden uitgaande van de voorkeursterktesp,y4 de voorkeurschaalwaarden v,y voor de attitude-
uitspraken geschat. Deze voorkeurschaalwaarden zijn terug te vinden in tabel 2. Binnen elke
groep zijn de uitspraken gerangschikt naar belangrijkheid (cijfers tussen haakjes). Via va-
riantie-analyse wordt de nulhypothese getoetst dat binnen elke groep alle v^y-waarden gelijk
zijn aan elkaar, dit wil zeggen dat er bij elke groep geen betekenisvolle instemmingsverschil-
len bestaan voor de verschillende uitspraken. De 9 F-waarden voor de 9 groepen variëren van
177,00 tot 876,12 (telkens met aantal vrijheidsgraden gelijk aan 13 voor de teller, en 624 voor
de noemer). Hieruit kunnen we besluiten dat er binnen elke groep wel degelijk instem-
mingsversch'illen zijn tussen de uitspraken.
Ook wordt de nulhypothese getoetst dat er geen systematische fouten zijn (F = 3,125 met
78 en 624 vrijheidsgraden). Dus ook de F-waarde voor de systematische fouten, of m.a.w.
voor het gebrek aan schaalbaarheid, is significant op het 1%-niveau. De som der kwadraten
voor de systematische fouten (1,912) is echter zeer klein in vergelijking tot de som der
kwadraten voor de voorkeurschalen (375,438). Bovendien werd de interne betrouwbaarheid
(Rr) en de interne vahditeit (Ry) van de voorkeurschalen berekend.
Rr wordt berekend door de vierkantswortel te nemen van de verhouding tussen de ware en
de totale variantie, of door de correlatie te berekenen tussen de geobserveerdep,y*-waarden
en degereconstrueerdep,yt-waarden(piy* =V/,-v,vt -t-yy^)./?,. = 0,9934. Dit is dus zeer hoog./?,,
is een fittingsmaat voor het globale Bechtel-model, y-parameters inclusief. Vandaar dat zelfs
bij een grote Ä,.-waarde de mogelijkheid blijft bestaan dat de schalèn weinig valied zijn,
namelijk wanneer er veel systemadsche fouten voorkomen. De interne validiteit (/?„) wordt
bepaald door de correlatie te berekenen tussen:pi^ = v,y - v,jt enpij^. Men vindt eveneens een
zeer hoge validiteitsindex, nl. = 0,9909. Men kan dus aannemen dat de systematische
fouten weinig invloed gehad hebben op de antwoorden van de leerlingen, en dat het lineair
utiliteitsmodel aangepast is aan onze geobserveerde gegevens.
" De antwoorden van de oorspronkelijk negatief geformuleerde uitspraken 4, 5, 11, 13 en 14 zijn voor
deze verwerking gespiegeld.
Luc Delbeke en Agnes Sente 105
'—s '-V '-N , Tt ^ r^ ^^ I o
----v^ N^ S^ ---' S^ S..^ S«.' ------
o" o" o" o" o" o" o" o" o" o" o" o' o" o'
i i i i i ii
c
u
00
«-H rt m >n 00 rt
o en Tt ^
»-H rt t-i a\ «s >-i VO
c
«
b
3
Q
3
T3
C
U
ta ^
ÎS -a
si
«c M
i't
3 g
ts
0 60
C e
§1
c ^
Ji s
CL.-0
a Uî
1) a
•o M
2
•S e
« u
a ^
5 g
1 2
eu
a
u
60
C
ca
o o o o o o o
i i
r-^ ^^ o_ VO ov ts o\ VO o | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
i i i i i Tt 00 TH CTv "-I i i |
i-i in "-i
a
'3
û
0 o o o o o
1 III
o
00
c
u
Tt fn' ^ ^ ^ r)
VO t^ CO »-t
^^ ^ ^-^ ^-^ M-s . ■
W'—^ ^ ^ w — _ _ _ _ _
or<cx)TtovvovoTtcsvoosvortoo
m <n ts "'T, ® "T,
o o o" o' o" o" o" o" o" o" o" o" o" o"
i iii ii
c
a>
60
T3
C
_ca
u
T5
U
Z
£
^—, ^—V —,.—..—V ^—, co rs o '—s
t^ fS >-1 rt
o" o" o" o" o" o' o" o" o" o" o' o" o' o"
i i i i i i ii
o tr, JS ^^^
-HTtcnvOW^^-^'-lOOrtt^
n
o\
c
u ^
w u
S-S
8
8-
> s
<s
f2
3
Q
\0<0«rivoOOOOvoOt^>/^fSOTtOs
-- rn tn rH -H iri^ M o 00 o Tt On O
o" o' o' o" o o o o o o o o o o
c
u
J3
tH
O
O
•o
m
•S
11
o
o
>
G
U
eo
e
u
Ü
60
u
00
c
u
i i i i i ii
c
u
M
'-H^^fnTt>/^voooovo-Hr^cnTt>/^
-ocr page 110-1294 Belgische leerlingen en Moderne vreemde talen
Met behulp van het scalair productmodel kunnen de voorkeuren voor de attitude-uitspraken
herleid worden tot een kleiner aantal basismotieven die deze voorkeuren bepalen. Bovendien
kan worden nagegaan of er verschillen zijn tussen de 9 groepen voor het belang dat ze hechten
aan deze basismotieven. Tabel 2 geeft de rangschikking naar belangrijkheid aan van de 14
attitude-uitspraken voor de 9 groepen. Men ziet dat er zich belangrijke verschillen voordoen.
Door toepassing van het scalair productmodel beoogt men nu een duidelijker beeld van deze
verschillen te verkrijgen. Steunend op de matrix met voorkeurschaalwaarden v,y kan bepaald
worden op hoeveel dimensies of keuzemotieven de leerlingen beroep doen en welke de
projecties zijn van de attitude-uitspraken. De methode die hiervoor gebruikt wordt staat
gekend als een Eckart-Young decompositie van de matrix met voorkeurschaalwaarden v,y.
Deze Eckart-Young decompositie komt neer op het trekken van eigenwaarden en eigenvec-
toren. Ondermeer de grootte van de eigenwaarden is bepalend voor het aantal dimensies dat
zal weerhouden worden. De bijbehorende eigenvectoren geven de projecties van de attitude-
uitspraken op deze dimensies. Het verloop van de eigenwaarden is als volgt: 14,90; 4,40;
3,93; 1,64; 0,94; 0,67; 0,24; 0,07; 0.03.
Gekozen werd om 6 dimensies te weerhouden, alhoewel de laatste 2 hiervan minder
belangrijk zijn. Uit de projecties van de attitude-uitspraken op de dimensies blijkt echter dat
vooral de integratieve motieven hoge projecties behalen op de vijfde en zesde dimensie.
Aangezien dit vanuit de theorie van Lambert belangrijke motieven zijn, en zij ook omwille
van die reden door ons in onze vragenlijst opgenomen waren, hebben wij deze vijfde en zesde
dimensie verder in de oplossing weerhouden. Bovendien is de foutenterm voor het scalair
productmodel' bij 6 dimensies gelijk aan 0,08 en is van dien aard dat hij substantieel groter is
dan de globale foutenterm voor het lineaire model (nl. 0,008). Deze discrepantie is nog veel
meer uitgesproken wanneer men slechts 5 dimensies zou weerhouden. Dan is de foutenterm
van het scalair product-model immers gelijk aan 0,20.
Wanneer het aantal dimensies (t) en de projecties van de attitude-uitspraken op deze
dimensies (by,) gekend zijn, kan men met behulp van formule (2) de projecties a,> van de 9
groepen op de dimensies bepalen. Deze oplossing is echter niet uniek. Via rotatie van de
dimensies kan geprobeerd worden een oplossing te vinden die beter interpreteerbaar is.
Daar vooraf reeds een hypothese was geformuleerd voor de keuzemotieven die de voor-
keuren voor de attitude-uitspraken zouden bepalen, werd getracht de gevonden oplossing te
roteren naar een hypothetisch vooropgestelde structuur. Deze hypothese werd geformuleerd
voor 4 dimensies en was de volgende:
- gemakkelijkheid waarmee men een taal aankan:'uitspraken 8, 11 en 14;
- instrumentele motieven: uitspraken 1 en 13;
- plezier in de talenstudie omwille van de taal zelf: uitspraken 2 en 4;
- integratieve motieven: uitspraken 3, 5, 6 en 9.
Voor de uitspraken 10, 12 en 15 werd geen hypothese vooropgesteld.
Bij het roteren naar een hypothetisch vooropgestelde structuur werd het onderzoek be-
perkt tot een orthogonale rotatie, d.w.z. dat de geroteerde dimensies ónafhankelijk zijn van
1
' De foutenterm is gelijk aan (n 2 X,)/(m) (n-l-<) = 4,76/63 waarin:
I - ;+l
n = aantal stimuli
X, = de /-de eigenwaarde
l = aantal weerhouden dimensies
1 = totaal aantal eigenwaarden dat kan getrokken worden
m = aantal groepen.
Luc Delbeke en Agnes Sente 107
elkaar. Uitvoeren van deze rotatie betekent dat de reeds verkregen oplossing geroteerd wordt
op zo'n wijze dat de uitspraken 8, 11 en 14 een zo hoog mogelijke projectie verkrijgen op de
eerste dimensie, en de andere uitspraken een lage projectie op deze dimensie. Uitspraken 1 en
13 moeten een hoge projectie hebben op de tweede dimensie, uitspraken 2 en 4 op de derde
dimensie, en uitspraken 3,5,6 en 9 op de vierde dimensie. Over de vijfde en de zesde dimensie
Werden bij voorbaat geen uitspraken gedaan.
De geroteerde voorkeurstructuur is grafisch weergegeven in de figuren 1-3. Alhoewel de
oplossing niet volledig bevredigend is (sommige uitspraken hebben een hogere projectie op
een andere dimensie dan volgens de hypothese vooropgesteld), kan men de hypothese toch
Voor een groot deel aanhouden.
Dimensie 1 houdt inderdaad verband met de gemakkelijkheid waarmee men een taal
aankan: de uitspraken 8, 11 en 14 hebben een hoge positieve projectie op deze dimensie.
iJitspraak 11 heeft echter een zeer hoge positieve projectie op de zesde dimensie, terwijl de
uitspraken 8 en 14 een negatieve projectie hebben op deze dimensie. De zesde dimensie
plaatst de gemakkelijkheid waarmee een taal als direct communicatiemiddel kan gebruikt
Worden (spreken en verstaan van de taal) tegenover de gemakkelijkheid waarmee ze als
'ndirect communicatiemiddel kan gebruikt worden (lezen en schrijven).
Dimensie 2 houdt duidelijk verband met de instrumentele motieven, nl. het nut van een taal
^oor studie en beroep. Uitspraken 1 en 13 hebben een hoge projectie op deze dimensie.
De derde dimensie verwijst naar het plezier in de talenstudie omwille van de taal zelf;
-ocr page 112-108 Belgische leerlingen en Moderne vreemde talen
uitspraken 2 en 4 hebben een hoge projectie op deze dimensie. Het globale evaluatieve aspect
van een taal schijnt echter enigszins in tegenstelling te staan met de meer 'intellectualistische'
interesse voör een taal (uitspraken 9 en 10 hebben een negatieve projectie op de derde
dimensie).
De vierde dimensie, die volgens de geformuleerde hypothese moest duiden op integratieve
motieven (interesse voor de cultuur, directe contacten met de bewoners), wordt minder goed
bevestigd. Uitspraken 3, 5 en 6 hebben een hoge projectie op deze dimensie. Uitspraak 9
heeft, in tegenstelling tot de verwachting, geen hoge-projectie op de vierde dimensie. Uit-
spraak 5 heeft bovendien een hogere projectie op de vijfde dimensie.
Deze vijfde dimensie plaatst het lezen van boeken en verhalen als cultureel integratief
motief tegenover sociale en politieke integratieve motieven (uitspraken 3 en 12 hebben een
hoge negatieve projectie op de vijfde dimensie).
Globaal genomen kan men dus aannemen dat de voorkeuren van de leerlingen voor de 14
attitude-uitspraken kunnen herleid worden tot 6 dimensies of keuzemotieven. Deze zijn:
1. de gemakkelijkheid waarmee men een taal aankan;
2. instrumentele motieven;
3. plezier in de talenstudie omwille van de taal zelf;
4. integratieve motieven;
5. lezen van boeken en verhalen als cultureel integratief motief in tegenstelling tot sociale
en politieke integratieve motieven;
6. de gemakkelijkheid waarmee een taal als direct communicatiemiddel kan gebruikt
worden (spreken en verstaan van de taal) t.o.v. de gemakkelijkheid waarmee ze als
indirect communicatiemiddel kan gebruikt worden (lezen en schrijven).
Luc Delbeke en Agnes Sente 109
|