STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT...

32
STAtOR periodiek van de VVS jaargang 12 nummer 2, juli 2011 Hoe de p-waarde te gebruiken bij beslissingen Eerste Kamerverkiezingen Hoe optimalisatie in een aantal jaren in het DNA van TNT Express is gekomen Karl Pearson tussen statistiek en filosofie Rechtstreeks verwachtingen evalueren of de nul-hypothese toetsen? Generalized reliability in industriële user studies

Transcript of STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT...

Page 1: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

STAtORpe

riodi

ek v

an d

e VV

S ja

arga

ng 12

num

mer

2, j

uli 2

011 Hoe de p-waarde te gebruiken

bij beslissingen

Eerste Kamerverkiezingen

Hoe optimalisatie in een aantal jaren in het DNA van TNT Express is gekomen

Karl Pearson tussen statistiek en filosofie

Rechtstreeks verwachtingen evalueren of de nul-hypothese toetsen?

Generalized reliability in industriële user studies

Page 2: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

2 STAtOR jul i 2011 |2

STAtORJaargang 12, nummer 2, juli 2011

STAtOR is een uitgave van de Vereniging voor Statistiek en Operationele Research (VVS). STAtOR wil leden, bedrijven en overige geïnteresseerden op de hoogte houden van ontwikkelingen en nieuws over toepassingen van statis-tiek en operationele research. Verschijnt 4 keer per jaar.

Redactie Joaquim Gromicho (hoofdredacteur), Ana Isabel Barros, Johan van Leeuwaarden, Mirjam Moerbeek, Gerrit Stemerdink (eindredacteur), Hilde Tobi. Vaste medewer-ker: Fred Steutel

Kopij en reacties richten aanProf. dr. J.A.S. Gromicho (hoofdredacteur), Faculteit der Economische Wetenschappen en Bedrijfskunde, afdeling Econometrie, Vrije Universiteit, De Boelelaan 1105, 1081 HV Amsterdam, telefoon 020-5986010, mobiel 06-55886747, <[email protected]>.

Bestuur van de VVSVoorzitter: prof. dr. Jacqueline Meulman <[email protected]>Secretaris: dr. Irene Klugkist <[email protected]> Penningmeester: dr. Ad Ridder <[email protected]>Studentlid: Maarten Kampert (Bsc) <[email protected]>Overige bestuursleden: prof. dr. Fred van Eeuwijk (BMS), prof. dr. ir. Stan van Hoesel & dr. John Poppelaars (NGB), dr. Eric Cator (SMS), dr. Michel van de Velden (ECS), dr. Andries van der Ark (SWS),

Leden- en abonnementenadministratie van de VVSVVS, Postbus 244, 6700 AE Wageningen, telefoon 0317 - 419572, fax 0317 - 421364, <[email protected]>. Raadpleeg onze website over hoe u lid kunt worden van de VVS of een abonnement kunt nemen op STAtOR of op een van de andere periodieken.

VVS-websitewww.vvs-or.nl

AdvertentieacquisitieRené Luijk, p/a Leids Universitair Medisch Centrum, afdeling Medische Statistiek en Bio-informatica, Postzone S5-P, Postbus 9600, 2300 RC Leiden, 06 244 32 892, <[email protected]>. STAtOR verschijnt in maart, juni, september en december.

Ontwerp en opmaakPharos | M. van Hootegem, Nijmegen

DrukDrukkerij Zoeteweij, Yerseke

Uitgever© Vereniging voor Statistiek en Operationele ResearchISSN 1567-3383

3 Redactioneel

4 Hoedep-waardetegebruikenbijbeslis-singen.Erzitsignificantteweinigverfinmijnpotjes!Moetikietsdoen?

Aart F. de Vos

8 EersteKamerverkiezingen Jacob Jan Paulus & Jaap Praagman

14 HoeoptimalisatieineenaantaljareninhetDNAvanTNTExpressisgekomen

Hein Fleuren, Marco Hendriks & Annelies Woutersen

17 Agenda

18 KarlPearsontussenstatistiekenfilosofie Richard Starmans

22 Rechtstreeksverwachtingenevaluerenofdenul-hypothesetoetsen?

Rens van de Schoot

25 Words,words–column Fred Steutel

26 Generalizedreliabilityinindustriëleuserstudies

Jan Engel

31 InMemoriamJoopKemperman Fred Steutel

32 Buurtfeest–column Johan van Leeuwaarden

Inhoud

Page 3: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

3 STAtOR jul i 2011 |2

Mensenzijnerinsoorten.Zoschijnensommigenzich te kunnen ontspannen tijdens vakanties enondervindenanderenjuiststressvanwegedeveleextrabeslissingendiezedanmoetennemen.Menzou, overdreven gesteld, kunnen zeggen dat devrijheidvandevakantieonlosmakelijkdedwangvandekeuzemetzichbrengt.

Statisticizijnnetmensen:ookzijzijnerinsoor-tenenookzijzittenvoortdurendmetkeuzes.EenkeuzedievaakvoorkomtisofmenvóóroftegenBayesis.AanditprobleemwordeninditnummervanStatormaarliefsttweeartikelengewijd.AartdeVoslaatziendat‘klassiek’enBayeselkaarniethoeventebijten,maarheelgoedalselkaarsaan-vullingbeschouwdkunnenworden.EnRensvandeSchootgaatóókinindecomplementairefunc-tievanbeidemethoden.Voorwietoevalligindezevakantie naar Denemarken gaat: in de slotkapelvanhetkasteelFrederiksborginHillerødhangendewapenschildenvandeledenvandeOrdevande Olifant, de hoogste Deense onderscheiding.EenvandieschildenisvandeberoemdeDeensenatuurkundige Niels Bohr en zijn wapenspreukluidt ‘Contraria sunt Complementa’. Dit slaat opBohr’s interpretatie van de quantummechanica,maarnahetlezenvandeartikelenvanDeVosenVan de Schoot kan men het ook op de statistiektoepassen.

Trouwens, over kiezen gesproken: de manierwaarop de afgelopen maanden de Eerste Kamerwerd gekozen leek voor de gewone kiezer welhogere wiskunde. De redactie is verheugd u eenzeer actueel en verhelderend overzicht van ditprobleem te kunnen bieden. Jacob Jan Paulus enJaapPraagmantekenendaarvoor.

EenheelanderartikelisgeschrevendoorHeinFleuren,MarcoHendriksenAnneliesWoutersen.ZijbeschrijvenhoeTNTExpressstapjevoorstapjewordtveroverddoortoepassingenvandeOR.

De filosoof Richard Starmans vertelt over debelangrijkerolvanKarlPearsonindeontwikke-ling van de statistiek. De redactie kijkt nu al uitnaar enkele andere artikelen die hij heeft toege-zegd te zullen schrijven over andere groothedendie aan de wording van ons vakgebied hebbenbijgedragen.Zééraanbevolen.

Ditisnognietalles,ukunterookvoorkiezenom als eerste het artikel van Jan Engel te lezen.Dan zult u zien dat de bekende Cronbachsalphamethode uit de sociale wetenschappen uitste-kend kan worden gegeneraliseerd naar industri-elestudies.

Ennatuurlijkhebbenookonzevastecolumnis-ten rekening gehouden met de tijd van het jaar:hunbijdragenzijnluchtigenverstrooiend.

Ten slotte een In Memoriam voor JoopKemperman. Hij was een van de vier promo-vendi van David van Dantzig en is in NederlandwatminderbekendgewordendoordathijalsneldaarnanaarAmerikaverhuisde.Daarwashijeenproductiefwetenschapper,metmaarliefst24pro-movendi.FredSteutelherdenkthem.

Kortom,keusgenoeg,maarlaathetuniettotstressvoeren.Gooidesnoodseenmuntjeopalsugeenkeuskuntmaken,doetuindevakantietochnogaankansrekening.

Deredactiewenstuveelleesplezier.

Gerrit Stemerdink

Vakantie, een tijd vol keuzes

Page 4: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

4 STAtOR jul i 2011 |2

Geen statistisch onderwerp is zo controversieelals de p-waarde. Bayesianen drijven er de spotmee,maarhetiseenbasiselementiniederestan-daardcursus statistiek. De p-waarde is de kansdat als de nulhypothese (H0) waar is, de data zoextreemzijnalszezijn,ofnógextremer.Ditkrijgtbetekenis in vergelijking met een norm, het sig-nificantie niveau α, dat meestal 0,05 genomenwordt.Alsp<αdanisietssignificant.

Centraal in de verwarring over de betekenishiervan staat de ‘p-value fallacy’: de p-waardeaanzien voor de kans dat de nulhypothese waaris. Dat is natuurlijk fout; die kans bestaat niet

eensindeklassiekevisie.Maardezeiswelnodigvoor het nemen van beslissingen onder onze-kerheid. Wat moet een bedrijfseconoom bij eensteekproefuitkomst ‘er zit significant te weinigverfinmijnpotjes’andersdandenkendatjeiets moet doenomdatdekansgrootisdaterwatmisis? Dat er in het statistiekonderwijs geen kop-peling wordt gelegd tussen toetsen en beslissenvind ik dramatisch. De statistiekopleiding wordthierdoorvrijwelzinloos,somszelfsgevaarlijk:de‘p-valuefallacy’iseenvariantvande‘prosecutorsfallacy’.HetverloopvanhetprocesLuciadeBerkiseenpregnantvoorbeeld–algingdaarnogveel

Aart F. de Vos

Hoe de p-waarde te gebruiken bij beslissingenER zIT SIGNIfIcANT TE wEINIG VERf IN mIjN POTjES! mOET IK IETS DOEN?

Page 5: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

5 STAtOR jul i 2011 |2

meermis.‘Alsverdachteonschuldigis(H0) ishetgebeurde uiterst onwaarschijnlijk, dus zal ver-dachtewelschuldigzijn.’

Ook studenten die uitgebreid statistiek heb-bengehadzijnverbijsterdalsikhetvolgendeeen-voudigevoorbeeldvoorleg.Eenstudentdoeteenmultiple choice-tentamen: 50 vragen met steedsdrie mogelijke antwoorden. Er zijn 27 goede ant-woorden.Gegokt?Alsdekanspervraag1/3 is, isdekansop27of meergoed0,002.Zeersignificant.Dus niet gegokt? Als het een redelijk goede stu-dent isdiesomsleertensomsfeest, is65%kansdathijgegoktheeftredelijkplausibel.27antwoor-

dengoedisnogonwaarschijnlijkeralshijgeleerdheeft (en zijn kans per vraag 0,75 is) dan als hijgegokt heeft. Het gaat om de aannemelijkheids-verhouding van de data (27 goed dus meer doetniet ter zake). Posterior odds is prior odds times likelihood ratio.

Klassieke toets

Dus weg met de p-waarde? Nee. Ik denk eenoplossingtehebbengevonden(opzijnminstvoorbedrijfseconomen) indevormvaneeneconomi-sche onderbouwing van de klassieke toets. Mijnstelling isdatereenvoudigeBayesiaansemodel-len zijn waarin het format p<α optimaal is voorhet nemen van beslissingen. Die modellen zijnzinvol ineensequentiëleproceduredieeenbrugvormt tussen de frequentistische en de Bayesi-aanseaanpak.Deaanpakbestaatuitdriestappen.1. Kies een α die zinnig is in de context van een

beslissing(ikkomhieropterug).2. Berekendep-waardeenbepaalofp<α;enzoja,

danisietssignificant.Gevolgd door een beslissing die geparafraseerdkanwordenmetdeslagzin:3. Als iets niet significant is: niet verder over

nadenken.Alswel:huureenBayesiaan.Net zoals in de gezondheidszorg. Een huisartsheeft twee mogelijke diagnoses: pluis of nietpluis. In het laatste geval verwijst hij naar despecialist. Met‘pluis’ bedoelt hij dat de kans daterietsaandehandistekleinisomdekostenvannaderonderzoekterechtvaardigen.

Met goede software kan de student wor-den opgeleid tot ‘huiseconoom’ (stap 1 en 2). DeBayesiaan is dan de specialist. In vrijwel allesituaties iseenvolwaardigeBayesiaanseanalyselastigenduskostbaar.Hetvergthetopstellenvan(deelssubjectieve)priorsenverliesfunctiesenhet

Page 6: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

6 STAtOR jul i 2011 |2

inkaartbrengenvandiversebeslissingen.De klassieke toets is typisch geschikt voor

situatiesmeteenhogeP(H0),depriorkansdaternietsdehandis.Enfunctioneertalseensoortzelf-bescherming. Wij worden voortdurend bestormddoor‘significante’ feiten die iets zouden kunnenbetekenen. Er over nadenken kost veel tijd en isdaaromkostbaar.Meestalishetloosalarm.Datishet geval in een fractie P(H0)(1-α) van alle geval-len, als je de de regel ‘denk na als de p-waardekleinerisdanα hanteert.

De klassieke toets stelt ‘verwerp H0 als p<α’.Metα=0,05.Ofsoms0,01omvaagomschrevenredenen.Studentenlerenbraafhoejeeentest sta-tistic(S)kanspecificerenwaarvanjedeverdelingkent en dus de overschrijdingskans kunt opzoe-kenvande‘gerealiseerdeS’.Dep-waardedus.

NukanbewezenwordendatvrijwelalleineenstandaardboekStatistics for Business Studentsver-melde eenzijdige toetsen een Bayesiaanse inter-pretatie hebben die voorschrijft: doe iets als S>k(ofS<k,afhankelijkvandesituatie).Endatditookgeschreven kan worden als: ‘doe iets (op grondvan een kosten-baten afweging) als p<αim’. Metpdep-waardeenαimdeimplicieteαdieafhangtvanpriorsenverliesfuncties.

Het verschil tussen frequentisten enBayesianen is eigenlijk dat de laatsten bewerentewetenhoeαmoetwordenbepaald.Datdoenzeoverigenszelden.Bayesianenconditionerenopdedata.DekansverdelingvandataonderHointeres-seertzeniet.Wat jammeris,omdatderepresen-tatievaneenbeslissingsprobleemintermenvanpenαalsvoordeelheeftdatpalleenafhangtvanH0endedata,enαvanpriorsenverliesfucties.Decoherentemanieromoverdesituatietedenkenisintermenvaneengegevenp eneenpriorvoorα.Waarbijhetbijsequentieelbeslissenduseenoptieis om meer informatie over α te vergaren (eenBayesiaanintehuren).

Deeersteuitdagingisnuomsoftwareteont-wikkelenvoorstap1.Eeneenvoudigmodeldatde

belangrijkste inputs en schattingen van kostenomzet in zinnige waarden voor α. De range vanzinnigewaardenzaloverhetalgemeenvrijgrootzijn:verliesfunctiesintermenvanαzijnvlakrondhet optimum. Het is vooral essentieel om echtfoutekeuzestevermijden. Interessant ishetookomnategaanwanneer0,05echtfoutis.

De formele kant in vogelvlucht

Inhetbasisgevaliseréénparameterµvanbelang.H0isµ =µ0,H1isµ >µ0(ofµ <µ0).Deformuledieaangeeftwanneerjemoetbeslissenietstedoen,omdat het verwachte nut groter is dan dat vannietsdoenis:doeietsals

BF(S)=Z f(S|θ)

π(θ|H1)dθ > π(H0) L(1,0)

= k (1) f(S|θ0) π(H1) L(0,1)

(f=kansdichtheid;π=priorkans(dichtheid))

Aan de linkerkant staat de ‘Bayes Factor’ (BF(S)).(=P(S|H1) / P(S|H0)).Dieisafhankelijkvan¼ (µ|H1),desubjectievevoorverdelingvanµonderH1.Ofte-weldelastigevraag:‘Watzoueraandehandkun-nen zijn?’ Aan de rechterkant de prior odds vande hypothesen, maal de ratio van de verwachteverliezen bij het nemen van de twee mogelijkeverkeerde beslissingen: L(1,0) iets doen terwijl ernietsaandehandis)enL(0,1)(tenonrechtenietsdoen).

Deimplicieteαin(1)is

αim = PS|H0 (BF(S) > k)(2)

een ongebruikelijk mengsel van frequentistisch(PS|H0) en Bayesiaans. Bayesianen kijken naar deongelijkheid BF(S) > k. Dat heeft als bezwaar dataan beide kanten priors voorkomen. Het formatp<αimheeftditbezwaarniet.HetkanbovendienookwordengebruiktwanneerL(0,1)afhangtvan

Page 7: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

7 STAtOR jul i 2011 |2

µ, wat normaliter het geval zal zijn. De formulewordtdanαim=PS|H0 (S>k)waarbijkmetdeBaye-siaansemachinerieberekendkanworden.

Een voorbeeld

VolledigBayesiaansbeslissen is lastig.Maarver-schillendebeslissingenonderlingcoherentmakenis eenvoudiger. Stel µ is de verwachting van hetgemiddelde tekort aan verf in mijn potjes en Shetgemiddeldetekortinmijnsteekproef.Alshetechtteweinigiskrijgikeenboete.Vergelijking(1)beschrijftdesituatie.

Onderstaandetabelisgemaaktmet(1)en(2).S ~ N(µ,1),¼ (µ|H1)=exp(-µ).Sisdata,S0|H0~ N(µ0,1)=N(0,1).

S 0,91 1,5 1,645 2 2,193 2,63

BF(S) 1,12 1,91 2,23 3,43 4,46 8,92

P(S0 > S|H0) 0,181 0,067 0,050 0,023 0,014 0,006

Deα=0,05hoortbijS=1,645,welbekend.Steldatbekendisdatditdeoptimaletoetsdrempelisomnogeenextrasteekproeftetrekken.

Een denkbare opgave voor het tentamen statistiek voor bedrijfskundigen in 2020?a.laatziendatalsdieextrasteekproef2maalzo

duurwordtmenmoetgaanwerkenmeteenα van0,014.

b.laatziendatals¼ (H1)stijgtvan1/(2n+1)naar1/(n+1)α=0,181genomenmoetworden.

c.maakeenvoorbeeldvanveranderingendieα=0,006opleveren.

Tweezijdig toetsen

Alsmijnsteekproefdoetvermoedendatertewei-nigverfinmijnpotjeszit,meteenp-waardevan

0,03moetikdatdannegerenomdaterookteveelverfinmijnpotjeshadkunnenzitten?Economenleren dat ze moeten bedenken of ze eenzijdig oftweezijdigmoetentoetseneninhetlaatstegevalde p-waarde met 2 moeten vermenigvuldigen.Tamelijk onzinnig. Verschillende waarden van α zijnrelevantvoorteveelofteweinigverf.Dever-liesfuncties verschillen. En beter nadenken ga jeinditgevalalleenoverdeαdiehoortbijteweinig.Meer in het algemeen geldt dat p-waarden hunmagischebetekenisverliezenalsmenbesefthoeonzekermenisoverderelevanteα.

conclusie

DeklassieketoetsenBayesiaansbeslissenonderonzekerheidkunnengeïntegreerdwordentotietszinvols. En een gewoon voorbeeld over verf inpotjes biedt een ander perspectief dan abstractepogingen tot verzoening van beide richtingen(Andrews, 1994; Berger, 2003; zie ook De Vos &Francke, 2008). De grootste uitdaging is om stu-denten te leren een redelijke α te kiezen, zodathethurenvanBayesianenbeperktkanblijventotechtbelangrijkegevallen.

LiteratuurAndrews, D.W.K. (1994). The large sample correspondence

between classical hypothesis tests and Bayesian posterior odds tests. Econometrica 62, 1207-1232.

Berger, J.O. (2003). Could Fisher, Jeffreys and Neyman have agreed on testing? Statistical Science 18, 1-32.

de Vos, A.F. & Francke, M.K. (2008). Bayesian Unit Root Tests and Marginal Likelihood (www1.fee.uva.nl/pp/bin/1015fulltext.pdf)

Aart de Vos is econometrist en verbonden aan de faculteit der economische wetenschappen en bedrijfskunde van de Vrije Universiteit Amsterdam. E-mail: <[email protected]>

Ter gelegenheid van zijn pensionering vindt op 30 sep-tember 2011eenafscheidssymposium plaats over het onderwerp van dit artikel. Topspecialisten op dit gebied hebben hun medewerking toegezegd. Zie ook de website <http://personal.vu.nl/a.f.de.vos/>.

Page 8: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

8 STAtOR jul i 2011 |2

DeEersteKamerwordtgekozenviaeengetrapteverkiezing,deburgerskiezenProvincialeStatenle-dendievervolgensdeEersteKamerledenkiezen.Beginmaart2011warendeverkiezingenvoordeProvincialeStatenendoordevraagofdegedoog-coalitie een meerderheid zal halen is er dit jaarveelaandachtvoordeEersteKamerverkiezing.Inde landelijke media is er veel gespeculeerd overstrategischstemmen[1,2].Wantdoorstrategischesamenwerking kunnen partijen meer Kamerze-telshalen.Tijdvooreenwiskundigeanalyse.

Spelregels

BijdeEersteKamerverkiezingop23mei2011magelk Statenlid één stem uitbrengen. Omdat hetinwoneraantalperprovincieverschilt,wordendestemmengewogen.Dezeweging,dezogenaamdestemwaarde,wordtperprovinciebepaalddoorhetinwoner aantal te delen door het honderdvoudvan het aantal Statenleden in die provincie. Destemwaarde en het aantal Statenleden per pro-

vinciestaaninfiguur1weergegeven.Detotalewaardevandestemmenuitgebracht

op een partij is het behaalde stemcijfer van diepartij.DestemcijfersbepalendezetelverdelingindeEersteKamerendatgaatalsvolgt[3,4].Metdekiesdelerwordendezogenaamdekalezetelsver-deeld.Hetaantalkalezetelsdateenpartijkrijgtisgelijk aan het naar beneden afgeronde quotiëntvan stemcijfer en kiesdeler. Deze kiesdeler is desom van de stemcijfers gedeeld door het aantalKamerzetels. In2011 isdekiesdeler166561/75.Deresterendezetelswordenvervolgenséénvooréénverdeeld zodanig dat de eerstvolgende restzetelwordttoegekendaandiepartijwaarvoornatoe-kenningvandiezetelhetquotiëntvanstemcijferenaantalzetelshetgrootsteis.

Verkiezingen 2011

Intabel1staatperprovinciedezetelverdelingvandeProvincialeStatennadeverkiezingvanmaart2011. Stemt ieder Statenlid bij de Eerste Kamer-

EERSTE KAMERVERKIEZINGEN

Jacob Jan Paulus & Jaap Praagman

Page 9: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

9 STAtOR jul i 2011 |2

verkiezing op de eigen partij dan resulteert datin de stemcijfers zoals vermeld in de voorlaatstekolom. Delen door de kiesdeler en naar benedenafrondenleverthetaantalkalezetelsindelaatstekolom. (De lokale partijen zijn gebundeld in de

OnafhankelijkeSenaatsFractie,OSF.)Intotaalzijndaarmee69zetelsverdeeld.Deres-

terende6zetelswordenéénvooréénverdeeldvol-genshethiervoorbeschrevenprincipevangroot-stegemiddeldestemcijferperzetel,zietabel2.

GR FR DR OV FL GD UT NH ZH ZL NB LB Stem-cijfer Kale zetels

CDA 5 8 6 11 4 9 6 5 6 6 10 10 24238 10

VVD 6 6 9 8 9 11 11 13 12 7 12 8 34518 15

PVV 3 4 4 4 6 6 5 6 8 5 8 10 21064 9

PvdA 12 11 12 9 6 9 7 11 10 7 7 6 29639 13

GroenLinks 3 2 2 2 2 4 4 5 3 1 3 3 10656 4

D66 3 2 2 3 3 4 5 6 5 2 5 2 13781 6

SP 6 3 4 4 3 5 4 5 5 3 8 6 16825 7

ChristenUnie 3 3 2 3 3 3 2 1 2 2 5708 2

SGP 2 1 2 1 2 4 3248 1

PvdD 1 1 1 1 1 1 1 2438 1

50PLUS 1 1 1 1 1 1 1 2 3022 1

OSF 1 4 1 2 1424 0

166561 69

Figuur 1. Provincie (aantal statenleden) en stemwaarde

Tabel 1. Zetelverdeling van de Provinciale Staten na de verkiezing van maart 2011

Limburg (47)Noord-Brabant (55)

Zeeland (39)Zuid-Holland (55)

Noord-Holland (55)Utrecht (47)

Gelderland (54)Flevoland (39)Overijssel (47)

Drenthe (41)Friesland (43)

Groningen (43)

0 100 200 300 400 500 600 700

239446

641489

261365

101241

120

135151

98

Page 10: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

10 STAtOR jul i 2011 |2

Rekenen

Interessant wordt het doordat de Statenleden inprincipevrijzijninhunkeuzeendusookopeenanderepartijmogenstemmen.Datbiedtdemoge-lijkheid om afspraken te maken tussen samen-werkendepartijenenzodezetelverdelingtebeïn-vloeden. Al begin april was er sprake van eenmogelijke afspraak tussen 50PLUS en de OSF. AlsbijvoorbeeldalleOSFstemmenterechtkomenbijde 50PLUS partij, dan krijgt de 50PLUS partij eenstemcijfervan3022+1424=4446.Watdirecttweekalezetelsoplevertinplaatsvanéén.DittenkostevandeSP,omdaterdannogmaarvijfrestzetelsteverdelenzijn.Maarmeteenkleineverhogingvanhet stemcijfer, bijvoorbeeld doordat een ZeeuwsGroenLinks Statenlid zijn stem aan de SP geeft,kandeSPvoorbijdePVVschuiven.Watvervolgensvoor de gedoogcoalitie CDA, VVD en PVV weer

aanleiding kan zijn om een defensieve strategietezoeken,etcetera.Ditvraagtomeenwiskundigeanalysenaardestrategischestemmogelijkheden.

Geen vaste kiesdeler

Vanuit wiskundig perspectief is het werken metde kiesdeler en vervolgens één voor één verdelenvanderestzetelsonnodigingewikkeld.Waarhetinwezenomgaatishetstemcijferperverdeeldezetel.In het eerder genoemde voorbeeld, waar iederepartijopzichzelfstemt,krijgtdeSPdelaatsterest-zetelmeteenstemcijfervan2103,13perzetel.Iederetoegewezenzetelrepresenteertduseenstemcijfervan 2103,13 of meer. Omgekeerd geldt dat iederepartijookvoorelke2103,13aanstemcijfereenzeteltoegewezen heeft gekregen. Kortom de uiteinde-lijke zetelverdeling correspondeert met de zetel-

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

Stem

cijfe

r/

(zet

els +

1 )

Zete

ls

CDA 2203,45 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11

VVD 2157,38 15 2157,38 16 2030,47 16 2030,47 16 2030,47 16 2030,47 16

PVV 2106,40 9 2106,40 9 2106,40 9 2106,40 9 2106,40 10 1914,91 10

PvdA 2117,07 13 2117,07 13 2117,07 13 2117,07 14 1975,93 14 1975,93 14

GroenLinks 2131,20 4 2131,20 4 2131,20 5 1776,00 5 1776,00 5 1776,00 5

D66 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6

SP 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 8

ChristenUnie 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2

SGP 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1

PvdD 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1

50PLUS 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1

OSF 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0

70 71 72 73 74 75

Tabel 2. Verdeling van de restzetels in de Eerste Kamer na de Provinciale Statenverkiezing van maart 2011

Page 11: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

11 STAtOR jul i 2011 |2

verdelingdiewekrijgenalswe2103,13alskiesdelerhanteren.Hetheleprocesvanberekenenvankalezetelsentoekennenvanrestzetelskunnenwedusvervangen door het kiezen van de deler waarbijprecies75zetelswordenverdeeld.Probleemisech-terdatdezefeitelijkresulterendedelervantevorenonbekendisenafhankelijkvanhetstemgedrag.

In figuur 2 lichten we dit op een iets anderemaniertoe,waarhetaantalaaneenpartijtoetewijzenzetelsisuitgezettegendedeler.WeervoordesituatiedatalleStatenledenophuneigenpar-tijstemmen.Departijenzijngegroepeerdalscoa-litie(CDA,VVDenPVV)enoppositie(alleanderepartijen).Bijdegroenelijn,deofficiëlekiesdeler,zijn34zetelsaandecoalitietoegekenden35aandeoppositie.Doordedelerlagertekiezendandekiesdeler,wordenermeerzetelsverdeeld.Hetpro-cesvanrestzetelverdelingkomtdusovereenmethetnaarlinksverschuivenvandedelertotdaterprecies75zetelszijnverdeeld.

Doorhetkiezenvaneenanderestemstrategiekan een groep partijen de eigen curve beïnvloe-den.AlsbijvoorbeeldhetCDAeenstem,endaar-mee stemwaarde, aan de PVV geeft zal de trede5de restzetel PVV naar rechts verschuiven, maar

detrede1ste restzetel CDAschuiftjuistnaarlinks.DekansopeenrestzetelvoordePVVzouhiermeemogelijk verbeteren omdat het stemcijfer perzetelwordtverhoogd.Echter,dekansopeenrest-zetelvoorhetCDAzalverslechteren.

wiskundig model

Om een optimale strategie te bepalen voor eengroeppartijenGmodellerenwehetprobleemalsvolgt.LaatvariabeleXpij hetaantalstemmenzijndat in provincie p door partij i uitgebracht is oppartij j,en laatωpdestemwaardezijn inprovin-ciep.DanishetverkregenstemcijfervanpartijjgelijkaanΣp,iωp Xpij.LaatvariabeleDdedelerzijnendevariabeleZjhetbehaaldeaantalzetelsvanpartij j.Metαpigevenwehetaantalstatenledenaandatpartijiinprovinciepheeft.Derandvoor-waardenzijnalsvolgt.Erzijn75zetelsteverdelen;Σj Zj = 75. Het aantal stemmen uitgebracht komtovereenmethetaantalstatenleden;Σj Xpij=αpi.Hetstemcijfergeefteenboven-enondergrensophetaantalzetelsvaneenpartij;

Zj≤Σp,iωp Xpij< Zj+1.

D

1950 2050 2150 2250 2350 2450

40

39

38

37

36

35

34

33

32

31

4de restzetel PvdA

3de restzetel GL

2de restzetel VVD

1ste restzetel CDA

6de restzetel SP

5de restzetel PVV

Coalitie

Oppositie

Kiesdeler

Figuur 2. Het aantal aan een partij toe te wijzen zetels uitgezet tegen de deler

Page 12: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

12 STAtOR jul i 2011 |2

Nu we dit model geformuleerd hebben, lopenwetegentweedingenaan.Wattedoenmethetwiskundiggezienmoeilijkoplosbarekwadratischprobleem en wat is de strategie van de partijendie niet in groep G zitten? De sleutel voor beideproblemen zit in het tijdelijk vastzetten van dedeler.

Door het vastzetten van de deler wordt hetmodellineaireneenvoudigeromoptelossen.Welatendaarmeetijdelijkdeeisvallendat75zetelsverdeeldmoetenworden.Wordenerminderdan75verdeeld,danisdedelerklaarblijkelijktehooggekozen.Enalsermeerdan75wordenverdeeld,danisdedelertelaaggekozen.Eenbinary search opdedelerleidtsneltoteengoedekeuze.

Vooreengegevendelerkaneengroeppartijennuhaarbestestrategiebepalen,onafhankelijkvandestrategievandeanderen.Ofbijdiedelerprecies75 zetels worden verdeeld, is echter wel afhanke-lijkvandestrategievandeanderepartijen.

Laat de parameterβij gelijk zijn aan 1 als par-tijenienjtotdezelfdegroepen0alsdatnietzois.EnalswedevariabelevoordedelerDvervan-gendooreenvastgetalδ,wordthetILPmodelalsvolgt:

maximize X

j zj

s.t. X

j Xpij = αpi p,i,

Xpij ≤ αpi βij p,i,j,

Zj ≤ Σp,i ωp Xpij j δ

Xpij ,Zj integer.

Uitkomsten

Zoalseerdergeschetstkandegedoogcoalitiehaarkansopeen37stezetel (derestzetelvandePVV)verstevigendooreendeelvanhetstemcijfervanhetCDAnaardePVVteverschuiven.Zoekennaardegrootstewaardevanδ waarvoordegedoogcoa-litie37zetelskanhalen,levertdestrategieopdiestaatafgebeeldinfiguur3.Indezestrategiegaateen stemwaarde van 506 van het CDA naar dePVV,doorindeprovincieZuid-HollandéénCDA-ertelatenstemmenopdePVVenomgekeerdindeprovincieGroningenéénPVV-erophetCDA.

Figuur 3. Strategie voor het vinden van de grootste waarde van δ waarvoor de gedoogcoalitie 37 zetels kan halen

1950 2050 2150 2250 2350 2450

40

39

38

37

36

35

34

33

32

31

Coalitie

Coalitie(37max)

Kiesdeler

Page 13: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

13 STAtOR jul i 2011 |2

Voor elk zetelaantal kan gezocht worden naareenstrategiediebijeenzogrootmogelijkewaardevanδ datzetelaantalbehaalt.Ofwel,elkzetelaan-talheefteensterkstestrategievoorhethalenvandataantalzetels.Hetresultaatstaatweergegeveninfiguur4alsCoalitie (X max);hetmaximaalhaal-bare zetelaantal gegeven een deler. In de vorigegrafieken correspondeerde een lijn met één stra-tegie,maardezelijncorrespondeertmethetmaxi-maalhaalbareoverallemogelijkestrategieën.Destrategieverschiltduspertredeindegrafiek.

Voor de oppositie kan een vergelijkbare ana-lyse gemaakt worden. Het lijkt politiek gezienniet realistisch om de oppositie als één grotesamenwerkende groep te beschouwen. Ter illu-stratiekiezenwehiervoorviersubgroepen;Groep1bestaatuitPvdA,SP,D66enGroenLinks,groep2uit ChristenUnie en SGP, groep 3 uit alleen PvdDengroep4uit50PLUSenOSF.Binnendezebeper-kingishetmaximaalhaalbarevoordeoppositieafgebeeld in figuur 4, naast het eerder bepaaldemaximaalhaalbarevoordecoalitie.

Alsallepartijen,gegevendezegroepsindeling,debestestrategievolgenzal decoalitie36zetelskrijgen en de oppositie 39 zetels. Het valt op dat

bij optimale strategieën de 74ste en 75ste zetelworden verdeeld bij delers die heel dicht bij deofficiëlekiesdelerliggen.

Open eindjes

De wiskundige kant van de verkiezing is hiermeebelicht, er zijn echter nog wat losse eindjes. Eenbewijs van NP-compleetheid en het bestaan vaneen puur Nash evenwicht zijn waarschijnlijk nietmoeilijktegeven.Echter,groepsindelingenenstem-afspraken zijn politieke kwesties, die ongetwijfeldveelmoeilijkerzijndandebeschrevenwiskunde.

Literatuur1. NOS dossier Strijd om de Eerste Kamer: http://nos.

nl/dossier/210939-eerste-kamerverkiezingen-2011/thema/serie-strijd-om-de-eerste-kamer/

2. Eén Vandaag uitzending Verkiezingen een strijd op landelijk niveau, 17 februari 2011: http://beta.uitzen-dinggemist.nl/afleveringen/1062892

3. Website Eerste Kamer: www.eerstekamer.nl/4. Website Kiesraad: www.kiesraad.nl/

Jacob Jan Paulus en Jaap Praagman zijn beiden werk-zaam bij Consultants in Quantitative Methods (CQM). E-mail: <[email protected]> & <[email protected]>

Figuur 4. Het maximaal haalbare zetelaantal gegeven een deler

1950 2050 2150 2250 2350 2450

40

39

38

37

36

35

34

33

32

31

Coalitie (X max)

Oppositie (X max)

Kiesdeler

Page 14: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

14 STAtOR jul i 2011 |2

Weschrijven2004,eenjaarwaarinstevigegroeivoorTNTExpresseensoortnatuurconstantewas.OpeennamiddagheeftophetCentERforAppliedResearcheenaantalmenseneenkortoverzichtjegemaakt wat de grote 4 Express spelers (UPS,Fedex, DHL en TNT Express) aan optimalisatiededen. Voor UPS en Fedex is redelijk wat in deliteratuur (business en wetenschappelijk) te vin-den.VoorDHLooknogwelwatmaarvoorTNT...Met deze boodschap naar TNT getogen, alwaarwe (achteraf) blijkbaar op het juiste moment bijde juiste man aan tafel kwamen: Marco Hen-driks, toendertijd verantwoordelijk voor business improvementinExpress’netwerken.InditartikelbelichtenwewaterzoalbijkomtkijkenomOpe-rations Research succesvol toe te passen in eengrootbedrijfalsTNT.

wat is een Express netwerk?

Grote Express spelers vervoeren dagelijks mil-joenenpakjeswereldwijdvanzakelijkeadressennaar zakelijke adressen, en in toenemende mateook consumentenadressen (e-commerce). Dezeverzending kent specifieke tijdsrestricties, zowelin het aantal transit dagen als de tijd waarvoorhetmoetwordenafgeleverd(voor9:00uur,voor12:00uurofgeheledag).Dealgemeneinfrastruc-tuurdiegekozenwordtisereenvanveledepotsvan waaruit busjes rondrijden om zendingenop te halen en die naar het depot te brengen.Vandaaruitwordenzemetgrotetrucksnaareenhub,zegmaareengrootsorteercentrum,gebrachtwaarze’snachtsverderwordengesorteerdnaar,óf de volgende hub, óf het einddepot. De trucks

Hein Fleuren, Marco Hendriks & Annelies Woutersen

Hoe optimalisatie in een aantal jaren in het DNA van TNT Express is gekomen

Page 15: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

15 STAtOR jul i 2011 |2

rijden volgens een vooraf uitgedacht schema envertrekken op tijd, of de truck nu vol is of niet.Eenmaal aangekomen op het einddepot wordendepakjesweermetbusjesvervoerdnaardeafle-veradressen.Ophalenenwegbrengenduidenweaan met PuD (Pickup & Delivery) en het verkeertussendepotsenhubsmetLinehaul.PuD-vansenlinehaul-trucks worden over het algemeen alle-maal ingehuurdbij transportbedrijvendierijdenonderTNT-vlag.

Eerste project: Netwerk Italië

Het idee waarmee we aankwamen bij TNT wasleuk maar moest eerst in het eigen jargon ver-taald worden en, TNT is commercieel, er kwamgewoon een tender waarop 5 bedrijven hebbengereageerd. Na selectie bleef de combinatie vande Universiteit van Tilburg en ORTEC over. Wemochten aan de slag met het linehaul-netwerkvan Italië om onze bewering waar te maken datmet Operations Research voordelen te behalenwaren.

De verleiding is groot, zeker voor OR’ers, omdirectinmodellentegaandenkenmaarweheb-bendit,ookmethulpvanTNT,kunnenweerstaan.We zijn begonnen met een goede data-analy-se. Met behulp van AIMMS hebben we diversebestanden van zendingen, linehaul-schema’s,voertuigen en geografische gegevens aan elkaargekoppeld. Dit bleek, na de altijd weer nodigecleaning van gegevens, al snel een goudmijn tezijn om allerlei snelle verbeteringen te vinden.Voorbeelden zijn voertuigen die halfvol relatiefdicht achter elkaar in dezelfde richting reden,voertuigendieeentelagebeladinghaddenmaarwaarvandeladingmakkelijkviaeenandereroutekon gaan. Dit lijkt triviaal maar is het zeker nietalsmenbedenktdaterinditnetwerkzo’n500tot600 trucks elke nacht rondrijden met dagelijksredelijk wisselende volumes. De netwerken met

alhunaansluitingendiegehaaldmoetenwordenlaten zich goed vergelijken met een spoorboekjezoalsdatbijdespoorwegengehanteerdwordt.

Nadedata-analysewashetveelhelderderwaardegroteknelpuntenzatenenkondenwegerichtgaan optimaliseren. In dit netwerk is dit metShortrec (routeringspakket van ORTEC) gebeurd,waar uiteraard de TNT-specifieke kenmerkenmoesten worden ingebracht. In de optimalisatiehebbenweuiteindelijkgekozenomeenlangelijstvan locale verbeteringen aan het managementvoorteleggenenniethetschemaradicaalomtegooien.Dezelangelijstvanverbeteringenisdoorde transport-managers van Italië geheel doorge-nomenophaalbaarheid.Verschillendeaangedra-gen verbeteringen sneuvelden vanwege diversepraktijkredenen,maaruiteindelijkbleefeengro-terdanverwachttebesparingover:zo’n5procentop een netwerk van vele tientallen miljoenenkostenper jaar.Eind2005wasdeeerstemutatieinhetDNAvanTNTeenfeit.

Volgende projecten

De interesse was gewekt en volgende netwerklinehaul-projecten dienden zich aan in landenals Frankrijk, Duitsland, Slovenië en Spanje. Ookdezeprojectenhebbenwegedaanmetdeontwik-kelde tools en methodologieën, maar daarnaastontstond er een sterke behoefte aan het delenvan kennis op optimalisatiegebied maar ook opimplementatiegebied.Methetlaatstegaathetermet name om hoe een aangetoonde besparingook werkelijk gerealiseerd kan worden en hoedeovergangzosoepelmogelijkkanverlopen.DitresulteerdeindeoprichtingvaneenzogenaamdeCOP(CommunityofPractice)waardiversedeelne-mers uit de landen maar ook kennisorganisatiesen zelfs het World Food Program bij aanschoof.Driekeerperjaarkomenwevoortweedagenbijelkaar om een specifiek onderwerp van netwerk

Page 16: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

16 STAtOR jul i 2011 |2

optimalisatie en alles wat daarmee samenhangtte bespreken. Belangrijk hierbij is dat een der-gelijke kennisclub niet een theekransje wordtmaardaterookechtebeslissingenwordenvoor-bereid die door het management kunnen wor-den bekrachtigd (of verworpen). Dit vereist eenbehoorlijksterkeaansturingaangezienspecialis-tennogaleensdeneiginghebbenuittewijdenenergveeldetailstewillenmeenemen.

Belangrijk binnen elk optimalisatieprojectvan TNT is de driehoek: People & Organisation,Processes & Procedures en Tools & Technology.Aan alle deze drie aspecten moet ruim aandachtworden gegeven, het moet qua uitwerking goedop elkaar aansluiten en als geheel worden afge-tekenddoorhetmanagement.Eenpaarvoorbeel-den:(optimalisatie)-toolskunnennogzogoedzijn,alszenietingebedzijninde(eventueelverander-de)processendanwerkenzeniet.Alsbijprachtigeoplossingen de mensen niet meewerken, of deorganisatie heeft andere performance indicato-ren,ookdanzalerweinigeffectindepraktijkzijn.

Andere gebieden

Na twee jaar veel in de netwerkhoek te hebbenuitgebouwd,kwamenooklangzamerhanddevra-genofook indeanderesupply chain-onderdelenvan TNT, namelijk PuD, de luchtvrachtdivisie ende depots & hubs geoptimaliseerd kon worden.OpeenzelfdewijzeenmethetzelfdeaccentopdehierbovenbeschrevendriehoekzijnhierprojectenopgestartenCOP’sopgezet.

Nuwordtermetvehicle routing-softwaredrif-tig geoptimaliseerd in het ophalen en afleverenvan zendingen. De inzet van personeel in dedepots en hubs wordt geoptimaliseerd. Er zijntoolsdieondersteunenbijhetinrichtenenopzet-ten van nieuwe hubs en depots. Complete TNT-specifieke oplossingen zijn uitgewerkt voor denetwerkenenzwareMIP-modellengebouwdvoor

de optimalisatie van de Express luchtvloot dieruim40vliegtuigenomvat.

Om een indruk te geven: vorig jaar zijn in aldezegebiedensamenruim100kleinereengrotereoptimalisatieprojectenuitgevoerd!

Suboptimalisatie?

Vanhetbeginafaanhebbenweonsgerealiseerddat de complete supply chain geoptimaliseerdmoet worden. Maar als er nog veel opgebouwdmoet worden is het toch verstandig om met desupply chain onderdelen te beginnen. Supply chain denken is lastig in een groot bedrijf waaréén van de onderdelen al een wereld op zich ismeteengrotecomplexiteit.Hetzoubijvoorbeeldkunnen betekenen dat we moeten investeren inmensen in depots en hubs (of sorteermachines)waardoor deze duurder worden terwijl we devoordelenindenetwerkenenPuDbehalen.Maarwat als de depot/hub-manager onder vrij zwaretargetsstaat?

Enigszins geholpen door de crisis eind 2008zijnwedeeerstecompletesupply chainmodellengaan ontwikkelen. De eerste modellen zijn sim-pele ‘doorrekenmodellen’ om de complete ketenindoorTNTzelfaangedragenalternatievendoorterekenen.Maarschijnbedriegthier:hetdoorre-kenmodelvandeketenbevatalsonderdelenweerzo’nvieroptimalisatiemodellenenheelveelbere-keningen. Een gemiddelde run laadt 60 miljoendata-elementen en heeft een uurtje rekentijd opeenzwarePCnodig.

Verdere kennisopbouw

Gedurende de afgelopen jaren ontdekten we dathetheellastigisommetmedewerkersinhetveldte werken die onvoldoende de tools en de achter-liggendeideeënbegrijpen.Ditheeftgeleiddatwe,

Page 17: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

tezamenmetTiasNimbas,deGO-academy(GOvanGlobal Optimisation) hebben opgezet. De GO-aca-demykent5modulesvanelkvierdagen,welkena2jaartijdwordtafgerondmeteenafstudeeropdrachtvaneenvijftalmaandenindepraktijkvandeTNT-landen.Inapril2011hebbenwedetweedelichtingvanveertigSupplyChainMasters,letterlijkvanuitdehelewereld,hundiplomakunnenoverhandigen.DeinhoudvandeGO-academywordtookconstantaangepast aan veranderingen in de strategie vanExpress.Opditmomentzijnwebezigmetdevoor-bereidingvanalweerhetvijfdecohort.Ditbetekentdat we in enkele jaren tijd honderden mensen ophetzelfdekennisniveaubrengendiedaarnaastooknogeenseenzelfde‘taal’spreken.

En nu verder?

Wellicht is de indruk ontstaan dat we wel bijnaklaar moeten zijn. Niets is minder waar. Er valtvoor OR-ers nog heel veel te doen, vooral in hettoepassen(deployment)vanallekennis.Maarookinfrastructuuroptimalisatie, integratie van lean-conceptenenoptimalisatie,supply chaindenkensamenmetdeklantengeoptimaliseerdedepots&hubsstaannogmaaraanhetbegin.Dit,ondanksdatTNTineenhoogtempogespecialiseerdeafde-lingenhiervoorheeftopgezet.HetlijstjewaarmeewevijfjaargeledennaarTNTgingenisallangnietleegmeermaarhelaas/gelukkigzitdeconcurren-tieooknietstil...

Hein Fleuren is hoogleraar Operations Research aan de Universiteit van Tilburg en is gespecialiseerd in de prakti-sche toepassing van Operations Research. E-mail: <[email protected]>

Marco Hendriks is als Director Optimisation & Engineering werkzaam bij TNT Express.E-mail: <[email protected]>

Annelies Woutersen is als Supply Chain Consultant werkzaam bij ORTEC. E-mail: <[email protected]>

21 tot en met 26 augustus 2011Het58ste World Statistics CongressvanhetInter-national Statistical Institute (ISI) vindt in Dublinvan21–26augustus2011plaats.Hetwetenschap-pelijk programma omvat diverse, interessanteonderwerpen. Op 24 augustus is er een specialethemadag ‘Water, quality and quantity’; statis-tische kwesties met betrekking tot water en dewaterkwaliteit staan dan centraal. Het tweejaar-lijks congres wordt bezocht door statistici die opverschillendeterreinenwerkzaamzijn,zoalsindefinanciëlesectorenhetbedrijfsleven,bijdeover-heid en wetenschappelijk onderzoeksinstitutenofinhetonderwijs.Hetcongreswileenontmoe-tingsplekzijnomervaringenenexpertisetedelenenomtotnieuweinzichtentekomen.Zievoorhethele programma, aanmelding en indienen vanpapersdewebsite<www.isi2011.ie>.

17 tot en met 19 augustus 2011De tweejaarlijks conferentie van de Internatio-nal Association for Official Statistics (IAOS) dievan 17 – 19 augustus in Belfast wordt gehouden,kan gezien worden als een‘satellite’ van het ISI-congresinDublin.Hetthemavandeconferentieis ‘The Demography of Ageing and Official Sta-tistics’. Centraal staan de omvang en kenmerkenvan de vergrijzing en de impact op het socialeen economische beleid. IAOS wil de kennis overoverheidsstatistieken bevorderen en het gebruikvan effectieve en efficiënte statistische dienstenwereldwijd stimuleren. De IAOS-conferentie isgeorganiseerddoorhetNorthernIrelandStatisticsand Research Agency (NISRA), in samenwerkingmethetCentreforAgeingResearchandDevelop-mentinIreland(CARDI)endeQueen’sUniversityin Belfast. Zie voor meer informatie de website</www.nisra.gov.uk/IAOS2011.html>.

A G E N D A

17 STAtOR jul i 2011 |2

Page 18: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

18 STAtOR jul i 2011 |2

De Britse statisticus Karl Pearson (1857-1936)neemt in de geschiedenis van de statistiek eenonwrikbare plaats in. Hij geldt met Francis Gal-ton en Ronald Fisher als de wegbereider van demoderne statistiek en was een belangrijk gang-maker van de probabilistische revolutie die zicheindnegentiendeeeuwindiversedisciplinesvol-trok. Dat gebeurde in aloude, gevestigde weten-schappen als de fysica (statistische mechanicavan Boltzmann, Maxwell en Gibbs), maar ook innieuwe, opkomende disciplines, zoals de soci-alewetenschappen(QueteletenlaterDurkheim),de psychologie en vooral de biologie (evolutie-theorie, genetica, zoölogie), die eerst in nauwewisselwerking met de statistiek tot bloei kwam.

DebiometricusPearsonen(later)demendeliaanFishernamendaarbijhetvoortouw.OoknuisdenaamvanPearsonnogsteedsverbondenaanvelestatistischeinzichtenenmethoden:correlatie-enregresssie-analyse,deChi-kwadraatgoodness-of-fitnesstoets,aantermenalsstandaardeviatieenkurtosisenuiteraardaanzijnfundamentelewerkophetgebiedvan(familiesvan)scheveverdelin-gen.

filosofie en statistiek

Pearsons intellectuele erfenis overstijgt de sta-tistiek in engere zin. Hij was evenzeer een veel-

Richard Starmans

Karl Pearson tussen Statistiek en filosofie

Page 19: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

19 STAtOR jul i 2011 |2

zijdig en vernieuwend filosoof, die blijk gaf vaneen diepgaand inzicht in de wijsgerige kernpro-blemen die het tijdsgewricht waarin hij leefdebepaalden. Hij hield zich actief bezig met degrondslagen van wetenschapsgebieden als wis-kunde, natuurkunde en evolutietheorie, maarbewoog zich eveneens moeiteloos op het terreinvanpolitiekefilosofieenletterkunde.Vooralzijnlijvige The Grammar of Science (GoS), dat hij op35-jarige leeftijd in 1892 publiceerde, biedt eenrijk palet aan wetenschapsfilosofische thema’s;hetinductieprobleemencausaliteit,derelativiteitvanruimteentijd,deontologischestatusvandewerkelijkheid,evolutietheorieenethiek.Hetwerkbeleefdeveleherdrukkenenkendezowelbefaam-debewonderaars(Einstein)alstegenstanders(defilosoofC.S.Peirce).

Filosofie en statistiek vormen bij Pearsonbovendien twee zijden van de zelfde medaille.Kennisvandeaardvandezeverbondenheidisdanookonontbeerlijkvooreenjuistewaarderingvanzijn nalatenschap. Vooral GoS geldt als de sleu-tel tot zijn statistische werk. Kennistheoretischbetoont Pearson zich in GoS een uitgesprokenempirist.HijschaartzichdaarmeeineenaloudeBritse, anti-metafysische traditie (Bacon, Locke,Hume),dieookindenegentiendeeeuwveleaan-hangers kende en waarvan John Stuart Mill enHerbertSpencerdeinvloedrijkstewaren.

Anti-causalist

MaarPearsongingverderdanzijnillustereland-genoten en bekende zich tot de fenomenalisti-schefilosofievanzijnvroegereleermeesterErnstMach, volgens welke doctrine de werkelijkheidbestaatuitelementen(kleuren,trillingen,tijden),die zich manifesteren in een stroom van sense dataofdirectegewaarwordingen.Dezezijnneu-traal (noch geestelijk, noch materieel) en vanuitdeze gewaarwordingen kunnen zowel materiële

objectenalsbewustzijnsinhoudenwordengecon-strueerd.Dewetenschapmoetgeenverklaringennastreven of causale mechanismen postuleren,maarheeftprimaireendenkeconomischefunctie;de stroom van primaire sensaties moet zo goedmogelijk in kaart worden gebracht en samenge-vat in een overzichtelijke taal. Empirische gene-ralisaties, zoals Boyle’s gaswet, waren nog weltoegestaan, de in die tijd net opgekomen kineti-schegastheorieuiteraardniet.OokPearsonstondhuiverachtig tegenover het toekennen van eenontologischestatusaanbegrippendienietdirectgekoppeldwarenaanzintuiglijkewaarnemingen,zoals niet-verifieerbare theoretische constructenen hij verwierp het zoeken naar een diepere ofhogere werkelijkheid die schuilgaat achter deverschijnselen.

Na of naast Bertrand Russell werd hij debelangrijksteanti-causalistvanzijntijd;ookzijnbijdragen aan de correlatieanalyse moeten indit licht worden bezien. Daarnaast legt Pearsonin GoS een sterk positivistische, om niet te zeg-gen sciëntistische visie aan de dag. Hij stelt eenbijkans onbegrensd vertrouwen in de modernewetenschap als regulerend mechanisme voor desamenleving, dat van mensen volwaardige bur-gersmoestmakenendestaatopwetenschappe-lijkeleestzouschoeien.Deverwantschapmetdegrondlegger van het positivisme, August Comteis indezeonmiskenbaar.Pearsoncombineertditalles tot slot met een idealistische, dat wil zeg-gen antimaterialistische filosofie over de aardvande(kenbare)werkelijkheid.DezebestaatnietonafhankelijkvandemenselijkegeestenPearsonbeschouwt wetenschap vooral als een classifica-tie en analyse van de inhoud van de geest. Haardomein wordt daarmee veeleer het bewustzijndan een onafhankelijk hiervan gegeven externewereld.

Het belang van de Pearsoniaanse revolutievoordeideeëngeschiedenisligtdeelsindewijzewaarop hij deze wijsgerige inzichten uitwerkt

Page 20: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

20 STAtOR jul i 2011 |2

in een constructieve statistische methodologie.Minstenszobelangrijkisdaarbijdatzijnwerkhetsluitstuk vormt van een nieuw wereldbeeld, dattotstandkwamaanheteindvandenegentiendeeeuw.Filosofischgezientekendezichindieeeuween historisering van de werkelijkheid af, kwamtweeduizendjaarsubstantiedenkenonderdruktestaanenvondvolgensdefilosoofIanHackingeen‘erosievanhetdeterminisme’plaats.

Daaraan vooraf ging echter een ruim twee-duizend jaar durend emancipatieproces van deverwante en weerbarstige begrippen variatie enverandering, waarmee filosofen, wetenschappersenwiskundigenvanoudsherhebbengeworsteld.Dat begon al bij de Griekse natuurfilosofen, dieeen verklaring zochten voor de verschillendeaspectenvanverandering:veranderingvanplaats(beweging), ontstaan en vergaan, veranderingvan hoedanigheid en hoeveelheid. Het bestaanervan werd dikwijls ontkend, onmogelijk geachtofgereduceerdtotnon-verandering.Variatiewerdbeschouwd als afwijking van een regel of norm,die in het gunstigste geval moest worden ver-klaard. De noties stonden voor onvolmaaktheidenonvoorspelbaarheidenwerdensomszelfinco-herentgeachtop logischeenmetafysischegron-den(Parmenides).Metnamedegrilligheidvande(levende) natuur en de veelvuldigheid van haarverschijningsvormenvormdeneenobstakelvooreendeterministischwereldbeeldenstondeneenwiskundige benadering van de verschijnselen indeweg.ZelfspioniersvandestatistiekalsLaplace(‘errorfuncties’) en Quetelet (‘l’homme moyen’)kondenerslechtsenigegreepopkrijgendoordegegevens in het keurslijf van de normale verde-lingtedwingen.

Inferentiële statistiek

Mede door de evolutietheorie van Wallace enDarwin kreeg de opvatting dat variatie inherent

isaandenatuurendeaardeeenlangegeschiede-nis van verandering kent, vaste grond onder devoeten.Galton,onvermoeibaarpleitbezorgervoormathematiseringvandewetenschap,overtuigdezijnvriendPearsondatvariatiezichweldegelijkvoor een wiskundige behandeling leende, zon-derpejoratieveduidingenvanafwijkingen,error-functies, etcetera. Pearson deed daaraan rechtdoor de variatie niet te identificeren in ‘errors’,maarindeverschijnselenzelf(gecodeerdindata),enterugtevoerentotverschillende(klassenvan)kansverdelingen.

Een cruciale stap zette hij met zijn vroegewerkoverscheveverdelingen.OpbasisvangroteaantallendoorGaltonverzamelde(biometrische)data zag hij in dat vele verschijnselen niet nor-maal,dochscheefwarenverdeeldenmetbehulpvan vier parameters (gemiddelde, standaardaf-wijking, scheefheid en welving) konden wordenbeschreven en geclassificeerd. Volgens Pearsonkonzelfsdeeenheidvandewetenschappenwor-den gevonden in deze constructieve, zij het zeerarbeidsintensievemethode.DevariabiliteitindenatuurmanifesteerdezichineenpuntenwolkvanmetingenenPearsonzochtnaarhet‘bestfitting’model,defunctiediehetbestepastebijdedata;veeleereenzuinigebeschrijving,daneencausaal,onderliggend mechanisme waardoor deze datawaren gegenereerd. Als eerste gaf hij daarmeekansverdelingen een volwaardige plaats in dewetenschap en opende hij de deur naar inferen-tiëlestatistiek.

Pearson zag de wereld op een niveau vanabstractie waarbij data, variatie in data, datage-nererende mechanismen en parameters van deverdelingen de werkelijkheid veeleer coderen enopbouwen en niet zozeer een (vermeende) fysi-sche werkelijkheid representeren of afbeelden.Gesteund door zijn macheaanse en idealistischefilosofie interpreteerde hij zijn kansverdelingenopeenwelhaastPythagoreïschemanier,alwerdPearsonsuniversumnietgerealiseerddoorgetal-

Page 21: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

21 STAtOR jul i 2011 |2

len, getalsverhoudingen en getallentypen, maardoor kansverdelingen met bijbehorende para-meters en vormden de puntenwolken de objec-ten van de wetenschap. Het wereldbeeld verloorweliswaar veel van zijn directe aanschouwelijk-heid, maar paradoxaal genoeg was de werkelijk-heidalsstatistischeverdelinginmacheaansezin‘waarneembaar’, dichtbij de gegevens, kenbaar;eenbeschrijvingvandefeitelijkedata,eengrote,maar eindige deelverzameling van de verzame-lingvanallemogelijkemetingen,alleenbeschik-baar ineen‘ideale’ situatie.Zolangdezedeelver-zamelinggrootgenoegwaszoudendeberekende‘parameters’ dezelfde zijn als die van de geheleverzameling.

Voor zover Pearson een concept van statisti-sche inferentie kende, was dit vooral gebaseerdop het idee van de goodness-of-fit. Van daad-werkelijk significance testing of maximum like-lihood estimation, of zelfs van een volwassenstatistischmodelbegripisdanuiteraardnoggeensprake.Daartoediendenanderewegentewordeningeslagen. Dat deed bij voorbeeld Pearsons jon-gere tegenstrever Fisher, die niet werd beperktdoor macheaanse doctrines en dieper in hetPythagoreïsche universum schouwde. Voor hemwas de werkelijkheid een abstracte wiskundigeverdeling, niet waarneembaar of samenvallendmet de gegevens, welke slechts een (aselecte)steekproef vormden, met een eigen verdeling.Waarheidwaseenvaste,maaronbekende,popu-latiegrootheidenkonslechtswordengeschat.

Eerste filosoof van de statistiek

HetisopmerkelijkdatPearsonswerkindemoder-neepistemologieallerminsttotdecanonbehoort.Allereerst was Pearson een wegbereider van hetlogischpositivismedatindejarentwintigvandevorigeeeuwinWenenenBerlijnopkwam.Boven-dien domineert in de contemporaine weten-

schapsfilosofie de ‘probabilistische invalshoek’.Waarschijnlijkheids-modellenspeleneencrucialerol in moderne benaderingen van causaliteit, inhet Wetenschappelijk Realisme Debat, en uiter-aard in de (Bayesiaanse) confirmatietheorie, dieal decennia lang een toonaangevend paradigmavormtbinnendekennisleer.Klassiekefilosofischevragenwordeninprobabilistischetermengeduid.Kernvragen als: Wat is de werkelijkheid? Bestaatdeze onafhankelijk van de geest? Hebben we ertoegangtoe?Zo, ja,hoe?Kunnenweerwareuit-sprakenoverdoen?Zoja,watiswaarheidenhoeisdezeverbondenmetdewerkelijkheid?

Pearson was de eerste statisticus die ant-woorden voorstelde op al deze vragen, die hijcombineerde met een constructieve statistischemethodologie.Juistomdathijzichbewoogophetsnijvlak van statistiek, filosofie en methodologiewerd hij feitelijk de eerste filosoof van de statis-tiek.Immers,defilosoofvandestatistiekzalnieu-we statistische theorieën en paradigma’s altijdtrachten te verankeren in deze kernvragen en ze(mede) beschouwen en beoordelen als pogingenom deze te beantwoorden. Pearson stond nietalleen.Wellichtminderexpliciet,maarnietmin-der doorwrocht gaf de generatie na hem (Fisher,Jerzy Neyman en Egon Pearson, Bayesianen alsSavage en De Finetti) zich rekenschap van dezekwesties.De‘ScienceofData’begonmetdevraagnaardeaardenstatusvandataenvooralnaarderelatiemetdewerkelijkheid,waaraanzijtochopdeeenofanderemanierontleendzijn,vanwaar-uitzijzijngegenereerd,diezijmoetenrepresente-ren,benaderen,coderen,simuleren,vervangenofwellichtzelfsoverbodigmaken;zulksafhankelijkvandeingenomenfilosofischepositie.

Richard Starmans is verbonden aan de Faculteit Bètawetenschappen (Department of Information and Computing Sciences) van de Universiteit Utrecht. Hij doet onderzoek op het snijvlak van filosofie, statistiek en informatica.E-mail: <[email protected]>

Page 22: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

22 STAtOR jul i 2011 |2

In de wetenschappelijke literatuur wordt doorvrijwelalleonderzoekersklassiekenulhypothesetoetsing(NHT)gebruiktomantwoordtegevenopdeonderzoeksvraag.NHThoeftechternietpersede beste keuze te zijn om de onderzoeksvraag tebeantwoorden.Inditartikel laatikzienwaaromen introduceer ik vervolgens een recent ontwik-kelde methode die een veelbelovend alternatiefbiedt,namelijkBayesiaanseModelSelectie(BMS).

Informatieve hypothesen

Onderzoekershebbenvaakbepaaldeverwachtin-genoverhoedewerkelijkheideruitziet.Verwach-tingen en hypothesen kunnen gebaseerd zijn opeerder (literatuur-) onderzoek, of wetenschappe-lijk debat. Het doel van veel onderzoekers is hetevaluerenvandezeverwachtingenomtebepalenwelke de beste is. Met andere woorden, welkeverwachting de meeste steun krijgt van de ver-zamelde data. Verwachtingen zijn geformuleerdin termen van wat ik informatieve hypothesennoem.Ditomdatera priori,datisvoordaterdatazijn verzameld, informatie bestaat over bijvoor-beelddeordeningtussentwee(ofmeer)groepsge-middeldengebaseerdopeeneerdergepubliceerdartikel: HA : μ1 < μ2< μ3< μ4 , waarbij het teken‘<’aangeeft dat het eerste gemiddelde (μ1) lager isdan het tweede gemiddelde (μ2), enz. Een anderetheorieverondersteltechtereenandereordening,bijvoorbeeld HB : μ1 < μ2< μ3 = μ4. De vraag is nuwelkevandezetweeinformatievehypothesendebesteis.

Onderzoekers willen deze verwachtingen welevalueren,maarzekunnenditnietzomaardoen.Het is namelijk vrijwel onmogelijk om met NHTcomplexe informatievehypothesenteevalueren.Alsonderzoekersdittochproberenomdatergeenalternatieven voor handen zijn, dan ontstaan erenkeleproblemen.

Wat gaat er mis?

Er is door de tijd heen veel literatuur versche-nen met kritiek op het gebruik van NHT en hetgebruik van p-waarden. Ik zal me nu voorname-lijkrichtenopwaarhetmisgaatbijhetevaluerenvaninformatievehypothesendoorNHT.

Met NHT moet vaak een hele stapel outputgeëvalueerd worden om een onderzoeksvraag tebeantwoorden: F-toets, post-hoc toetsen, groeps-gemiddelden, etc. Deze stapel output kan mak-kelijk leiden tot verwarring en het geeft slechtsindirectsteunvoordeaprioriverwachtingen.BijNHT is de hypothese die daadwerkelijk getoetstwordtimmersdebekendenulhypotheseer is niks aan de handversushetalternatiefer gebeurt iets, maar we weten niet wat.Merkopdatdezenul(H0)enalternatievehypothese(H1)niethetzelfdezijnalsdeinformatievehypothesenHA,enHBdiedeonderzoekers eigenlijk wilden evalueren. Als denulhypotheseendealternatievehypothesegeenonderdeelzijnvandeonderzoeksvraag,gevendeNHTresultatenindatgevalgeendirectantwoordopdeonderzoeksvraag.

AlsdantochH0wordtgetoetst,danwordtde

RECHTSTREEKS VERWACHTINGEN EVALUEREN OF DE NUL HYPOTHESE TOETSEN?

Rens van de Schoot

Page 23: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

23 STAtOR jul i 2011 |2

traditionele p-waarde gebruikt om deze te ver-werpenofnietteverwerpen.Hetomslagpuntvandeze beslissing ligt meestal bij de welbekendewaardevanp <,05.Dezedrempelwaardevan,05isnietalleenwillekeuriggekozen,maarlaatalleenruimte voor de conclusie dat een nul hypothesewel of niet wordt verworpen met niks daar tus-senin. Dit kan leiden tot vreemde beslissingen,bijvoorbeeldinhetgevaldatp =,051ofp =,049.Het mag duidelijk zijn dat beide situaties nietveel van elkaar verschillen. En toch wordt H0 inheteerstegevalnietverworpeneninhettweedegevalwel.

Wanneer H0 wordt verworpen, weten weeigenlijk nog steeds niks over de informatievehypothesen HA en HB, aangezien de alternatievehypothesegeeninformatiebevatteoverdeorde-ningtussendegemiddelden.Hoekaneenonder-zoekerdantochuitsprakendoenoverdeinforma-tievehypothesen?

Kan het ook anders?

Om erachter te komen welke van een set vaninformatieve hypothesen het meest waarschijn-lijk is, gaan we deze direct tegen elkaar afzettenmet behulp van Bayes Factors (BFs). BFs zijn eenmodel selectie maat en houden niet alleen reke-ningmethoegoeddehypothesebijdedatapast,maarookhoecomplexdehypotheseis.Ditresul-teertineendirectevergelijkingtussendeonder-zochtehypotheses.EenBFvan10betekentdatHAtienkeerzoveelsteunvandedatakrijgtdanHB

en een BF van 1 betekent dat beide hypothesesevenveelsteunvandedatakrijgen.

Er is diverse software voor het uitvoeren van(M)AN(C)OVA’s, multipele multivariate regressieanalyse,kruistabelanalyse,enlatenteklasseana-lyse met BMS (zie www.fss.uu.nl/ms/informati-vehypothesis voor de gratis te downloaden soft-ware). De gebruiker hoeft alleen de hypothesentespecificerenintermenvanrestrictiestussendestatistischeparameters,zoalsμ1 < μ2 ,endedata-set aan te leveren, en de software levert de BFsautomatischuit.LatenwenumeteeninhoudelijkvoorbeeldbekijkenhoeBMSwerkt.

Voorbeeld

Merkwaardig genoeg is het rendement van doorNWOtoegekendepromotiesubsidiesinNederlandtotnutoenietonderzocht.Ineenrecentgepubli-ceerdeartikelonderzochtenVandeSchoot,Sonne-veldenLockhorst(2011)hetaldannietsuccesvolleverloop van de promotietrajecten waarvoor inde jaren 1999 tot en met 2001 bij Maatschappij-enGedragswetenschappeneensubsidieaanvraagwerdingedienddiewerdgehonoreerd.Succesvolstaathiervoor:debestedingvandesubsidiewerdbekroondmetdeverdedigingvanhetproefschriftvoor september 2010. Er werd een onderscheidgemaakttussenprojectenwaarindepromovendiineenkleinerprogrammatischverbandwerkten(metcollegaealdannietopdezelfdewerkplek)enindividueleprojectendiemenalsstand alonezoukunnenbeschouwen.

n gepromoveerd niet-gepromoveerd rendement

Totaal programma-projecten 112 87 25 77,7%

Individueel project 107 96 11 89,7%

Tabel 1. Subsidierendement uitgesplitst naar ‘individueel project’/‘project deel uitmakend van het programma’

Page 24: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

24 STAtOR jul i 2011 |2

Erwarentweehypothesengeformuleerd:H1: er zijn procentueel evenveel succesvolafgeronde projecten bij individuele subsi-diesalsbijprogrammatischesubsidies.

VersusH2:erzijnrelatiefmeersuccesvolafgerondeprojecten bij individuele subsidies dan bijprogrammatischesubsidies.

Merkopdatdeonderzoekersinditgevalweldege-lijk waren geïnteresseerd in de nul hypothese,met als kanttekening dat BMS veronderstelt dathetverschilnietpreciesnulis,maarongeveernul.

Uit de databestanden van NWO is een lijstsamengesteld van alle promotieprojecten waar-voor in de jaren 1999 tot en met 2001 een subsi-dieaanvraagwerdgehonoreerd.Zietabel1voordepercentagesgeslaagddanwelgefaaldopdepeil-datum. Er bestaat een ondervertegenwoordigingvan programmatische subsidies bij het totaalaantal geslaagde projecten. Maar is dit verschilooksignificanten/ofrelevant?

Deklassiekemethodeomdezevraagtebeant-woorden is om een chi-kwadraat toets uit tevoeren. Dan blijkt dat er een significant verschilbestaattussengeobserveerdeenverwachtewaar-des,X2

1,219=8,31;p= ,004.Aangezienhethieruitnognietduidelijkwordtwaarpreciesdeverschil-len zitten, hebben we ook BMS gebruikt om dehypotheses direct af te zetten tegen elkaar. Uitdeze analyse blijkt dat de tweede hypothese 28keerzoveelsteunvandedatakrijgtalsdeeerstehypothese. Oftewel, er is veel steun in de datavoor de hypothese dat er relatief meer succesvolafgerondeprojectenzijnbijindividuelesubsidiesdanbijprogrammatischesubsidies.

Conclusie

Deresultatenvannulhypothesetoetstinggevenvaakgeendirectantwoordopdeonderzoeksvraag.

Informatievehypothesenkunnennietdirectmetelkaar vergeleken worden, iets dat met Bayesi-aanse Model Selectie wel kan. Ook wanneer deordening van de groepsgemiddelden niet geheelovereenkomtmetéénvandehypothesen,geeftBMSeeninterpreteerbaarresultaat.Zelfsbijveelcomplexere onderzoeksvragen dan in dit artikelbesproken,bijvoorbeeldmetmeerdere(on)afhan-kelijkevariabelen,meerderemeetmomentenoverdetijdheen,covariaten,meergroepen,enz.,geeftBMSnogsteedseenenkel interpreteerbaargetalperhypothese.BMSresulteertdusinmakkelijkerte interpreteren resultaten dan NHT en geeftbovendieneendirectantwoordopdeonderzoeks-vraag.BMSisdaardooreenveelbelovendalterna-tiefvoorNHTenzalsteedsvakeropduikenindewetenschappelijkliteratuur.

Het artikel is grotendeels gebaseerd op het proefschrift van de auteur en de genoemde literatuur.

LiteratuurHoijtink, H., Klugkist, I., & Boelen, P. A. (Eds.). (2008).

Bayesian evaluation of informative hypotheses in psychology. New-York: Springer.

Van de Schoot, R., Hoijtink, H. & Doosje, S. (2009). Rechtstreeks Verwachtingen Evalueren of de Nul Hypothese Toetsen? Nul Hypothese Toetsing versus Bayesiaanse Model Selectie. De Psycholoog 4, 196-203.

Van de Schoot, R., Hoijtink, H., Mulder, J., Van Aken, M. A. G., Orobio de Castro, B., Meeus, W. & Romeijn, J.-W. (2011). Evaluating Expectations about Negative Emotional States of Aggressive Boys using Bayesian Model Selection. Developmental Psychology, 47, 203-212

Van de Schoot, R., Hoijtink, H., & Romeijn, J-W (2011). Moving beyond traditional null hypothesis tes-ting: Evaluating expectations directly. Frontiers in Quantitative Psychology and Measurement, 2:24. doi: 10.3389/fpsyg.2011.00024

Van de Schoot. R., Sonneveld, H., & Lockhorst, D. (2011). Het lot van promotieprojecten: Rendement van magw/nwo-subsidies. De Psycholoog, 4, 10-18.

Rens van de Schoot is als universitair docent verbon-den aan de Faculteit Sociale Wetenschappen (afdeling Methoden en Statistiek) van de Universiteit UtrechtE-mail: <[email protected]>

Page 25: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

25 STAtOR jul i 2011 |2

De combinatie statistiek en taal heeft een lange traditie. Het begon misschien met Markov, die het – naderhand – naar hem genoemde begrip Markov-keten ontwikkelde aan de hand van de opeenvolging van letters in een bekend Russisch gedicht. Wat later werd door statistici de frequentie van letters in teksten geturfd en geanalyseerd. De moderne techniek biedt nieuwe mogelijkheden.

Mijn vrouw en ik lossen iedere week het Scryp-togram in NRC Handelsblad op. We gebruikendaarbij soms een woordenboek; om te kijken ofeenbedachtwoordbestaatofomtezoekennaarwoordendie,bijvoorbeeld,met‘boer’beginnen.

In uiterste nood gebruiken wij een modernwapen: de Dikke Van Dale op dvd. Die heeft eenoptie’zoekenopwoord(vormen)’.Daarkunjeeenwoord invullen, waarbij de nog ontbrekende let-ters door vraagtekens zijn vervangen. Voorbeeld:‘?st???s?’. In dit geval is er maar één oplossing:‘asterisk’. Als je al flink wat letters hebt, is hetaantalmogelijkhedennietmeerdanenkeletien-tallen; als je weinig letters hebt, zijn er somshonderdenmogelijkheden.Eenenkelekeer,alsjeeenfoutgemaakthebtofalsdepuzzelmakereenwoordgebruiktdatVanDalenietkent,krijgjedemededeling‘Erzijngeenartikelenmetdedoorugezochtevorm’.

Als je nog veel vraagtekens hebt, zijn er heelveelmanierenomeenwoordtemaken.Datopentde mogelijkheid – wiskundigen zoeken graagnaar extreme situaties – om het aantal woordente vinden met een gegeven aantal letters. Datgaatalsvolgt.Jetiktzevenvraagtekens,druktop‘Enter’envindt17.318woordenvanzevenletters,

van ‘aaibaar’ tot en met ‘zygenen’. Dat laatstewoordbetekent‘grotefamilievanvlinders,waar-toeo.a.desint-jansvlinderbehoort(Zygaenidae)’.

Zokunnenwedewoordenvanallemogelijkelengtenafwerken.Alleen,bijwoordenvandrieofminderlettersbestaanveelvanderesultatenuitafkortingen,enbijwoordenmetheelveelletterszijnderesultatenvaaksamenstellingenvanmeerdan één woord. Tussen deze extremen in is hetinteressant.Het langsteechtewoorddat ikvondheeft 31 letters (hierbij geldt de ij als één letter):medeverantwoordelijkheidsheffing.

Eén van de vragen die je kunt stellen is: ‘Vanwelkelengtezijnerdemeestewoorden?’VanDalegeeftbijiederelengtebraafhetaantalwoorden,enhet blijkt dat woorden van tien letters het meestvoorkomen; de lengten 9, 10 en 11 leveren achter-eenvolgens32789,33549en29398woorden.Zithiernogeensoortmodelachter?Jekuntjevoorstellendathetaantallettersdateenwoordteltongeveereen Poisson-verdeling heeft met een gemiddeldevan 10. Omdat het totaal aantal woorden in deDikke Van Dale ongeveer 240.000 is, komen defractieswoordenmetrespectievelijk9,10en11let-tersuitop0,1366;0,1398en0,1225.Datkomtgoedovereenmetdekansenop8,9en10ineenPoisson-verdelingmetgemiddelde9,5.Hetaantallettersineenwoordisnatuurlijkminstenseen,endataantalkomtdangoedovereenmet‘éénpluseenPoisson-verdeeldegrootheidmetgemiddelde9,5’.

Maar,detaallaatzichgelukkigslechtszeertendeleingetallenvangen.

Fred Steutel is emeritus hoogleraar kansrekening aan de TU Eindhoven. E-mail: <[email protected]>

Fred Steutel c o l u m n

wORDS, wORDS

Page 26: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

26 STAtOR jul i 2011 |2

Love is the total absence of fear. Love asks no questions. Its natural state is one of exten-sion and expansion, not comparison and measurement. – Gerald Jampolsky

Echter, in alle andere gevallen dan liefde, zullenwetochwelmeten.Endatnietalleen:hettrekkenvanconclusiesomtrentdewerkelijkheidgaathetbeste als we ook precies genoeg kunnen meten.Maar wat is precies genoeg? In dit artikel gaanweervanuitdatweineenindustriëleuserstudieeen vergelijking willen maken tussen verschil-lendecondities,bijvoorbeeldtussenverschillendeproducten. Dit wordt gedaan door participantenineenmeetpaneldiehunbeoordelingenvastleg-genineenofmeermeetschalen.

Precies genoeg is dan in dit geval: kunnen departicipantenvoldoendegoedonderscheidmakentussendecondities?Doenzedatconsistent?

Dit artikel heeft de volgende opbouw. Naeenintroductievanhetbegrip‘reliability’uitdepsychometrie zullen we dit generaliseren naareenversiediebruikbaarisvoorhetbepalenvanmeetprecisie in user studies, een generalized

reliability die we G-reliability zullen noemen.Deze geeft antwoord op de vraag: hoe precieskan het panel, maar ook de individuele parti-cipant daarin, de verschillen tussen conditiesvaststellen? Vervolgens laten we aan de handvan een voorbeeld zien dat G-reliability eenhandigemaatisvoordekarakteriseringvaneenmeetpanel.G-reliabilityhangtnauwsamenmethet onderscheidingsvermogen van de toets opconditieverschillen en dit zullen we illustreren.Eendiscussiebesluitditartikel.

meetprecisie van items

Bij het kwantificeren in empirisch onderzoekwordt veelal de vraag gesteld naar meetprecisie.Indepsychometrie,metnameindeklassieketesttheorie (CTT), hanteert men daarvoor het begrip‘reliability’. Hierbij wordt een eigenschap van departicipanten in de studie gemeten op een een-dimensionale meetschaal met K items. Daarbijwordt het volgende meetmodel verondersteld(Spector,1992):

Foto

: BoH

, Ken

ters

chal

mGeneralized reliability in industriële user studies

Jan Engel

Page 27: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

27 STAtOR jul i 2011 |2

Y=P+E

Hierin is P de echte waarde van een participantmetvariantieσP

2 ,Ydegemetenversieervanter-wijlEhetverschilaangeeft,deerrormetvariantieσ e

2 .Hoewel onderwerp van veel discussie, zie bij-

voorbeeld Clarke and Watson (1995), is Cronbachα (Cronbach, 1947) een standaardmaat voor reli-ability.OnderbepaaldeveronderstellingeninhetmeetmodelkanwordenaangetoonddatCronbachαeenschatterisvandereliability

σP2

σP2 + σe

2 / K

De reliability is een relatieve maat voor meet-precisie. Deze beantwoordt de vraag: hoe goedkunnenwedeverschilleninP-waardenvanpar-ticipanten, gemeten doorσP

2 , onderscheiden opgrondvandegemiddeldenvandemeetwaarden

YaandeKitems,metvariantieσP2 + σ e

2 / K.Hetbepalen van reliability gebeurt overigens veelalpas in de (observatie) studie zelf. In industriëleuser studies is het veelal mogelijk, alvorens eenexperimentuittevoeren,eenbeeldtekrijgenvandeprecisiewaarmeegegevenswordenverkregen.We zullen nu reliability generaliseren naar deindustriëlesetting.

Generalisatie van reliability

Bij het bepalen van reliability in CTT vraagtmen zich in feite af: hoe goed kan ik verschillenonderscheiden tussen participanten, gegeven demeetvariatie van items. Die participanten zijnhierdemeettarget.Ineenindustriëleuserstudiezijn participanten geen meettarget, maar onder-

deel van de meetmethode. De meettarget wordtgevormddoordecondities,deproducten,diewor-denaangebodenaandeparticipanten.Hetbegripreliabilityisdannogsteedsheelbruikbaar,maarwezullenhetherformuleren.Devraagisdan:hoeprecieskunnenweverschillenvaststellentussende meetcondities gegeven de variatie van itemsen van participanten? Jammer genoeg ziet mendatookinditgevalnogsteedsCronbachα wordtberekend, maar dan nu over de hele dataset vanparticipantenencondities.Dezegeefthelaasgeenduidelijk,eneensomszelfsmisleidend,beeldvande reliability waar het echt om gaat: het metenvan verschillen tussen condities. De verschillentussen participanten zijn helemaal niet interes-sant.Datditmiskanlopenzullenwelatenzienineenvoorbeeldindevolgendeparagraaf.

Om tot een generalized reliability te komendienenweeersteenredelijkstatistischmodel teformulerenvoordegegevensvaneenuserstudie.Wegaannuuitvanhetgevaldatweéénfactor-conditiestestenopelkeparticipantineenWithinSubjectDesign(WSD),eenveelvoorkomendtypeuserstudie.Danzoueenredelijkmodelalsvolgtkunnenzijn:

Yijk = μ + Pi + Cj + PCij + βk + eijk

In dit model vinden we de effecten terug vanparticipantenPi, i=1,…,I;conditiesCj, j=1,…,J;deinteractie van participanten en condities PCij, detest items βk, k = 1,…,K en de residuele fout eijk.We veronderstellen voorts dat de Pi, PCij en eijk stochastischzijnenonderlingonafhankelijk,met

variantiesσP2,σ 2

PC enσ e

2 .Voortshanterenwe

σC2 = Σ(Cj - C)2

/ (J-1)

alsmaatvoordeverschillentussencondities.Wegaannudereliabilityoptweemanierengenera-liseren.

Page 28: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

28 STAtOR jul i 2011 |2

Geval1:deG-reliabilityperparticipant,

σC2

σC2 + σe

2 / K

Dezevormkennenwealuitdevorigeparagraaf.Het enige verschil is dat we participant vervan-genhebbendoorcondities.Hiermeekarakterise-renwedemeetprecisievaneenparticipantinhetpanel. Hoe goed kan deze condities onderschei-den?

Geval 2: de G-reliability over het meetpanel vanparticipanten,

σC2

σC2 + σ2

PC /I + σe

2/(I*K)

Dezeexpressiegeefthetvolgendeweer:hoegoedonderscheidenwedeverschillentussencondities

zoals gemeten doorσC2 door het gemiddelde per

conditie van de data Y over items én participan-ten.DitgemiddeldeheeftvariatieσC

2 + σ2PC/ I + σe

2

/ (I*K).Deaanpakisanaloogaanheteerstegeval,hetresultaatiswatanders.

Aardig is nu dat een eenvoudige momenten-schatter van G-reliability wordtgegeven door degrootheid (F-1)/F waarbij F de waarde is van deF-toets van Anova voor het toetsen van condi-ties.Inheteerstegevaltoetsenweheteffectvancondities voor een bepaalde participant. In hettweedegevaldoenwedatvooralleparticipantensamen.DeF-toetswordtgebruiktalsschattervoorG-reliability.Deresultatenvolgenuitdeverwach-tingswaarden van de Mean Squares waaruit deF-toetsisopgebouwd,metanderewoordenuitdeEMStabelvandevariantieanalyse.

Er iseenverbandmeteeneerder,entamelijkonbekend resultaat. Hoyt (1941) liet al zien dat

Figuur 1. Onderscheidingsvermogen van de F-toets op condities tegen generalized reliability, voor vier panelgrootten. Resultaten zijn voor twee condities (J = 2)

100

80

60

40

20

00,0 0,2 0,4 0,6 0,8 1,0

5 participanten

onde

rsch

eidi

ngsv

erm

ogen

in %

generalized reliability

100

80

60

40

20

00,0 0,2 0,4 0,6 0,8 1,0

10 participanten

onde

rsch

eidi

ngsv

erm

ogen

in %

generalized reliability

100

80

60

40

20

0

0,0 0,2 0,4 0,6 0,8 1,0

20 participanten

onde

rsch

eidi

ngsv

erm

ogen

in %

generalized reliability

100

80

60

40

20

0

0,0 0,2 0,4 0,6 0,8 1,0

15 participanten

onde

rsch

eidi

ngsv

erm

ogen

in %

generalized reliability

Page 29: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

29 STAtOR jul i 2011 |2

Cronbachα ook kan worden bepaald door (F-1)/FvoorhetgevaldatinCTTwordtbestudeerd,ziedevorigeparagraaf.Maarhetgeldtveelalgemener!We kunnen dan eenvoudig G-reliability bepalenvia de Anova F-toets, en standaard software isgeschiktomdituittevoeren.

Onderscheidingsvermogen van de f-toets

G-reliability in geval 2 heeft een relatie met hetonderscheidingsvermogenvandeF-toetsopcon-dities. We kunnen dit als volgt inzien. We for-muleren de nulhypothese H0: C1 =... = CJ, en hetalternatief H1: niet alle Cj zijn gelijk. Indien H0waar isheeftdeF-toetseencentraleF-verdeling,alsH0onwaarisheeftdeF-toetseenniet-centraleF-verdeling,metniet-centraliteits (nc)parameterdieweλ noemen.Maardieparameterλkunnenwe uitdrukken in de G-reliability , en is daarvaneenmonotoonstijgendefunctie:

λ = (J-1) (G-reliability /(1- G-reliability))

Hoe groter G-reliability, hoe groter het onder-scheidingsvermogen; zie figuur 1. G-reliabilityheeft direct een betekenis voor de kwaliteit vantoetsen.Uitfiguur1trekkenwetweeconclusies:1.gegeven een waarde van de generalized relia-

bilityishetaantalparticipantennietergbepa-lendvoorhetonderscheidingsvermogenvandeF-toets,en

2.voor een onderscheidingsvermogen van 80%is toch al snel een, relatief hoge, generalizedreliability nodig van 0,90. Aan de Cronbach αwordenvaaklagereeisengesteld.

Voorbeeld: meetprecisie van een meetpanel

Hetvoorgaandegeeftmethodenomdereliabilityvan een meetpanel na te gaan. In het volgende,

eenvoudige, voorbeeld heeft elk van vier partici-panten, onder twee verschillende condities, eenoordeel gegeven op een 9-punts meetschaal metdrieitems.Zietabel1.

Na berekening blijkt Cronbach α = 0,924. Erlijkt dus, op grond van Cronbach α, niets aan dehand, en onze meetschaal lijkt het doet te doen.Maar we meten de verkeerde reliability: die vande totale variatie, dus van participanten, condi-ties, de interactie, en niet van condities alleen!Voor de F-toets op condities vinden we F = 1,343,en daarmee de G-reliability (F-1)/F = 0,26, en datisdirecteenstukminderoptimistisch.Kijkenwenaar de individuele G-reliability waarden, geba-seerd op de F-toets uitkomsten per participant,danvindenwe0,98, -12,00,0,96en0,75.Daaruitblijkt dat de tweede participant het wel heelslecht doet. Laten we deze weg, dan vinden weechtereenG-reliabilityvan0,14.

Een en nader wordt wellicht duidelijk aan dehandvan de interactieplot van figuur 2.We zienhierin dat participant 2 inderdaad slecht discri-mineert:eennon-discriminator.Maarerismeer:de interactie is groot en daarmee de meetpreci-sie van het panel gering. Nog sterker, door diegrote interactie is Cronbach α groot, maar voorhet echte doel, het bepalen van verschil tussencondities,isdieinteractiejuistfunest!Dewaarde

Participant conditie Item 1 Item 2 Item 3

1 1 2,00 1,00 2,00

1 2 4,00 3,00 5,00

2 1 5,00 6,00 5,00

2 2 6,00 4,00 7,00

3 1 3,00 2,00 3,00

3 2 6,00 7,00 9,00

4 1 3,00 4,00 2,00

4 2 1,00 2,00 2,00

Tabel 1. Meetgegevens op 9-punt schaal van vier partici-panten, twee condities en drie items

Page 30: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

30 STAtOR jul i 2011 |2

vandeG-reliabilitygeeftditadequaatweer:dieisheellaag.DegrotevariantievandeinteractievindenweterugindenoemervanG-reliability.Eenverbeteringindesituatie?Wanneerditeenreëlesituatie iszoumenkritischmoetenkijkenof de participanten wel geschikt zijn voor huntaak, en of selectie/opleiding niet duidelijk eennoodzaak is. Zomaar meer participanten opne-men vergroot de waarde van I, en daarmee deG-reliability , maar is misschien niet de meesteffectieveweg.

Discussie

De G-reliability geeft nuttige informatie om demeetprecisie vast te stellen in een industriëleuser studie. We hebben dit laten zien aan dehand van een WSD met één factorcondities.Overigens is dit resultaat natuurlijk eenvou-dig te generaliseren voor andere designs, zoalseen WSD met meerdere factoren, of voor hetBetweenSubjectDesign.Dekarakteriseringvanafzonderlijkeparticipantenzietmenookteruginde sensometrie (Brockhoff en Skovgaard, 1994).HierbijwordtookdeF-waardevandeindividueleparticipant gehanteerd als maat voor kwaliteit,

maar er is geen standaardisatie. Het aardige isdatnudelinkwordtgelegdtussendezewaardeuit de sensometrie en de reliability uit de psy-chometrie.Tenslottegeldtdanookeenvolgendespin-off:uithetbetrouwbaarheids-intervalvoordenc-parameterλkunnenweeenbetrouwbaar-heids-intervalbepalenvoorG-reliability.Ennut-tige resultaten hiervoor worden gegeven doorbijvoorbeeldSteiger(2004).

LiteratuurBrockhoff, P.M. & Skovgaard, I.M. (1994). Modelling indi-

vidual differences between assessors in sensory evaluations. Food Quality and Preference, 5, 215-224.

Clarke, L. A. & Watson, D. (1995). Constructing valid-ity: basic issues in objective scale development. Psychological Assessment, 7, 309-319.

Cronbach, L.J. (1947). Test “reliability”: Its meaning and interpretation. Psychometrika, 12, 1-6.

Hoyt, C. (1941). Test reliability by analysis of variance. Psychometrika , 6, 135-160.

Spector, P.E. (1992). Summated rating scale construction. An introduction. Newbury Park: Sage publications.

Steiger, J.H. (2004). Beyond the F test: effect size confi-dence intervals and tests of close fit in the analysis of variance and contrast analysis. Psychological Methods, 9, 164-182.

Jan Engel is senior consultant bij CQM in Eindhoven. E-mail: <[email protected]>

Figuur 2. Interactie plot van participanten en condities voor de gegevens van tabel 1

8

7

6

5

4

3

2

1

1 2

1234

8

7

6

5

4

3

2

1

1 2

1234

mea

n

conditie

8

7

6

5

4

3

2

1

1 2

Page 31: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

31 STAtOR jul i 2011 |2

J.H.B. (Joop) Kemperman werd op 16 juli 1924 inAmsterdam geboren. Hij studeerde wiskundeaandeUniversiteitvanAmsterdam,waarhij in1948 doctoraal examen deed. Hij werkte daarnaaan het Mathematisch Centrum (CWI) onderleidingvanDavidvanDantzig,bijwiehijin1950promoveerde op een proefschrift getiteld ‘TheGeneral One-Dimensional Random Walk withAbsorbingBarriers,withApplicationstoSequen-tialAnalysis’.

In 1951 emigreerde hij naar de V.S. Hij wasachtereenvolgens hoogleraar aan de PurdueUniversity,UniversityofRochesterendeRutgersUniversity.

In 1970 ontmoete ik hem voor het eerst inRochestertijdensmijnbezoekaanJulianKeilson.Ikkwamdaaraannaeen langerondritdoordeVSvanuitAustin,Texas.Hijhadmezijntweedeautowillenlenen–mijnautowasalverkocht–warehetnietdathijdiekortdaarvooralhaduit-geleendendefecthadteruggekregen.

Dat tekende hem: hij was heel genereus, inalleopzichten,ookmetzijninzichtenindewis-kunde. Hij had een opvallend algemeen adviesvoor wiskundigen: gebruik geen ongelijkheden.Bij het gebruik van ongelijkheden raak je altijdinformatie kwijt. Laat dus altijd gelijkhedenstaan, ook al weet je van sommige groothedendatzekleinzijn.

Ik kwam hem daarna regelmatig tegen opcongressen en weer later, wat uitgebreider, bijmijn tweede bezoek aan Keilson in Rochesterin1972.ToenhebikookJoopsvrouwWilnaont-moet,eenactieve,opgewektevrouw.Zijstierfin

1995.DebijzettingvanhaarasinAlkmaarwerddoorveelcollega’svanJoopbijgewoond.Zijwaseen vrolijke vrouw, en door de vele herinnerin-genaanhaaropgetogenlevenkreegdeplechtig-heideenuitgesprokenopgewektkarakter.

Kemperman was een heel veelzijdige wis-kundige. Hij werkte in de analyse, de discretewiskunde, en vooral, in de kansrekening enstatistiek. Verder was hij redacteur van ver-schillende vaktijdschriften, waaronder The Annals of Mathematical Statistics,The Annals of Probability,Stochastic Processes and Applicationsen, buiten de stochastiek, van Aequationes Mathematicae. Hij had veel promovendi. HetMathematicsGenealogyProjectgeeft24namen;deeerstepromoveerdein1954,delaatstein1994.Hij was corresponderend lid van de KoninklijkeNederlandseAcademievanWetenschappen.

Zijn eerste artikel verscheen in 1949 inIndagationes MathematicaeenschreefhijsamenmetJ.G.vanderCorput.Detitel luidde‘Thesec-ondpearlofthetheoryofnumbers’.ZijnlaatsteartikelschreefhijsamenmetMarkBrownenver-scheenin2009inProbability in Engineering and Information Sciences: ‘Sharp two-sided boundsfordistributionsunderahazardrateconstraint’.

De laatste jaren leed hij aan de ziekte vanParkinson. Joop is op 12 juni in East Brunswickoverleden.Op2juliisopdeSintBarbarabegraaf-plaatsinAlkmaarzijnasmetdievanzijnvrouwverenigd.

Fred Steutel

IN MEMORIAM jOOP KEmPERmAN (1924-2011)

Page 32: STAtOR · 2018. 1. 21. · Fleuren, Marco Hendriks en Annelies Woutersen. Zij beschrijven hoe TNT Express stapje voor stapje wordt veroverd door toepassingen van de OR. De filosoof

32 STAtOR jul i 2011 |2

Terwijl ik met een bitterbal op de maat van demuziekmijngehemeltekastijdzieikuitmijnoog-hoekiemandnaderen.

‘Leopold, aangenaam, de overbuurman’, zegtdezelfbewustevijftiger.

Bittergarnituurmaaktjebenaderbaar.Leopoldvervolgt:‘DusjijwerktaandeTU.’‘Klopt’,zegikaarzelend,nietwetendewatdeze

bevestigingteweegzalbrengen.‘Watdoejedanprecies?’Tja, denk ik, daar gaan we weer. Maar het is

feest,dusikbesluitheteenkanstegeven.‘Nou, ik doe wiskunde, deels lesgeven, deels

onderzoek.’‘Aha,onderzoek.Dusjebentuitvinder?’‘Nietecht.Ikprobeerwelsteedsietsnieuwste

bedenken,maargeenuitvindingen.’‘Maar ik dacht dat ze aan de TU echt dingen

uitvonden,zoalsMRIscansenelektrischeauto’s?’‘Klopt,datisookzo.’‘Maarjijvindtgeendingenuit?’‘Nou, misschien toch wel, maar zo heb ik het

nieteerderbekeken.’‘Noemdaneenswatvanjeuitvindingen.’Voetbal was een beter onderwerp geweest,

maarerisnugeenwegmeerterug.‘Kijk,ikwerkeerderaanwiskundigeformules,of

modellen,dieanderendanweerkunnengebruikenbijhetontwikkelenvanproducten.Diemodellenenformuleszijnnieuw,enindiezineenuitvinding.’

‘Maarwanneeranderenjouwformulesgebrui-ken,levertjoudatdangeldop?’

‘Nee,wantiedereenmagdieformulesgebruiken.’

‘Endiemodellen,leverendiedanietsop?’‘Die modellen zijn abstracties van de werke-

lijkheid. Ze geven wel inzicht, maar leiden door-gaansniettoteentastbaarproduct.Althans,mijnmodellenniet.’

‘Dusdatonderzoekvanjoulevertnietsop?’‘Geengeldnee.Weldieformulesdus.’‘Ja, maar die formules geef je blijkbaar voor

nietsweg.Waaromhoudjezenietvoorjezelf,enprobeerjeerietsmeetedoendatgeldoplevert?’

‘Maar dan zou ik een eigen bedrijf moetenbeginnen?’

‘Dat klopt ja, en daar lijkt me niets mis mee.De kranten staan vol met verhalen over de uni-versiteiten. Er is een groot begrotingstekort, enhetschijntdat jullie jebroekindetoekomstzelfmoetenophouden.Jekuntdusmaarbeterzorgendatjeietsnuttigsdoet,ietswatgeldoplevert.’

‘Ikhebhetookgelezen,maar…’‘Enterechtook’,onderbreektLeopold,‘wijmaar

geldindeuniversiteitenpompenzonderdatweerooitietsvanterugzien.’

‘Ik denk dat je gelijk hebt’, zeg ik, terwijl ikbesluitmeterichtenophetvolgendebuurtfeest.

‘Goeddan’,zegtLeopold,‘zaliknogeenbiertjehalen?’

‘Doe mij maar iets sterkers’, zeg ik, terwijl ikweerovergatotmijnbitterbal.

Johan van Leeuwaarden is werkzaam in de groep Stochastische Besliskunde bij de faculteit Wiskunde en Informatica van de Technische Universiteit Eindhoven. Tevens is hij research fellow bij EURANDOM. E-mail: <[email protected]>

Johan van Leeuwaarden c o l u m n

BUURTFEEST