Onderzoeksmethoden en statistiek

Statistiek Forum

Stel je vraag aan de statisticus van ethologie.nl. Een aantal onderwerpen komt al op deze pagina aan bod, maar vraag gerust verder. Ook eventuele aanvullingen op de antwoorden zijn welkom!

*** Dit forum is niet meer actief
Stel uw vraag op het Statistiek Forum van Rogatio ***

Onderwerpen

Stappen voor een steekproefberekening
Steekproefgrootte
Power McNemar test
Interventie effect bij dichotome uitkomstmaat
Meetniveau
Toeval of niet?
Vergelijkingsdata of Likert schaal
Chi kwadraat toets
Non-response
Gegevens invoeren en verwerken
Ordinaal meetniveau in regressie analyse
Representatieve steekproef
Regressie analyse en moderatie

Uitleg bij een aantal bekende statistieken

Stappen voor een steekproefberekening

Vraag - 17 juli 2008

Ik heb 4 groepen (1 gezonde diergroep en 3 groepen agressieve dieren met elk verschillende vormen van agressie, het gaat om een proactief agressieve groep, een reactief agressieve groep en een groep met zowel proactieve als reactieve agressie r=0.66 tussen proactieve en reactieve agressie) en drie variabelen (een neurofysiologische variabele, een neuroendocrinologische variabele en een andere neuroendocrinologische variabele).

Van deze variabelen wil ik onderzoeken of er verschillen zijn van elke diergroep opzich tenopzichte van de gezonde dieren EN of er binnen de drie agressieve dieren groepen onderling verschillen zijn wat betreft deze variabelen.

Hoe kan ik berekenen hoeveel gezonde dieren ik nodig heb en hoeveel dieren per agressieve groep?

Antwoord - 17 juli 2008

Het belangrijkste advies: als dieren al in dit soort proeven gebruikt worden, zorg dan dat je een statisticus van topkwaliteit in je team hebt om te garanderen dat de resultaten wetenschappelijk onderbouwd zijn. Een forum zoals dit heb je dan niet nodig.

Dan een aantal tips:

Om te berekenen hoe groot de steekproef moet zijn, ben je ten eerste afhankelijk van de analyse techniek die je achteraf toe gaat passen om de gegevens te analyseren. En de keuze voor een techniek is weer afhankelijk van het meetniveau (zie onderwerp meetniveau). Als de drie variabelen van interval meetniveau zijn, ligt een multivariate variantie analyse voor de hand. Als de berekening van de steekproefgrootte voor een multivariate analyse te ingewikkeld is of niet ondersteund wordt door je software, gebruik dan uitsluitend de variabele waarbij je het grootste verschil verwacht. Behalve als het essentieel is om bij alledrie de variabelen een verschil aan te tonen, neem dan juist de variabele waarbij je het kleinste verschil verwacht.

De vergelijking betreft vier groepen, maar de meeste interesse gaat waarschijnlijk uit naar de vergelijking met de gezonde dieren. In zo'n geval kan ervoor gekozen worden om de powerberekening te baseren op de vergelijking tussen twee groepen (de gezonde met een andere groep). Deel daarbij de type I fout (alpha, meestal 0.05) wel door drie, omdat je in feite drie toetsen doet. De vergelijking tussen de agressieve groepen onderling kan dan exploratief gemaakt worden (er is waarschijnlijk toch erg weinig informatie vooraf over de grootte van deze onderlinge verschillen). Al met al: versimpelen van het probleem is essentieel. Bedenk dat de powerberekening geen doel op zich is, maar alleen bedoeld om de (vaak magere) informatie die al beschikbaar is te gebruiken om de proef efficiënt op te zetten.

Wat betreft de spreiding van de aantallen over de groepen: bij een vergelijking tussen twee groepen is het optimaal om in beide groepen evenveel dieren te hebben. Als het puur gaat om de paarsgewijze vergelijkingen, neem dan in elke groep evenveel dieren. Het is daarbij verdedigbaar om een iets groter aantal in de gezonde groep te nemen omdat de vergelijking hiermee het meest van belang is. Dit is ook gunstig als (bij het niet vinden van een effect) besloten wordt om exploratief een vergelijking te maken van de drie groepen samen tegenover de gezonde groep (want dan zou een driemaal zo groot aantal in de gezonde groep optimaal zijn).

Steekproefgrootte

Vraag - 17 februari 2006

Ik heb twee vragen met betrekking tot het aantal waarnemingen voor de significantie van onderzoek naar het gedrag van zeepaardjes.

Ik ga onder andere onderzoeken of zeepaardjes voorkeur hebben voor natuurlijk of kunstmatig houvast. Mijn onderzoeksopstelling zal als volgt zijn: Ik zal n aquaria op exact dezelfde manier inrichten, per aquarium één natuurlijk houvast en één vergelijkbaar kunstmatig houvast. In ieder aquarium zal 1 zeepaardje geplaatst worden.

In het kader hiervan zou ik graag weten hoeveel aquaria ik nodig heb en hoeveel waarnemingen, om tot een significant resultaat te komen?

De andere onderzoeken zijn vergelijkbaar, behalve één; Als er jonge zeepaardjes geboren worden, stijgen ze op naar de oppervlakte. Er is echter altijd een aantal juvenielen dat in de waterkolom blijft zweven. We willen onderzoeken of er verschil is in overlevingspercentage tussen de individuen die gaan drijven en de individuen die blijven zweven in de waterkolom.

Mijn volgende vraag is, hoeveel waarnemingen zijn er nodig om hierbij tot een significant resultaat te komen?

Antwoord - 18 februari 2006

Bij het doen van een statistische toets moet ten eerste aangenomen worden dat de waarnemingen onafhankelijke replicaties zijn. Bij het aanhechtings onderzoek lijkt dat me geen probleem, zolang aan elk zeepaardje slechts één waarneming verricht wordt.

Het onderzoek naar overlevingspercentage is ingewikkelder: alle jongen uit één worp hebben een aantal factoren gemeenschappelijk (genetisch, omstandigheden tijdens de geboorte) die zowel op het blijven zweven, als op de overleving van invloed kunnen zijn. Door deze factoren zijn de waarnemingen niet onafhankelijk van elkaar. Daarom moet met de factoren rekening gehouden worden bij de statistische toetsing. Dat kan dmv multilevel analyse; voorwaarde is dan dat de gegevens per individu verzameld worden. Een alternatief is, om per worp gegevens te verzamelen, dus het % blijven zweven en het % overleving per worp; die gegevens zijn wel onafhankelijk. Maar dan zijn er aanzienlijk meer individuen nodig, vooral wanneer de verschillen tussen worpen klein zijn.

Het bepalen van de steekproefgrootte is vrij simpel voor het aanhechtings onderzoek. Wanneer er geen verschil in voorkeur is, dan zal naar verwachting even vaak van een natuurlijk als van een kunstmatig houvast gebruik gemaakt worden, beide 50%. Hoe groter het verschil in voorkeur, des te kleiner het aantal waarnemingen dat nodig is voor een significant verschil - te bepalen dmv de Chi kwadraat toets. Onderstaande tabel geeft aan hoe de grootte van het verschil samenhangt met het minimale aantal waarnemingen voor een statistisch significant (p<0.05) resultaat. Eén aquarium mag best meerdere keren gebruikt worden. Maar wissel wel de posities van de houvasten, en houd de omstandigheden (licht, temperatuur, tijd ed) zoveel mogelijk constant.

Verhouding percentages Minimaal aantal
waarnemingen

90.0% vs 10.0% 10

75.0% vs 25.0% 16

69.2% vs 30.8% 26

67.5% vs 32.5% 40

63.3% vs 36.7% 60

61.3% vs 38.8% 80

60.0% vs 40.0% 100

Om de steekproefgrootte voor het overlevings onderzoek te bepalen, is meer informatie nodig. De vereiste steekproefgrootte is afhankelijk van het verwachte aantal jongen per worp, het verwachte percentage jongen dat blijft zweven, het verwachte percentage overleving wanneer het onderzoek stopt en de verwachte variatie tussen de worpen.

Power McNemar test

Vraag - 30 januari 2006

Op tijdstip t0 meet ik een percentage (P0) onder een groep personen. Op tijdstip t1 ga ik onder dezelfde groep personen weer dat percentage meten (P1).

Op tijdstip t1 kan ik de twee percentages vergelijken met de McNemar test. Dan weet ik namelijk ook hoe elke persoon zich ontwikkeld heeft.

Op tijdstip t0 wil ik nu echter uitrekenen bij welke steekproefgrootte N een gemeten verschil op t1 van (bijvoorbeeld) precies P1-P0=4% significant zal zijn.

Ik zie hier 2 problemen. De "binnenkant" van de 2x2-tabel is niet bekend op tijdstip t0. Daarnaast gebruikt de McNemar test alleen de aantallen "mismatches" en NIET de totale N.

In navolging van mijn eerdere vraag....

Is het niet raar dat de McNemar test helemaal geen rekening houdt met de totale steekproefgrootte? Als ik dus bijvoorbeeld b=10 vergelijk met c=2 (In een 2x2 tabel [a b; c d]), dan is de significantie volledig onafhankelijk van de totale steekproefgrootte. Want voor a=d=1 (N=14) is de uitkomst van de test exact dezelfde als voor a=d=1000 (N=2012)!!

Ik snap dat de McNemar test alleen de informatie gebruikt van de veranderingen, maar de power van deze test hangt toch direct samen met de totale steekproefgrootte?

Antwoord - 1 februari 2006

De power (dat is de kans om een statistisch significant effect te vinden) van de McNemar test is inderdaad afhankelijk van het aantal gevallen met twee verschillende uitkomsten, en niet van de totale steekproefgrootte.

De steekproefomvang die nodig is om een bepaald verschil (zoals P1-P0=4%) aan te kunnen tonen, is niet alleen afhankelijk van het verschil, maar ook van de mate waarin de uitkomsten consistent zijn. Vergelijk dit met de correlatie tussen m0 en m1, die van invloed is op de power van een gepaarde t-test.

In het voorbeeldje met N=14 en N=2012 ben je er alleen in geïnteresseerd of er een tendens is om de ene of de andere kant op te veranderen. De enige informatie die daarover beschikbaar is, komt van 12 personen, dus N=12. Bedenk ook dat de effect size (het verschil tussen de percentages) veel groter is in het geval van N=14. Met andere woorden: de percentages worden wel veel preciezer bepaald bij N=2012, maar het verschil tussen de percentages is ook veel kleiner!

Interventie effect bij dichotome uitkomstmaat

Vraag - 29 september 2005

Ik heb in een ziekenhuis gemeten of verpleegkundigen bepaalde voorschriften wel of niet uitvoeren. De uitslag is in procenten. Na een aantal klinische lessen en andere vormen van motiveren hoop ik dat de naleving van de voorschriften beter is. Voor de interventie was de naleving 40 %, na de interventie was de naleving 51 % De steekproefgrootte is 35. Ik heb een berekening uitgevoerd waarbij ik het 95 % BI heb uitgerekend, 95 % BI = gemiddelde plus/min 1.96 maal de wortel uit (P*(1-P))/N. Is dit de juiste formule?

Antwoord - 30 september 2005

De formule berekent een betrouwbaarheidsinterval voor een percentage, en doet dat volgens de normale verdeling. Deze benadering mag alleen gebruikt worden wanneer de steekproef voldoende groot is en de kans niet te dicht bij 0% of 100% ligt. In dit geval is de steekproef vrij klein, maar de kans ligt zo ver van 0% en 100% af, dat de benadering voldoet.

Maar, een betrouwbaarheidsinterval heeft betrekking op één percentage, en geeft geen antwoord op de vraag of de twee percentages van elkaar verschillen. Beide percentages hebben een onzekerheidsmarge, en een betrouwbaarheids interval is niet voldoende om te zeggen of ze significant van elkaar verschillen.

Om een verschil tussen de percentages te toetsen, moet ten eerste een aanname gemaakt worden, namelijk dat het percentage zonder interventie gelijk gebleven zou zijn. Deze aanname gaat niet op wanneer er een tijdseffect is, of wanneer het doen van de meting op zich al tot een verandering leidt. Om de aanname te toetsen, wordt ook gemeten in een controlegroep, die de interventie niet krijgt.

Dan zijn er twee opties om een verschil te toetsen. Wanneer de voormeting en de nameting binnen dezelfde steekproef gedaan zijn, dan kan de McNemar toets gebruikt worden. Je toetst daarmee of het aantal mensen dat positief veranderd is, significant verschilt van het aantal mensen dat negatief veranderd is. Wanneer de voormeting en de nameting binnen verschillende steekproeven gedaan zijn, kan een chi kwadraat toets gebruikt worden. Je toetst daarmee of er samenhang is tussen de variabele voor/na en de uitkomstvariabele (wel/niet naleven).

Meetniveau

Vraag - 15 juli 2005

Heeft u uitleg over de verschillende meetniveaus; nominaal, ordinaal, discreet en continu?

Antwoord - 18 juli 2005

Bij nominaal meetniveau is er een kwalitatief onderscheid tussen de waarden die een variabele aan kan nemen. De verschillende uitkomsten hoeven niet als getallen uitgedrukt te worden, en hoeven ook geen volgorde te hebben. In plaats van nominaal meetniveau wordt ook wel gesproken van categorische of multinomiale uitkomsten.

Wanneer een nominale variabele slechts twee categorieën heeft, wordt dit binomiaal, binair of dichotoom genoemd. Omdat er slechts twee mogelijke uitkomsten zijn, kunnen dit soort gegevens behandeld worden als gegevens van interval meetniveau, zie onder.

Voor ordinaal meetniveau is het vereist dat de waarden die de een variabele aanneemt te ordenen zijn volgens een bepaald criterium. Dus, dat de gegevens een volgorde hebben.

Interval meetniveau betekent dat de gegevens getallen zijn, dat ze een volgorde hebben, en dat de afstand tussen getallen dezelfde betekenis heeft op verschillende punten van de schaal. Dit laatste houdt in dat het verschil tussen twee uitkomsten betekenisvol is. Bijvoorbeeld: het verschil tussen 1 en 2 is even groot als het verschil tussen 5 en 6, namelijk 1.

Gegevens van ratio meetniveau voldoen aan dezelfde criteria als gegevens van interval meetniveau. Daarbij is er ook nog een nulpunt, daardoor is de verhouding tussen twee uitkomsten betekenisvol. Bijvoorbeeld: 2 verhoudt zich tot 4, zoals 3 zich tot 6 verhoudt, het is namelijk de helft.

Continu betekent dat alle getallen in een bepaalde range mogelijk zijn als uitkomsten (dus ook getallen met vele cijfers achter de komma). Discreet betekent dat alleen bepaalde waarden aangenomen kunnen worden (bijvoorbeeld alleen hele getallen).

Toeval of niet?

Vraag - 1 juni 2005

Mijn moeder heeft vier kinderen gekregen. Elke keer als ze zwanger was heeft ze voorspeld wat het zou worden (een jongetje of een meisje) en ze had het vier keer bij het rechte eind. Hoe groot is nou de kans dat ze het vier keer goed voorspeld heeft?

Antwoord - 4 juni 2005

De kans om één keer een goede voorspelling te maken is 50 %, er worden zoiets evenveel jongetjes als meisjes geboren. De kans op een combinatie van uitkomsten kan berekend worden door de kansen met elkaar te vermenigvuldigen. Dus de kans om het geslacht van allevier de kinderen goed te voorspellen is 50% * 50% * 50% * 50% = 6.25 %.

Als statisticus is het belangrijk om altijd vóóraf hypotheses te stellen. Als je namelijk op basis van een onverwachte gebeurtenis (vier keer goed voorspellen) een statistische analyse gaat doen, zul je al snel constateren dat de kans klein was: daarom was de gebeurtenis ook onverwacht!

Mocht je toch twijfelen of je moeder helderziend is: laat haar 10 keer voorspellen of je kop of munt gooit. De kans dat ze het 10 keer goed heeft is slechts 0,1 % (één op duizend). En dit geldt uiteraard ook voor het goed voorspellen van het geslacht van 10 kinderen. Dus: van elke 1000 moeders met 10 kinderen, zal er één zijn die ze alle 10 goed voorspeld had. Ik vraag me af: hoe groot is de kans dat zo iemand zal denken dat ze echt helderziend is? ...

Vergelijkingsdata of Likert schaal

Vraag - 27 april 2005

Ik wil een enquete doen voor een horeca-leverancier. De leverancier wil graag weten wat de bar-eigenaren van de huidige situatie vinden én welke vorm van service ze het liefst ontvangen. Daarom wil ik een lijst opstellen waarbij de bar-eigenaren in een soort rangorde kunnen aangeven wat ze belangrijk vinden. Weet iemand hoe dat type onderzoek heet en waar ik meer informatie erover kan vinden?

Het is me van verschillende kanten afgeraden om het op deze manier te doen, omdat het voor de respondent vaak een vervelende klus is om in te vullen. Zou een Likert-schaal misschien ook een goed optie zijn?

Antwoord - 27 april 2005

Maak de keuze voor een vorm van gegevensverzameling in de eerste plaats op basis van de vraagstelling. De gegevens die je krijgt wanneer je respondenten een rangorde laat aanbrengen (vergelijkingsdata) zijn vooral gericht op het onderscheiden van stimuli, zoals vormen van service. Dus hiermee kan nagegaan worden hoe verschillende vormen van service zich tot elkaar verhouden. Een Likert schaal is gericht op het onderscheiden van respondenten, zoals bar-eigenaren, met betrekking tot één kenmerk. Hiermee kan bijvoorbeeld in beeld gebracht worden in welke mate individuele bareigenaren positief zijn over de huidige situatie.

Het invullen van vergelijkingsdata kan voor de respondenten een lastige klus zijn, en ook het analyseren vraagt speciale technieken (schaaltechnieken). Gebruik van een Likert schaal is meer standaard praktijk. Likert schaal gegevens zijn dan ook makkelijker met standaard methoden te analyseren. Maar bedenk dus eerst goed welke gegevens het beste aansluiten bij de vraagstelling.

Chi kwadraat toets

Vraag - 27 april 2005

Ik heb twee afzonderlijke enquetes gehouden, een Nederlandse en een Duitse steekproef. Daarbij heb ik gebruik gemaakt van een groot aantal vragen met diverse antwoordcategorieen (bijvoorbeeld de variabele vervoerwijze met als categorieen auto, fiets, trein, bus etc.). Is het mogelijk om aan de hand van dit type antwoorden (die ik reeds heb gecodeerd in SPSS) te berekenen of er significante verschillen tussen Nederland en Duitsland zijn en is het mogelijk om een regressie-analyse voor deze diverse kwalitatieve variabelen uit te voeren?

Antwoord - 27 april 2005

Om te bepalen of er een significante samenhang is tussen de variabele vervoerswijze en de variabele land (met andere woorden: of er een significant verschil tussen de landen is) kan de Chi kwadraat toets gebruikt worden. In SPSS gaat dat via het menu Analyze >Descriptives >Crosstabs. Geef de ene variabele op bij Rows en de andere bij Columns. Vink onder Statistics de Chi Square aan. Je kunt de chi kwadraat toets online uitvoeren op www.ethologie.nl/methoden/statonline.htm .

Lineaire regressie analyse kan alleen toegepast worden voor continue variabelen. Niet voor variabelen die dergelijke beschrijvende categorieën als uitkomst hebben. Wanneer je toch de multivariate samenhang tussen verschillende variabelen in kaart wilt brengen, raad ik aan om een loglineair model toe te passen. Dat kan in SPSS via het Analyze >Loglinear menu.

Non-response

Vraag - 20 april 2005

Ik heb voor mijn (schriftelijke) enquête 115 mensen aangeschreven. Hoeveel procent moet ik hiervan terug krijgen om een valide onderzoeksrapport te schrijven?

Antwoord - 20 april 2005

Om een valide onderzoeksrapport te schrijven, is het belangrijk dat de gegevens die je analyseert representatief zijn voor de populatie waarover je een uitspraak doet. Wanneer een deel van de steekproef geen respons geeft op de enquête, dan is de vraag of dit deel van de mensen andere antwoorden gegeven zou hebben dan de respondenten die wel geantwoord hebben.

Het gaat er dus niet zozeer om hoeveel mensen antwoorden, je moet je afvragen of de non-respondenten systematisch verschillen van de respondenten. Wanneer je enige informatie hebt over kenmerken van de non-respondenten (woonplaats, geslacht, leeftijd) kun je in elk geval nagaan of deze kenmerken erg verschillend zijn van de kenmerken van de groep respondenten. Wanneer dat het geval is, heb je reden om te twijfelen aan de respresentativiteit van de gegevens.

Om na te gaan hoe erg het effect van de non-response kan zijn, kun je de niet teruggestuurde enquêtes zelf invullen met gegevens die maximaal afwijken van de gegevens in de wel ingestuurde enquettes. Analyse van de aangevulde gegevens geeft dan een idee hoe erg verschillend de totaalschatting maximaal geweest zou kunnen zijn wanneer alle mensen gereageerd hadden.

Gegevens invoeren en verwerken

Vraag - 1 maart 2005

Ik heb ongeveer 150 enquêtes afgenomen, die ik nu moet gaan verwerken en ik heb geen idee hoe ik dit aan moet pakken. Welk programma kan ik het beste gebruiken?

Antwoord - 1 maart 2005

Om te beginnen moet je de gegevens invoeren. Het maakt niet zoveel uit in wat voor programma je dit doet: wanneer je gegevens op de juiste manier invoert is het vrij makkelijk om deze achteraf met een ander programma te openen voor verdere analyses.

Voor het invoeren kun je een spreadsheet programma (zoal Excel) gebruiken. Neem voor iedere uitkomstvariabele een aparte kolom, en zet de gegevens van iedere respondent in een aparte rij. Een klein voorbeeldje:

Wanneer je de gegevens op deze manier opslaat, heb je een goede basis gelegd voor verdere verwerking van de gegevens.

Ordinaal meetniveau in regressie analyse

Vraag - 28 februari 2005

Ik ben bezig met de verwerking van mijn resultaten. Nu heb ik een aantal variabelen op ordinaal meetniveau. Hier wil ik echter een regressie analyse op uitvoeren, met de aanname dat de afstand tussen de items gelijk is. Maar is hier ook onderbouwing voor uit de literatuur?

Antwoord - 28 februari 2005

Om lineaire regressie analyse te doen met een variabele van ordinaal meetniveau, neem je aan dat de intervallen tussen de categorieën van de variabele even groot zijn. Daarbij moet je zeker ook controleren of de relatie tussen de onafhankelijke variabele (X) en de afhankelijke variabele (Y) lineair is. Bereken voor elk niveau van X het gemiddelde van Y. Plot daarna de gemiddelden van Y tegen X, en beoordeel of het verband lineair is. Maar, grote voorzichtigheid blijft geboden; significantie toetsing van regressie parameters kan vertekend zijn vanwege het beperkte aantal categorieën dat een ordinale variabele vaak heeft.

Representatieve steekproef

Vraag - 18 februari 2005

Ik wil een enquete gaan uitzeten onder de inwoners van de gemeente Borsele. Ik wil een aantal enquetes mondeling afnemen, mensen aanschrijven en een enquete op het internet uitzetten. Maar wanneer is een onderzoek representatief? Bij hoeveel respons? En hoeveel enquetes zou ik uit moeten zetten om een betrouwbaar advies te kunnen geven?

Antwoord - 19 februari 2005

Voor een representatieve steekproef, moeten alle personen waarover je een uitspraak wilt doen (dus alle inwoners van de gemeente Borsele) een even grote kans hebben om deel uit te maken van de steekproef. Daarom moeten de respondenten random (willekeurig) geselecteerd worden.

Het aantal personen dat nodig is voor betrouwbare resultaten, hangt af van de vraag die je wilt beantwoorden. Voor het doen van een uitspraak over één uitkomstmaat per variabele (bijvoorbeeld: het percentage mensen dat een hond heeft; of: het gemiddelde inkomen) is een relatief klein aantal voldoende. Als minimum zou ik 30 personen noemen. Maar altijd geldt: hoe meer personen, des te preciezer je schatting.

Voor het doen van een uitspraak over het verband tussen twee (of meer) variabelen (bijvoorbeeld: de samenhang tussen hondenbezit en inkomen), zou ik streven naar minstens 50 personen.

Voor een respresentatieve steekproef moet je proberen om zoveel mogelijk mensen die je geselecteerd hebt, ook werkelijk mee te laten doen. Maar houd er rekening mee, dat er altijd mensen zijn die niet meedoen. Trek daarom aanvankelijk een steekproef die ruim groot genoeg is.

Wanneer je vantevoren al weet dat je bepaalde groepen wilt gaan vergelijken (bijvoorbeeld: 65+ers ten opzichte van de rest), kan het nuttig zijn om een gestratificeerde steekproef te trekken. Dit houdt in dat je voor elk van de groepen apart bepaalt hoeveel mensen je wilt benaderen, en vervolgens per groep een random steekproef trekt. Bij een vergelijking tussen groepen is het namelijk gunstig om in alle groepen evenveel personen te hebben.

Let wel: wanneer je op basis van een gestratificeerde steekproef een uitspraak wilt doen over de populatie als geheel (iedereen in de gemeente Borsele), dan moet je rekening gehouden met de grootte van de groepen in de populatie. Voorbeeldje: wanneer 65+ers 20% van de populatie uitmaken en een gemiddeld inkomen van 1200 Euro hebben, terwijl de rest een gemiddeld inkomen van 1600 Euro heeft, dan is de schatting voor het totale gemiddelde 20% * 1200 + 80% * 1600 = 1520 Euro.

Regressie analyse en moderatie

Vraag - 20 januari 2005

Ik ben bezig met een onderzoek naar de causale relatie tussen diversiteit en conflict. Werkdruk fungeert als modererende variabele. Ik kom er niet helemaal uit.

diversiteit --------> conflict
^
|
werkdruk

Diversiteit meet ik met de entropy-based index (Jehn). Informational diversity is geoperationaliseerd met de indicatoren: vooropleiding en werkervaring. Dit zijn categorische variabelen, maar door de fomule worden ze volgens mij omgezet naar continue variabelen.

Een (reeds bestaande en betrouwbare) vragenlijst is gestuurd naar alle individuen van de werkgroepen (5 punt Likert-schaal). Ik heb een 70% responsrate. De gegevens zijn o.a. m.b.v. de formule verwerkt tot groepsgemiddelden.

Taakconflict en werkdruk per groep meet ik ook door het berekenen van gemiddelden. Deze (reeds bestaande en betrouwbare) vragenlijsten zijn dus ook verstuurd naar de individuen van de werkgroepen (70% respons).

M.b.v. regressieanalyse wil ik uitspraken kunnen doen over de relaties van de variabelen. Kan iemand mij misschien uitleggen of dit allemaal wel kan en waar ik rekening mee moet houden? Een beperking van het onderzoek is dat ik maar een klein aantal groepen kan onderzoeken, namelijk 15 ofzo (5/6 leden per groep).

Antwoord - 20 januari 2005

Als ik het goed begrijp heb je 15 groepen, met in elke groep 5 of 6 metingen op individueel niveau. Dit zijn erg lage aantallen, ik schat de kans dat je moderatie aan kunt tonen klein, maar dat terzijde. Moderatie houdt in, dat het verband tussen A (diversiteit) en B (conflict) afhankelijk is van C (werkdruk), zoals je mooi in het schemaatje weergegeven hebt.

Normaal gesproken zou je een regressie model kunnen toetsen met A en C en A*C (interactie) als voorspellers van B. Met interactieterm A*C zou dan de moderatie getoetst worden. Maar omdat je waarnemingen hebt die binnen groepen geclusterd zijn, zou ik als volgt te werk gaan:

Stap 1
Bereken binnen elk van de groepen, op basis van de metingen op individueel niveau, de gestandaardiseerde regressiecoëfficiënt (D) voor de voorspelling van B uit A (deze coëfficient is gelijk aan de correlatie tussen A en B). Deze stap doe je dus 15 keer, met steeds 5 of 6 gegevens als input.

Stap2
Doe vervolgens een analyse waarin je de gevonden regressiecoëfficiënten D (één per groep) voorspelt uit de gemiddelde werkdruk C van de groep. Deze stap doe je dus één keer, met 15 gegevens als input. Wanneer het verband tussen C en D significant is, heb je moderatie aangetoond.

Wat is...?
Uitleg bij een aantal bekende statistieken

... chi kwadraat toets

... correlatie

... frequentie verdeling

... gemiddelde

... histogram

... item respons theorie

... kruistabel

... lineaire regressie analyse

... logistische regressie analyse

... spreidingsplot
... standaarddeviatie

- - Home - Contact - -