Statistiek Forum
Stel je vraag aan de statisticus van ethologie.nl. Een aantal onderwerpen komt
al op deze pagina aan bod, maar vraag gerust verder. Ook eventuele
aanvullingen op de antwoorden zijn welkom!
***
Dit forum is niet meer actief
Stel uw vraag op het Statistiek Forum van Rogatio
***
Onderwerpen
Stappen voor een steekproefberekening |
Vraag - 17 juli 2008
Ik heb 4 groepen (1 gezonde diergroep en 3 groepen agressieve dieren met elk verschillende vormen van agressie,
het gaat om een proactief agressieve groep, een reactief agressieve groep en een groep met zowel proactieve
als reactieve agressie r=0.66 tussen proactieve en reactieve agressie) en drie variabelen (een neurofysiologische
variabele, een neuroendocrinologische variabele en een andere neuroendocrinologische variabele).
Van deze variabelen wil ik onderzoeken of er verschillen zijn van elke diergroep opzich tenopzichte van de gezonde
dieren EN of er binnen de drie agressieve dieren groepen onderling verschillen zijn wat betreft deze variabelen.
Hoe kan ik berekenen hoeveel gezonde dieren ik nodig heb en hoeveel dieren per agressieve groep?
Antwoord - 17 juli 2008
Het belangrijkste advies: als dieren al in dit soort proeven gebruikt worden, zorg dan dat je een statisticus van
topkwaliteit in je team hebt om te garanderen dat de resultaten wetenschappelijk onderbouwd zijn. Een forum zoals dit
heb je dan niet nodig.
Dan een aantal tips:
Om te berekenen hoe groot de steekproef moet zijn, ben je ten eerste afhankelijk van de analyse techniek die je achteraf
toe gaat passen om de gegevens te analyseren. En de keuze voor een techniek is weer afhankelijk van het meetniveau
(zie onderwerp meetniveau). Als de drie variabelen van interval meetniveau zijn, ligt een multivariate
variantie analyse voor de hand. Als de berekening van de steekproefgrootte voor een multivariate analyse te ingewikkeld is
of niet ondersteund wordt door je software, gebruik dan uitsluitend de variabele waarbij je het grootste verschil verwacht.
Behalve als het essentieel is om bij alledrie de variabelen een verschil aan te tonen, neem dan juist de variabele waarbij
je het kleinste verschil verwacht.
De vergelijking betreft vier groepen, maar de meeste interesse gaat waarschijnlijk uit naar de vergelijking met de
gezonde dieren. In zo'n geval kan ervoor gekozen worden om de powerberekening te baseren op de vergelijking tussen
twee groepen (de gezonde met een andere groep). Deel daarbij de type I fout (alpha, meestal 0.05) wel door drie, omdat je
in feite drie toetsen doet. De vergelijking tussen de agressieve groepen onderling kan dan exploratief gemaakt worden
(er is waarschijnlijk toch erg weinig informatie vooraf over de grootte van deze onderlinge verschillen).
Al met al: versimpelen van het probleem is essentieel. Bedenk dat de powerberekening geen doel op zich is, maar alleen
bedoeld om de (vaak magere) informatie die al beschikbaar is te gebruiken om de proef efficiënt op te zetten.
Wat betreft de spreiding van de aantallen over de groepen: bij een vergelijking tussen twee groepen is het optimaal om
in beide groepen evenveel dieren te hebben. Als het puur gaat om de paarsgewijze vergelijkingen, neem dan in elke groep
evenveel dieren. Het is daarbij verdedigbaar om een iets groter aantal in de gezonde groep te nemen omdat de vergelijking
hiermee het meest van belang is. Dit is ook gunstig als (bij het niet vinden van een effect) besloten wordt om exploratief
een vergelijking te maken van de drie groepen samen tegenover de gezonde groep (want dan zou een driemaal zo groot aantal
in de gezonde groep optimaal zijn).
|
Steekproefgrootte |
Vraag - 17 februari 2006
Ik heb twee vragen met betrekking tot het aantal waarnemingen
voor de significantie van onderzoek naar het gedrag van zeepaardjes.
Ik ga onder andere onderzoeken of zeepaardjes voorkeur hebben voor natuurlijk of
kunstmatig houvast. Mijn onderzoeksopstelling zal als volgt zijn:
Ik zal n aquaria op exact dezelfde manier inrichten, per aquarium één natuurlijk
houvast en één vergelijkbaar kunstmatig houvast. In ieder aquarium zal 1
zeepaardje geplaatst worden.
In het kader hiervan zou ik graag weten hoeveel aquaria ik nodig heb en hoeveel
waarnemingen, om tot een significant resultaat te komen?
De andere onderzoeken zijn vergelijkbaar, behalve één;
Als er jonge zeepaardjes geboren worden, stijgen ze op naar de oppervlakte. Er
is echter altijd een aantal juvenielen dat in de waterkolom blijft zweven.
We willen onderzoeken of er verschil is in overlevingspercentage tussen de
individuen die gaan drijven en de individuen die blijven zweven in de
waterkolom.
Mijn volgende vraag is, hoeveel waarnemingen zijn er nodig om hierbij tot
een significant resultaat te komen?
Antwoord - 18 februari 2006
Bij het doen van een statistische toets moet ten eerste aangenomen worden dat de
waarnemingen onafhankelijke replicaties zijn. Bij het aanhechtings onderzoek lijkt dat
me geen probleem, zolang aan elk zeepaardje slechts één waarneming verricht wordt.
Het onderzoek naar overlevingspercentage is ingewikkelder: alle jongen uit één worp
hebben een aantal factoren gemeenschappelijk (genetisch, omstandigheden tijdens de
geboorte) die zowel op het blijven zweven, als op de overleving van invloed kunnen zijn.
Door deze factoren zijn de waarnemingen niet onafhankelijk van elkaar. Daarom moet met
de factoren rekening gehouden worden bij de statistische toetsing. Dat kan dmv
multilevel analyse; voorwaarde is dan dat de gegevens per individu verzameld worden. Een
alternatief is, om per worp gegevens te verzamelen, dus het % blijven zweven en het %
overleving per worp; die gegevens zijn wel onafhankelijk. Maar dan zijn er aanzienlijk
meer individuen nodig, vooral wanneer de verschillen tussen worpen klein zijn.
Het bepalen van de steekproefgrootte is vrij simpel voor het aanhechtings onderzoek.
Wanneer er geen verschil in voorkeur is, dan zal naar verwachting even vaak van een
natuurlijk als van een
kunstmatig houvast gebruik gemaakt worden, beide 50%. Hoe groter het verschil in
voorkeur, des te kleiner het aantal waarnemingen dat nodig is voor een significant
verschil - te bepalen dmv de Chi kwadraat toets. Onderstaande tabel geeft aan hoe de
grootte van het verschil samenhangt met het minimale aantal waarnemingen voor een
statistisch significant (p<0.05) resultaat. Eén aquarium mag best meerdere keren
gebruikt worden. Maar wissel wel de posities van de houvasten, en houd de omstandigheden
(licht, temperatuur, tijd ed) zoveel mogelijk constant.
Verhouding percentages | Minimaal aantal waarnemingen |
90.0% vs 10.0% | 10 |
75.0% vs 25.0% | 16 |
69.2% vs 30.8% | 26 |
67.5% vs 32.5% | 40 |
63.3% vs 36.7% | 60 |
61.3% vs 38.8% | 80 |
60.0% vs 40.0% | 100 |
Om de steekproefgrootte voor het overlevings onderzoek te bepalen, is meer informatie
nodig. De vereiste steekproefgrootte is afhankelijk van het verwachte aantal
jongen per worp, het verwachte percentage jongen dat blijft zweven, het verwachte
percentage overleving wanneer het onderzoek stopt en de verwachte variatie tussen de
worpen.
|
Power McNemar test |
Vraag - 30 januari 2006
Op tijdstip t0 meet ik een percentage (P0) onder een groep personen. Op tijdstip
t1 ga ik onder dezelfde groep personen weer dat percentage meten (P1).
Op tijdstip t1 kan ik de twee percentages vergelijken met de McNemar test. Dan
weet ik namelijk ook hoe elke persoon zich ontwikkeld heeft.
Op tijdstip t0 wil ik nu echter uitrekenen bij welke steekproefgrootte N een
gemeten verschil op t1 van (bijvoorbeeld) precies P1-P0=4% significant zal zijn.
Ik zie hier 2 problemen. De "binnenkant" van de 2x2-tabel is niet bekend op
tijdstip t0. Daarnaast gebruikt de McNemar test alleen de aantallen "mismatches"
en NIET de totale N.
In navolging van mijn eerdere vraag....
Is het niet raar dat de McNemar test helemaal geen rekening houdt met de totale
steekproefgrootte? Als ik dus bijvoorbeeld b=10 vergelijk met c=2 (In een 2x2
tabel [a b; c d]), dan is de significantie volledig onafhankelijk van de totale
steekproefgrootte. Want voor a=d=1 (N=14) is de uitkomst van de test exact
dezelfde als voor a=d=1000 (N=2012)!!
Ik snap dat de McNemar test alleen de informatie gebruikt van de veranderingen,
maar de power van deze test hangt toch direct samen met de totale
steekproefgrootte?
Antwoord - 1 februari 2006
De power (dat is de kans om een statistisch significant effect te vinden) van de McNemar
test is inderdaad afhankelijk van het aantal gevallen met twee verschillende uitkomsten,
en niet van de totale steekproefgrootte.
De steekproefomvang die nodig is om een bepaald verschil (zoals P1-P0=4%) aan te
kunnen tonen, is niet alleen afhankelijk van het verschil, maar ook van de mate waarin
de uitkomsten consistent zijn. Vergelijk dit met de correlatie tussen m0 en m1, die van
invloed is op de power van een gepaarde t-test.
In het voorbeeldje met N=14 en N=2012 ben je er alleen in geïnteresseerd of er een
tendens is om de ene of de andere kant op te veranderen. De enige informatie die
daarover beschikbaar is, komt van 12 personen, dus N=12. Bedenk ook dat de effect size
(het verschil tussen de percentages) veel groter is in het geval van N=14.
Met andere woorden: de percentages worden wel veel preciezer bepaald bij N=2012, maar
het verschil tussen de percentages is ook veel kleiner!
|
Interventie effect bij dichotome uitkomstmaat |
Vraag - 29 september 2005
Ik heb in een ziekenhuis gemeten of verpleegkundigen bepaalde voorschriften wel of niet
uitvoeren. De uitslag is in procenten. Na een aantal klinische lessen en andere vormen
van motiveren hoop ik dat de naleving van de voorschriften beter is. Voor de interventie
was de naleving 40 %, na de interventie was de naleving 51 % De steekproefgrootte is 35.
Ik heb een berekening uitgevoerd waarbij ik het 95 % BI heb uitgerekend, 95 % BI =
gemiddelde plus/min 1.96 maal de wortel uit (P*(1-P))/N. Is dit de juiste formule?
Antwoord - 30 september 2005
De formule berekent een betrouwbaarheidsinterval voor een percentage, en doet dat volgens de normale
verdeling. Deze benadering mag alleen gebruikt worden wanneer de steekproef voldoende groot is en de
kans niet te dicht bij 0% of 100% ligt. In dit geval is de steekproef vrij klein, maar de kans ligt
zo ver van 0% en 100% af, dat de benadering voldoet.
Maar, een betrouwbaarheidsinterval heeft betrekking op één percentage, en geeft geen antwoord op de
vraag of de twee percentages van elkaar verschillen. Beide percentages hebben een onzekerheidsmarge,
en een betrouwbaarheids interval is niet voldoende om te zeggen of ze significant van elkaar
verschillen.
Om een verschil tussen de percentages te toetsen, moet ten eerste een aanname gemaakt worden,
namelijk dat het percentage zonder interventie gelijk gebleven zou zijn. Deze aanname gaat niet op
wanneer er een tijdseffect is, of wanneer het doen van de meting op zich al tot een verandering
leidt. Om de aanname te toetsen, wordt ook gemeten in een controlegroep, die de interventie niet
krijgt.
Dan zijn er twee opties om een verschil te toetsen. Wanneer de voormeting en de nameting binnen
dezelfde steekproef gedaan zijn, dan kan de McNemar toets gebruikt worden. Je toetst daarmee of het
aantal mensen dat positief veranderd is, significant verschilt van het aantal mensen dat negatief
veranderd is. Wanneer de voormeting en de nameting binnen verschillende steekproeven gedaan zijn,
kan een chi kwadraat toets gebruikt worden. Je toetst daarmee of er samenhang is tussen de variabele
voor/na en de uitkomstvariabele (wel/niet naleven).
|
Meetniveau |
Vraag - 15 juli 2005
Heeft u uitleg over de verschillende meetniveaus; nominaal, ordinaal,
discreet en continu?
Antwoord - 18 juli 2005
Bij nominaal meetniveau is er een kwalitatief onderscheid tussen de waarden die een
variabele aan kan nemen. De verschillende uitkomsten hoeven niet als getallen uitgedrukt
te worden, en hoeven ook geen volgorde te hebben. In plaats van nominaal meetniveau
wordt ook wel gesproken van categorische of multinomiale uitkomsten.
Wanneer een nominale variabele slechts twee categorieën heeft, wordt dit binomiaal,
binair of dichotoom genoemd. Omdat er slechts twee mogelijke uitkomsten zijn, kunnen
dit soort gegevens behandeld worden als gegevens van interval meetniveau, zie onder.
Voor ordinaal meetniveau is het vereist dat de waarden die de een variabele aanneemt te
ordenen zijn volgens een bepaald criterium. Dus, dat de gegevens een volgorde hebben.
Interval meetniveau betekent dat de gegevens getallen zijn, dat ze een volgorde hebben,
en dat de afstand tussen getallen dezelfde betekenis heeft op verschillende punten van
de schaal. Dit laatste houdt in dat het verschil tussen twee uitkomsten betekenisvol is.
Bijvoorbeeld: het verschil tussen 1 en 2 is even groot als het verschil tussen 5 en 6,
namelijk 1.
Gegevens van ratio meetniveau voldoen aan dezelfde criteria als gegevens van interval
meetniveau. Daarbij is er ook nog een nulpunt, daardoor is de verhouding tussen twee
uitkomsten betekenisvol. Bijvoorbeeld: 2 verhoudt zich tot 4, zoals 3 zich tot 6
verhoudt, het is namelijk de helft.
Continu betekent dat alle getallen in een bepaalde range mogelijk zijn als uitkomsten
(dus ook getallen met vele cijfers achter de komma). Discreet betekent dat alleen
bepaalde waarden aangenomen kunnen worden (bijvoorbeeld alleen hele getallen).
|
Toeval of niet? |
Vraag - 1 juni 2005
Mijn moeder heeft vier kinderen gekregen. Elke keer als ze zwanger was heeft ze
voorspeld wat het zou worden (een jongetje of een meisje) en ze had het vier
keer bij het rechte eind. Hoe groot is nou de kans dat ze het vier keer goed
voorspeld heeft?
Antwoord - 4 juni 2005
De kans om één keer een goede voorspelling te maken is 50 %, er worden zoiets
evenveel jongetjes als meisjes geboren. De kans op een combinatie van uitkomsten
kan berekend worden door de kansen met elkaar te vermenigvuldigen. Dus de kans om
het geslacht van allevier de kinderen goed te voorspellen is 50% * 50% * 50% * 50%
= 6.25 %.
Als statisticus is het belangrijk om altijd vóóraf hypotheses te stellen. Als je
namelijk op basis van een onverwachte gebeurtenis (vier keer goed voorspellen) een
statistische analyse gaat doen, zul je al snel constateren dat de kans klein was:
daarom was de gebeurtenis ook onverwacht!
Mocht je toch twijfelen of je moeder helderziend is: laat haar 10 keer voorspellen of
je kop of munt gooit. De kans dat ze het 10 keer goed heeft is slechts 0,1 % (één op
duizend). En dit geldt uiteraard ook voor het goed voorspellen van het geslacht van
10 kinderen. Dus: van elke 1000 moeders met 10 kinderen, zal er één zijn
die ze alle 10 goed voorspeld had. Ik vraag me af: hoe groot is de kans dat zo iemand
zal denken dat ze echt helderziend is? ...
|
Vergelijkingsdata of Likert schaal |
Vraag - 27 april 2005
Ik wil een enquete doen voor een horeca-leverancier. De leverancier wil graag weten wat
de bar-eigenaren van de huidige situatie vinden én welke vorm van service ze het liefst
ontvangen. Daarom wil ik een lijst opstellen waarbij de bar-eigenaren in een soort
rangorde kunnen aangeven wat ze belangrijk vinden. Weet iemand hoe dat type onderzoek
heet en waar ik meer informatie erover kan vinden?
Het is me van verschillende kanten afgeraden om het op deze manier te doen, omdat het
voor de respondent vaak een vervelende klus is om in te vullen. Zou een Likert-schaal
misschien ook een goed optie zijn?
Antwoord - 27 april 2005
Maak de keuze voor een vorm van gegevensverzameling in de eerste plaats op basis van de
vraagstelling. De gegevens die je krijgt wanneer je respondenten een rangorde laat
aanbrengen (vergelijkingsdata) zijn vooral gericht op het onderscheiden van stimuli,
zoals vormen van service. Dus hiermee kan nagegaan worden hoe verschillende vormen van
service zich tot elkaar verhouden. Een Likert schaal is gericht op het onderscheiden
van respondenten, zoals bar-eigenaren, met betrekking tot één kenmerk. Hiermee kan
bijvoorbeeld in beeld gebracht worden in welke mate individuele bareigenaren positief
zijn over de huidige situatie.
Het invullen van vergelijkingsdata kan voor de respondenten een lastige klus zijn, en
ook het analyseren vraagt speciale technieken (schaaltechnieken). Gebruik van een Likert
schaal is meer standaard praktijk. Likert schaal gegevens zijn dan ook makkelijker met
standaard methoden te analyseren. Maar bedenk dus eerst goed welke gegevens het beste
aansluiten bij de vraagstelling.
|
Chi kwadraat toets |
Vraag - 27 april 2005
Ik heb twee afzonderlijke enquetes gehouden, een Nederlandse en een
Duitse steekproef. Daarbij heb ik gebruik gemaakt van een groot aantal vragen
met diverse antwoordcategorieen (bijvoorbeeld de variabele vervoerwijze met als
categorieen auto, fiets, trein, bus etc.). Is het mogelijk om aan de hand van
dit type antwoorden (die ik reeds heb gecodeerd in SPSS) te berekenen of er
significante verschillen tussen Nederland en Duitsland zijn en is het mogelijk
om een regressie-analyse voor deze diverse kwalitatieve variabelen uit te
voeren?
Antwoord - 27 april 2005
Om te bepalen of er een significante samenhang is tussen de variabele vervoerswijze
en de variabele land (met andere woorden: of er een significant verschil tussen de
landen is) kan de Chi kwadraat toets gebruikt worden. In SPSS gaat dat via het menu
Analyze >Descriptives >Crosstabs. Geef de ene variabele op bij Rows en de andere bij
Columns. Vink onder Statistics de Chi Square aan. Je kunt de chi kwadraat toets
online uitvoeren op www.ethologie.nl/methoden/statonline.htm
.
Lineaire regressie analyse kan alleen toegepast worden voor continue variabelen. Niet
voor variabelen die dergelijke beschrijvende categorieën als uitkomst hebben. Wanneer
je toch de multivariate samenhang tussen verschillende variabelen in kaart wilt brengen,
raad ik aan om een loglineair model toe te passen. Dat kan in SPSS via het Analyze
>Loglinear menu.
|
Non-response |
Vraag - 20 april 2005
Ik heb voor mijn (schriftelijke) enquête 115 mensen aangeschreven. Hoeveel procent moet
ik hiervan terug krijgen om een valide onderzoeksrapport te schrijven?
Antwoord - 20 april 2005
Om een valide onderzoeksrapport te schrijven, is het belangrijk dat de gegevens die je
analyseert representatief zijn voor de populatie waarover je een uitspraak doet. Wanneer
een deel van de steekproef geen respons geeft op de enquête, dan is de vraag of dit deel
van de mensen andere antwoorden gegeven zou hebben dan de respondenten die wel
geantwoord hebben.
Het gaat er dus niet zozeer om hoeveel mensen antwoorden, je moet je afvragen of de
non-respondenten systematisch verschillen van de respondenten. Wanneer je enige
informatie hebt over kenmerken van de non-respondenten (woonplaats, geslacht, leeftijd)
kun je in elk geval nagaan of deze kenmerken erg verschillend zijn van de kenmerken van
de groep respondenten. Wanneer dat het geval is, heb je reden om te twijfelen aan de
respresentativiteit van de gegevens.
Om na te gaan hoe erg het effect van de non-response kan zijn, kun je de niet
teruggestuurde enquêtes zelf invullen met gegevens die maximaal afwijken van de gegevens
in de wel ingestuurde enquettes. Analyse van de aangevulde gegevens geeft dan een idee
hoe erg verschillend de totaalschatting maximaal geweest zou kunnen zijn wanneer alle
mensen gereageerd hadden.
|
Gegevens invoeren en verwerken |
Vraag - 1 maart 2005
Ik heb ongeveer 150 enquêtes afgenomen, die ik nu moet gaan verwerken en ik heb geen
idee hoe ik dit aan moet pakken. Welk programma kan ik het beste gebruiken?
Antwoord - 1 maart 2005
Om te beginnen moet je de gegevens invoeren. Het maakt niet zoveel uit in wat voor
programma je dit doet: wanneer je gegevens op de juiste manier invoert is het vrij
makkelijk om deze achteraf met een ander programma te openen voor verdere analyses.
Voor het invoeren kun je een spreadsheet programma (zoal Excel) gebruiken. Neem
voor iedere uitkomstvariabele een aparte kolom, en zet de gegevens van iedere respondent
in een aparte rij. Een klein voorbeeldje:
Wanneer je de gegevens op deze manier opslaat, heb je een goede basis gelegd voor
verdere verwerking van de gegevens.
|
Ordinaal meetniveau in regressie analyse |
Vraag - 28 februari 2005
Ik ben bezig met de verwerking van mijn resultaten. Nu heb ik
een aantal variabelen op ordinaal meetniveau. Hier wil ik echter een regressie
analyse op uitvoeren, met de aanname dat de afstand tussen de items gelijk is.
Maar is hier ook onderbouwing voor uit de literatuur?
Antwoord - 28 februari 2005
Om lineaire regressie analyse te doen met een variabele van ordinaal meetniveau, neem
je aan dat de intervallen tussen de categorieën van de variabele even groot zijn.
Daarbij moet je zeker ook controleren of de relatie tussen de onafhankelijke variabele
(X) en de afhankelijke variabele (Y) lineair is. Bereken voor elk niveau van X het
gemiddelde van Y. Plot daarna de gemiddelden van Y tegen X, en beoordeel of het verband
lineair is. Maar, grote voorzichtigheid blijft geboden; significantie toetsing van
regressie parameters kan vertekend zijn vanwege het beperkte aantal categorieën dat een
ordinale variabele vaak heeft.
|
Representatieve steekproef |
Vraag - 18 februari 2005
Ik wil een enquete gaan uitzeten onder de inwoners van de gemeente Borsele.
Ik wil een aantal enquetes mondeling afnemen, mensen aanschrijven en een
enquete op het internet uitzetten. Maar wanneer is een onderzoek representatief?
Bij hoeveel respons? En hoeveel enquetes zou ik uit moeten zetten om een betrouwbaar
advies te kunnen geven?
Antwoord - 19 februari 2005
Voor een representatieve steekproef, moeten alle personen waarover je een uitspraak
wilt doen (dus alle inwoners van de gemeente Borsele) een even grote kans hebben om
deel uit te maken van de steekproef. Daarom moeten de respondenten random (willekeurig)
geselecteerd worden.
Het aantal personen dat nodig is voor betrouwbare resultaten, hangt af van de vraag
die je wilt beantwoorden. Voor het doen van een uitspraak over één uitkomstmaat per
variabele (bijvoorbeeld: het percentage mensen dat een hond heeft; of: het gemiddelde
inkomen) is een relatief klein aantal voldoende. Als minimum zou ik 30 personen noemen.
Maar altijd geldt: hoe meer personen, des te preciezer je schatting.
Voor het doen van een uitspraak over het verband tussen twee (of meer) variabelen
(bijvoorbeeld: de samenhang tussen hondenbezit en inkomen), zou ik streven naar
minstens 50 personen.
Voor een respresentatieve steekproef moet je proberen om zoveel mogelijk mensen die je
geselecteerd hebt, ook werkelijk mee te laten doen. Maar houd er rekening mee, dat er
altijd mensen zijn die niet meedoen. Trek daarom aanvankelijk een steekproef die ruim
groot genoeg is.
Wanneer je vantevoren al weet dat je bepaalde groepen wilt gaan vergelijken
(bijvoorbeeld: 65+ers ten opzichte van de rest), kan het nuttig zijn om een
gestratificeerde steekproef te trekken. Dit houdt in dat je voor elk van de
groepen apart bepaalt hoeveel mensen je wilt benaderen, en vervolgens per groep
een random steekproef trekt. Bij een vergelijking tussen groepen is het namelijk gunstig
om in alle groepen evenveel personen te hebben.
Let wel: wanneer je op basis van een gestratificeerde steekproef een uitspraak wilt
doen over de populatie als geheel (iedereen in de gemeente Borsele), dan moet je
rekening gehouden met de grootte van de groepen in de populatie. Voorbeeldje: wanneer
65+ers 20% van de populatie uitmaken en een gemiddeld inkomen van 1200 Euro hebben,
terwijl de rest een gemiddeld inkomen van 1600 Euro heeft, dan is de schatting voor
het totale gemiddelde 20% * 1200 + 80% * 1600 = 1520 Euro.
|
Regressie analyse en moderatie |
Vraag - 20 januari 2005
Ik ben bezig met een onderzoek naar de causale relatie tussen
diversiteit en conflict. Werkdruk fungeert als modererende
variabele. Ik kom er niet helemaal uit.
diversiteit --------> conflict
^
|
werkdruk
Diversiteit meet ik met de entropy-based index (Jehn). Informational diversity
is geoperationaliseerd met de indicatoren: vooropleiding en werkervaring. Dit
zijn categorische variabelen, maar door de fomule worden ze volgens mij omgezet
naar continue variabelen.
Een (reeds bestaande en betrouwbare) vragenlijst is gestuurd naar alle
individuen van de werkgroepen (5 punt Likert-schaal). Ik heb een 70%
responsrate. De gegevens zijn o.a. m.b.v. de formule verwerkt tot
groepsgemiddelden.
Taakconflict en werkdruk per groep meet ik ook door het berekenen van
gemiddelden. Deze (reeds bestaande en betrouwbare) vragenlijsten zijn dus ook
verstuurd naar de individuen van de werkgroepen (70% respons).
M.b.v. regressieanalyse wil ik uitspraken kunnen doen over de relaties van de
variabelen. Kan iemand mij misschien uitleggen of dit allemaal wel kan en waar
ik rekening mee moet houden? Een beperking van het onderzoek is dat ik maar
een klein aantal groepen kan onderzoeken, namelijk 15 ofzo (5/6 leden per groep).
Antwoord - 20 januari 2005
Als ik het goed begrijp heb je 15 groepen, met in elke groep 5 of 6 metingen
op individueel niveau. Dit zijn erg lage aantallen, ik schat de kans dat je
moderatie aan kunt tonen klein, maar dat terzijde. Moderatie houdt in, dat het
verband tussen A (diversiteit) en B (conflict) afhankelijk is van C (werkdruk),
zoals je mooi in het schemaatje weergegeven hebt.
Normaal gesproken zou je een regressie model kunnen toetsen met A en C en A*C
(interactie) als voorspellers van B. Met interactieterm A*C zou dan de moderatie
getoetst worden. Maar omdat je waarnemingen hebt die binnen groepen geclusterd zijn,
zou ik als volgt te werk gaan:
Stap 1
Bereken binnen elk van de groepen, op basis van de metingen op individueel niveau,
de gestandaardiseerde regressiecoëfficiënt (D) voor de voorspelling van B uit A
(deze coëfficient is gelijk aan de correlatie tussen A en B). Deze stap doe je dus
15 keer, met steeds 5 of 6 gegevens als input.
Stap2
Doe vervolgens een analyse waarin je de gevonden regressiecoëfficiënten D (één per
groep) voorspelt uit de gemiddelde werkdruk C van de groep. Deze stap doe je dus één
keer, met 15 gegevens als input. Wanneer het verband tussen C en D significant is,
heb je moderatie aangetoond.
|
- - Home
- Contact - -
|