1 / 43

Deel 1

Deel 1. Meten van onderzoeksvariabelen. Chapter 11. Measuring Research Variables. Validiteit van instrumenten. Validiteit = de mate waarin de test of het instrument meet wat hij bedoelt te meten Belangrijkste criterium = degelijkheid van de test. 1.1. Logische validiteit.

talmai
Télécharger la présentation

Deel 1

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Deel 1 Meten van onderzoeksvariabelen Chapter 11. Measuring Research Variables

  2. Validiteit van instrumenten • Validiteit = de mate waarin de test of het instrument meet wat hij bedoelt te meten • Belangrijkste criterium = degelijkheid van de test

  3. 1.1. Logische validiteit • Wordt soms ‘face validity’ genoemd = voor de hand liggend, duidelijk • Bv. Evenwicht – op één been Snelheid lopen – tijd over afstand • Meestal meer objectieve methoden

  4. 1.2. Inhoudsvaliditeit • Meestal gebruikt in opleiding • = Als de test dekt wat in de les is gegeven Op basis van - doelstellingen en gewicht • Ook geen statistische manier om te bepalen

  5. 1.3. Criterium validiteit • Instrumenten worden gevalideerd ten opzichte van een criterium • Twee soorten : • Concurrente validiteit • Predictieve validiteit

  6. Concurrente validiteit • Correlatie van het instrument met een criterium op zelfde moment • Criterium is dan een reeds gevalideerd, aanvaard instrument OF scores van beoordelaars of prestaties • Typisch gebruik om een test korter of minder moeilijk te maken

  7. Voorbeeld : • VO2 max correleren met trappen lopen • sportcompetentie test correleren met scores van beoordelaars • Goede keuze van het criterium is essentieel

  8. Predictieve validiteit • Criterium dat voorspeld moet worden bv. Succes, slagen of prestaties • Standaard van het criterium mag niet te hoog of laag zijn, weinig voorspelbaarheid • Meestal niet 1 correlatie coëfficiënt maar verschillende predictoren : multiple regressie

  9. Voorbeeld : Gebruik van huidplooien om % vet te meten • Meestal minder predictieve validiteit van dezelfde formule bij andere sample = inkrimping • Oplossing = cross-validatie : • bij 2e sample zelfde formule en correlatie tussen voorspelde en actuele scores • Vergelijking tussen R2 en r2 geeft inkrimping

  10. 1.4. Construct validiteit • Indien niet observeerbare constructen gemeten worden bv. intelligentie, angst, attitude, creativiteit, … • Mate waarin de test dit construct meet door te relateren aan een bepaald gedrag • Bv. Test om ‘fair play’ te meten en observeren tijdens wedstrijd

  11. Methode van de gekende groepsverschillen: 2 groepen waarvan men weet wat verschillen zijn vergelijken op test • Gebruik van een experiment: bv. Het verhogen van de fitheid na een programma

  12. 2. Generaliseren van validiteit • Validiteit is populatie specifiek : hoogste validiteit voor sample waarin het is vastgesteld • Andere leeftijd, geslacht, SES ? • Verschillende studies nodig die predictor – criterium combineren

  13. 3. Validiteit in kwalitatief onderzoek • In kwalitatief onderzoek geen cijfers : « ziet of hoort de onderzoeker wat hij denkt dat hij ziet of hoort ? » • Steeds afvragen of de conclusies juist zijn • Type III fouten = de verkeerde vragen stellen

  14. 4. Betrouwbaarheid van meetinstrumenten • Betrouwbaarheid is een deelaspect van validiteit = is het instrument consistent of herhaalbaar • Verschillende testen na elkaar moeten dezelfde resultaten geven • Nooit valide als hij niet betrouwbaar is • Wel betrouwbaar meer niet valide (bv. Kapotte weegschaal

  15. Geobserveerde score = echte score + fout score • Doel is om fout score zo klein mogelijk te houden • Betrouwbaarheidscoëfficiënt is de mate waarin het instrument vrij is van fout variantie

  16. 4.1. Oorzaken van meetfouten • Subject : motivatie, stemming, vermoeidheid, geheugen, … • Testen : heldere instructies, bijkomende richtlijnen, … • Scoring : competentie, ervaring, toewijding, … van scorers • Instrumentarium : fouten bij het toestel of bij de codering

  17. 4.2. Betrouwbaarheid uitdrukken met correlatie • Hoe dichter bij 1, hoe meer betrouwbaar, hoe kleiner de fout variantie • Pearson r = interclass correlatie • Twee verschillende variabelen • Validiteit • Gebruik van ANOVA = intraclass correlatie • Twee keer zelfde variabele • Betrouwbaarheid

  18. Interclass correlatie Pearson r voor validiteit kan niet gebruikt worden voor betrouwbaarheid omdat : • Pearson r voor twee variabelen niet voor 1 variabele verschillende keren • Slechts twee variabelen, meestal meer trials • Geen meting van veranderingen in gemiddelde of stand. dev.

  19. Intraclass Correlatie Berekenen via SPSS Scale > reliability > intraclass correlatie • Single Measure Intraclass correlation • Rekening houden met variantie tussen trials • Average Measure Intraclass correlation • Geen rekening houden met variantie tussen trial (=hogere waarde)

  20. Kan gebruikt worden voor : • Verschillende trials afnemen en kijken of er verschillen zijn (leereffect – vermoeidheid) • Interbeoordelaarsbetrouwbaarheid

  21. 5. Methoden om betrouwbaarheid vast te stellen 5.1. Stabiliteit • Test-hertest methode • Interval houdt rekening met : rust, leren, maturatie, kennis

  22. 5.2. Parellelle test methode • Twee testen met zelfde inhoud • Afnemen bij zelfde populatie • Correleren geeft betrouwbaarheidscoëfficiënt

  23. 5.3. Interne consistentie • TEST-HERTEST op 1 dag • Prestatietests geen schriftelijke tests • Hoge correlatie (Intraclass) • SPLIT-HALF • Test in twee verdelen : even en oneven vragen • Correleren : consistentie van de scores in de test

  24. CRONBACH ALPHA • Meest gebruikte methode • Via SPSS > Scale > reliability • Zowel dichotoom split half verschillende trials of tests

  25. 6. Interbeoordelaarsbetrouwbaarheid • = objectiviteit • Scoren verschillende testers gelijk ? • Gedrag : codeerschema • Met Intraclass correlatie • Interobserver Agreement (IOA) = percentage overeenkomst door aantal overeenkomst ten opzichte van totaal

  26. 7. Betrouwbaarheid in kwalitatief onderzoek • Geen test-hertest bij interview of in natuurlijke setting

  27. 7.1. Externe betrouwbaarheid Is de inhoud van de data betrouwbaar ? Bedreiging : • Status van de researcher • Keuze van subjecten • Context en sociale situatie • Constructen en hypothesen • Methode van data verzamelen en analyseren

  28. 7.2. Interne betrouwbaarheid Zou een andere observator dezelfde data hebben verzameld ? Strategieën : • Zeer uitgebreid beschrijven • Verschillende onderzoekers • Review van collega’s • Opnames zodat ze gehercodeerd kunnen worden

  29. 8. Soorten schalen8.1. Nominale schalen • Categorieën • Mutueel exclusief • Geen ordening

  30. 8.2. Ordinale schalen • Rangen • Van laag naar hoog • Geen gelijke intervallen • Categorieën gemaakt door onderzoeker • Laag – hoog • Laag – matig – hoog => Tussen nominaal en ordinaal

  31. 8.3. Interval • Ordening + gelijke afstand tussenin 8.4. Ratio • Ordening + gelijke afstand + nulpunt • Nulpunt = afwezigheid

  32. 9. Standaardscores • Om prestaties te vergelijken : beter op evenwicht dan op kracht ? • Elke score omzetten in standaardscore • Standaardscores uitgedrukt in standaard afwijkingen van het gemiddelde

  33. 9.1. z- scores • Gemiddelde aftrekken en delen door de standaarddeviatie (x – x) / s • Gemiddelde 0 en stand. dev. 1

  34. 9.2. T scores • T = 50 + 10 z • Gemiddelde 50 en stand. dev. 10 • Meestal tussen 20 en 80

  35. 10. Meten van beweging • Kracht, lenigheid, snelheid, … • Meestal minder problemen van validiteit en betrouwbaarheid dan tests • Bij meer complexe studies wel ook validiteit en betrouwbaarheid nagaan

  36. 11. Meten van emoties • Attitudevragenlijst + gedrag ! • Zo veel mogelijk bestaande en gevalideerde lijsten • Invullen van vragenlijst op zich kan verandering met zich meebrengen • Sociale wenselijkheid : niet naar waarheid antwoorden

  37. Hoe specifieker vragenlijsten, hoe meer je er kan mee doen • Voorbeeld : • dus niet : algemene angst • maar wel : competitie angst

  38. 12. Schalen om emoties te meten LIKERT-schalen • 5 of 7 punten schaal met gelijke intervallen tussen de punten • Mate waarmee men akkoord gaat met iets • Is meestel meer betrouwbaar dan ja / nee antwoorden

  39. SEMANTISCHE DIFFERENTIAAL • Bipolaire items op zeven punten schaal • Bv. De coach is • Eerlijk 1 2 3 4 5 6 7 Oneerlijk CLASSIFICATIE SCHALEN • Rating scales • Door observatoren of self-rating • Schaal zelf maken om prestatie te meten • Antwoorden : ja/nee, schaal, codering, …

  40. Fouten in classificatie : • Mildheid • Centrale tendens • Halo effect • Fouten van nabijheid • Vooroordelen van observator • Verwachtingsfouten van observator • Cfr. Self-fulfilling prophecy in de klas => zo weinig mogelijk info aan observator + goed trainen

  41. 13. Meten van kennis Nagaan of items goed zijn naar moeilijkheid en discriminerend vermogen = item analyse • Moeilijkheid • Moeilijkheidsindex : percentage correct • Onder 10% en boven 90% geven geen info • Afhankelijk van doel bepalen

  42. Discriminatie • Discrimineren van item tussen zij die het goed of slecht deden op de TOTALE test • Discriminatie-index : • Verdeel de groep in hoge en lage scorers (27%) • Formule : aantal juiste in hoge groep – aantal juist in lage totaal aantal in beide groepen • Best boven .20 zijn • Negatief moet zeker geëlimineerd worden

  43. Soorten kennis test items • Multiple choice items • zijn best meest betrouwbaar • Tussen 3 en 5 alternatieven • Te weinig alternatieven : minder betrouwbaar • Te veel alternatieven : te veel afnametijd • Moeten duidelijk zijn, aantrekkelijke alternatieven • Juist/fout items • Minder betrouwbaar • Meer items maken betrouwbaarheid toch redelijk

More Related