590 likes | 1.92k Vues
Gliederung. Einf
E N D
2. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von Peter Steck
Auswertung
Kritik
3. HAWIE-R deutsche Version des WAIS-R (Wechsler Adult Intelligence Scale - Revised 1981, Tewes 1991)
lst HAWIE von 1956 ab (=Aktualisierung der Iteminhalte)
ist ausschlielich ein Individualtestverfahren
mit Intelligenzleistungen von Altersstufe 16 bis 74 Jahre
vor allem fr klinisch- psycholog. Diagnostik entwickelt, in der es vorrangig um die Untersuchung von Ausfallerscheinungen geht Die wesentlichen Unterschiede zum HAWIE sind:
ber die Hlfte der Items wurden verndert, wobei insbesondere veraltete Items (z.B. der fehlende Schlips) ausgetauscht wurden.
Die Anzahl der Items in den einzelnen Untertests wurde z.T. verndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erhht).
Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen.
Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch.
Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht verndert.
Der Protokollbogen enthlt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.Die wesentlichen Unterschiede zum HAWIE sind:
ber die Hlfte der Items wurden verndert, wobei insbesondere veraltete Items (z.B. der fehlende Schlips) ausgetauscht wurden.
Die Anzahl der Items in den einzelnen Untertests wurde z.T. verndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erhht).
Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen.
Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch.
Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht verndert.
Der Protokollbogen enthlt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.
4. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
5. Definition von Intelligenz Intelligenz ist
die zusammengesetzte oder globale Fhigkeit des Individuums, zweckvoll zu handeln, vernnftig zu denken und sich mit seiner Umgebung wirkungsvoll auseinander zu setzen.
(nach David Wechsler, 1956; S.13) Wechslers berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz:
Gerade fr seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einflsse groe Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen.
Explizit nennt er: Trieb und Anreiz,
in gewisser Weise ist aber auch das Gedchtnis und die Fhigkeit zur sozialen Anpassung zu subsumieren.
Vorstellung basiert auf Alexander (1935):
Er besttigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollstndig zu erklren. Alexander zieht daraus den Schlu, da sich neben einem allgemeinen Faktor der Intelligenz je ein Faktor abstrakter und praktischer Fhigkeiten fr alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erklrung der Korrelationsmatrix nicht ausreicht, nimmt er ergnzende Faktoren, wie Temperaments- und Persnlichkeitsfaktoren an. Wechslers berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz:
Gerade fr seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einflsse groe Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen.
Explizit nennt er: Trieb und Anreiz,
in gewisser Weise ist aber auch das Gedchtnis und die Fhigkeit zur sozialen Anpassung zu subsumieren.
Vorstellung basiert auf Alexander (1935):
Er besttigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollstndig zu erklren. Alexander zieht daraus den Schlu, da sich neben einem allgemeinen Faktor der Intelligenz je ein Faktor abstrakter und praktischer Fhigkeiten fr alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erklrung der Korrelationsmatrix nicht ausreicht, nimmt er ergnzende Faktoren, wie Temperaments- und Persnlichkeitsfaktoren an.
6. Theoret. Konzept von Wechsler Allgemeine Intelligenz
= Gesamt-IQ resultiert aus der durchschnittl. Leistung in allen 11 Untertests
sie teilt sich in :
Verbal-Intelligenz
= Verbal-IQ setzt sich aus der durchschnittl. Leistung in den dazugehrigen Untertests zusammen
Handlungs-Intelligenz
= Handlungs-IQ; erfasst vor allem die nicht-intellektuellen Faktoren intelligenten Verhaltens Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben):
Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als strende Elemente angesehen und so weit wie mglich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests bentigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses mglich wre), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv abschtzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung.
theoretisches Konzept von Wechsler ist implizit hierarchisch:
Spitze bildet die Allgemeine Intelligenz (= Gesamt-IQ)
sie teilt sich in :
Verbal-Intelligenz
Handlungs-Intelligenz (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens)
! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer Fhigkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional quivalend fr die Messung der Intelligenz betrachtet werden.Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben):
Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als strende Elemente angesehen und so weit wie mglich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests bentigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses mglich wre), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv abschtzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung.
theoretisches Konzept von Wechsler ist implizit hierarchisch:
Spitze bildet die Allgemeine Intelligenz (= Gesamt-IQ)
sie teilt sich in :
Verbal-Intelligenz
Handlungs-Intelligenz (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens)
! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer Fhigkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional quivalend fr die Messung der Intelligenz betrachtet werden.
7. Testaufbau Wechsler stellte Testbatterien zusammen, die aus zwei gleichwertigen Testteilen bestehen (=Verbalteil & Handlungsteil)
Testteile bestehen aus mehreren Untertests (mglichst viele spezifische Fhigkeiten im Sinne Spearmans sollen erfasst werden)
Wechsler erhebt nicht den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat)
whlt Untertests, die sich in Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben; nicht nach Reprsentativitt Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll
Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen Fhigkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen Fhigkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren
Da jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch mglichst viele spezifische Fhigkeiten im Sinne Spearmans zu erfassen.
Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat)
Zitat Wechsler 1956, S.22:
denn kein Test wrde dazu gegenwrtig in der Lage sein. Wir knnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigermaen zuverlssigen Index der globalen Leistungsfhigkeit des Prflings bentzen knnen.
Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Reprsentativitt auszuwhlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben. Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll
Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen Fhigkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen Fhigkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren
Da jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch mglichst viele spezifische Fhigkeiten im Sinne Spearmans zu erfassen.
Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat)
Zitat Wechsler 1956, S.22:
denn kein Test wrde dazu gegenwrtig in der Lage sein. Wir knnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigermaen zuverlssigen Index der globalen Leistungsfhigkeit des Prflings bentzen knnen.
Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Reprsentativitt auszuwhlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben.
8. Verbalteil besteht aus sechs Untertests:
1) Allgemeines Wissen (AW, 24 Items)
2) Zahlennachsprechen (ZN, 14 Items)
3) Wortschatz-Test (WT, 32 Items)
4) Rechnerisches Denken (RD,14 Items)
5) Allgemeines Verstndnis (AV, 13 Items)
6) Gemeinsamkeiten finden (GF, 16 Items)
9. Handlungsteil setzt sich aus 5 Untertests zusammen:
1) Bilderergnzen (BE, 17 Items)
2) Bilderordnen (BO, 10 Items)
3) Mosaik-Test (MT, 9 Items)
4) Figurenlegen (FL, 4 Items)
5) Zahlen-Symbol-Test (ZS, 93 Items)
10. Einsatzbereich des HAWIE-R Auf dem Umschlag des Handbuchs heit es:
Der Test eignet sich zur Einschtzung des allgemeinen geistigen Entwicklungsstandes und der Untersuchung von alters-, milieu- oder krankheitsbedingten Leistungsbeeintrchti-gungen in bestimmten Bereichen. Er wird mit Vorteil auch bei Schlern in den oberen Klassen weiterbildender Schulen eingesetzt. Weiteres Zitat aus dem Handbuch:
Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da die Wechsler-Intelligenztests fr Erwachsene in der klinischen Praxis und Forschung zu den am hufigs-ten eingesetzten Testverfahren gehren ... Der HAWIE ist ... ein zur Zeit noch sehr gebruchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind. (Handbuch, S.8)Weiteres Zitat aus dem Handbuch:
Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da die Wechsler-Intelligenztests fr Erwachsene in der klinischen Praxis und Forschung zu den am hufigs-ten eingesetzten Testverfahren gehren ... Der HAWIE ist ... ein zur Zeit noch sehr gebruchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind. (Handbuch, S.8)
11. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
12. Praktische Handhabung/1 Testmaterialien:
Handbuch mit Testanweisung (121 Seiten, davon 32 Seiten Tabellen und 15 Seiten Anhang: Bewertungskriterien)
Vorlageheft fr die Untertests Bildergnzen und Mosaik-Test
Bildkarten zum Untertest Bildordnen
neun Wrfel fr den Mosaik-Test
Puzzelteile des Untertests Figurenlegen
Auswertschablone fr den Zahlen-Symbol-Test
25 Protokollbgen Handbuch:
Im Handbuch sind die Modalitten der Test-applikation festgelegt, die Instruktionen sind wrtlich vorgegeben. Handbuch:
Im Handbuch sind die Modalitten der Test-applikation festgelegt, die Instruktionen sind wrtlich vorgegeben.
13. Praktische Handhabung/2 Mehrzahl der Tests sind reine power-Tests
beim Handlungsteil fliet in die Verrechnung zumeist auch die speed-Komponente mit ein
Zahlen-Symbol-Test ist ein reiner speed-Test
Abbruchkriterium
beinhalten die meisten Untertests
Untertest wird unterbrochen, wenn die Tpn 3 bzw. 4 Aufgaben in ununterbrochener Reihenfolge nicht lsen knnen
Testdauer: 60 bis 90 Minuten
Auswertungsdauer: keine Angaben Die meisten Untertests sind power-Tests,
im Handlungsteil knnen zustzliche Zeitbonuspunkte erreicht werden (speed-Komponente);
der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest.
Fr eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gelst hat.
Testdauer wird mit 60 bis 90 Minuten angegeben,
die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht) Die meisten Untertests sind power-Tests,
im Handlungsteil knnen zustzliche Zeitbonuspunkte erreicht werden (speed-Komponente);
der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest.
Fr eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gelst hat.
Testdauer wird mit 60 bis 90 Minuten angegeben,
die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht)
14. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
15. Gtekriterien/1 Durchfhrungsobjektivitt aufgrund der meist sehr klaren Instruktionen gegeben; unterliegt lediglich den bei allen im Dialog durchge-fhrten Individualtests typischen Einschrnkungen (reduziert wegen Einzeltestvorgabe)
Ausnahme: Bilderordnen
Auswertungsobjektivitt wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden
Interpretationsobjektivitt ist gegeben Objektivitt (=Anwenderunabhngigkeit)
Durchfhrungsobjektivitt - Ausnahme:
Dem Testleiter wird beim Bilderordnen die Empfehlung gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die Lsungen zu begrnden oder beim Lsen eine Geschichte zu erzhlen - damit wird eine Verletzung der Durchfhrungsobjektivitt in Kauf genommen.
Auswertungsobjektivitt
wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden.
Aber:
trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da insbesondere beim Untertest Allgemeines Verstndnis noch Bewertungsdifferenzen auftreten knnen. Im Mosaik-Test mu jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier drften Auswertungsdifferenzen auftreten.Objektivitt (=Anwenderunabhngigkeit)
Durchfhrungsobjektivitt - Ausnahme:
Dem Testleiter wird beim Bilderordnen die Empfehlung gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die Lsungen zu begrnden oder beim Lsen eine Geschichte zu erzhlen - damit wird eine Verletzung der Durchfhrungsobjektivitt in Kauf genommen.
Auswertungsobjektivitt
wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden.
Aber:
trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da insbesondere beim Untertest Allgemeines Verstndnis noch Bewertungsdifferenzen auftreten knnen. Im Mosaik-Test mu jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier drften Auswertungsdifferenzen auftreten.
16. Gtekriterien/2 Reliabilitt wurde mittels Cronbachs-a bestimmt:
liegt fr die einzelnen Untertests und pro Altersgruppe zwischen .64 (FL) und .95 (ZS, mit Testhalbierung)
beim Gesamt-IQ bei mindestens .95
Standardmessfehler werden getrennt nach Skalen und Altersgruppen angegeben
kritische Differenzen fr Profilinterpretationen nicht angegeben Reliabilitt (=Zuverlssigkeit, d.h. wie genau mit der Test das, was er mit)
FL = Figurenlegen
ZS = Zahlen-Symbol-Test
ein Cronbachs-a von mindestens .90 wird darber hinaus nur gelegentlich fr die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtetReliabilitt (=Zuverlssigkeit, d.h. wie genau mit der Test das, was er mit)
FL = Figurenlegen
ZS = Zahlen-Symbol-Test
ein Cronbachs-a von mindestens .90 wird darber hinaus nur gelegentlich fr die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtet
17. Gtekriterien/3 faktorielle Validitt (= im Sinne einer Konstruktvalidierung)
die Wechslersche Unterteilung in einen Verbal- und Handlungsfaktor wird besttigt (allerdings haben ZN und RD auf beiden Faktoren substantielle Ladungen)
Extremgruppenvalidierung
Gruppenunterschiede zwischen Absolventen verschiedener Schultypen sowie zwischen Alkoholikern und Nicht-Alkoholikern bzw. hnlichkeiten zwischen Verwandten (z.B. Geschwister) werden als Hinweis fr die Validitt aufgefhrt. Validitt (=Gltigkeit, d.h. sie gibt an, ob der Test das mit, was er zu messen vorgibt)
Faktorielle Validitt:
ZN =Zahlennachsprechen
RD = Rechnerisches Denken
die hchsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78
die Ladungen mit jeweils anderen Faktoren sind durchweg klein
Extremgruppenvalidierung:
es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen Hauptschule, Realschule und Gymnasium sowie zwischen Alkoholikern und Nicht-Alkoholikern.Validitt (=Gltigkeit, d.h. sie gibt an, ob der Test das mit, was er zu messen vorgibt)
Faktorielle Validitt:
ZN =Zahlennachsprechen
RD = Rechnerisches Denken
die hchsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78
die Ladungen mit jeweils anderen Faktoren sind durchweg klein
Extremgruppenvalidierung:
es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen Hauptschule, Realschule und Gymnasium sowie zwischen Alkoholikern und Nicht-Alkoholikern.
18. Gtekriterien/4 Skalierung
dazu werden nur Analysen der klassischen Test-theorie angefhrt
Trennschrfen
sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983)
Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfaller-scheinungen geht (nicht fr die Untersuchung Hochbegabter, S.46) Skalierung:
hierzu werden nur Analysen der klassischen Testtheorie angefhrt - Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.(Handbuch S.9)
Trennschrfen:
sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983);
Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert -
Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.(S.46). Skalierung:
hierzu werden nur Analysen der klassischen Testtheorie angefhrt - Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.(Handbuch S.9)
Trennschrfen:
sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983);
Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert -
Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.(S.46).
19. Gtekriterien/5 Normierung
beruht auf Gesamtstichprobe von N=2000 Testpersonen, die hinsichtlich Alter zwischen 16 und 74 Jahre sind, wobei die 20 bis 34jhrigen berwiegen.
aber: Schulbildung und Geschlecht der Stich- probe war fr die BRD ca. um 1986 reprsentativ (wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen) Normierung:
Die eigentlichen Normen basieren lediglich auf den 20- bis 34jhrigen, weil laut Wechsler:
die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe (S. 13)
- die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ.
! Ergnzend knnen altersspezifische Normwerte bzw. Normwerte fr Gymnasiasten bestimmt werden, jedoch nur fr die einzelnen Untertests, nicht fr den IQ.
Aber:
wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch fr die neuen Bundeslnder gelten; dieser Einwand gilt mglicherweise auch fr die Schweiz und sterreich.Normierung:
Die eigentlichen Normen basieren lediglich auf den 20- bis 34jhrigen, weil laut Wechsler:
die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe (S. 13)
- die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ.
! Ergnzend knnen altersspezifische Normwerte bzw. Normwerte fr Gymnasiasten bestimmt werden, jedoch nur fr die einzelnen Untertests, nicht fr den IQ.
Aber:
wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch fr die neuen Bundeslnder gelten; dieser Einwand gilt mglicherweise auch fr die Schweiz und sterreich.
20. Das Verfahren ist: konomisch
bietet gute Beobachtungsmglichkeiten (z.B. im Handlungsteil Vorgehen nach Versuch und Irrtum vs. planvolles Handeln)
zumutbar (insbesondere fr klinisches Klientel)
Simulationen sind wie bei allen Leistungstests mglich; sie sind aber wegen guter Beobach-tungsmglichkeiten eher erkennbar als bei anderen erwachsenendiagnostischen Verfahren
keine systematischen Untersuchungen zur Fairne vorhanden konomisch:
fr einen Individualtest und entsprechend der Komplexitt des Gltigkeitsbereichs sehr konomisch und Ntzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsmglichkeit des Arbeits- und Kontaktverhaltens, erfasst wird.
Fr den Test gibt es im Erwachsenenbereich keine Alternative.
Zumutbarkeit:
ist im Sinne des Testkuratoriums (der Fderation deutscher Psychologenverbnde; 1986) gegeben; vielleicht mit der Einschrnkung, da jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird.
Verflschbarkeit/Simulationen:
bei Fragestellungen wie z.B. Rentenbegehren wichtig
Fairne: (d.h. ist nicht geprft!)
aber der Wortschatz-Test zeigt die hchsten Korrelationen zum Gesamt-IQ, das bedeutet, da Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeuropischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da weniger Gebildete wohl auch als weniger intelligent erscheinen.konomisch:
fr einen Individualtest und entsprechend der Komplexitt des Gltigkeitsbereichs sehr konomisch und Ntzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsmglichkeit des Arbeits- und Kontaktverhaltens, erfasst wird.
Fr den Test gibt es im Erwachsenenbereich keine Alternative.
Zumutbarkeit:
ist im Sinne des Testkuratoriums (der Fderation deutscher Psychologenverbnde; 1986) gegeben; vielleicht mit der Einschrnkung, da jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird.
Verflschbarkeit/Simulationen:
bei Fragestellungen wie z.B. Rentenbegehren wichtig
Fairne: (d.h. ist nicht geprft!)
aber der Wortschatz-Test zeigt die hchsten Korrelationen zum Gesamt-IQ, das bedeutet, da Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeuropischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da weniger Gebildete wohl auch als weniger intelligent erscheinen.
21. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
22. UmfragePsychologische Testverfahren in der Praxis
23. Umfrage Im wesentlichen 3 Kategorien von Tests im dt. Raum
(Kubinger; 1995)
24. Datenerhebung Fragebogen wurde an 1000 zufllig ausgewhlte Mitgliedern des Berufsverbandes Deutscher Psychologen (BDP) verschickt
Rcklauf von 271 Fragebgen (27,1 %)
davon konnten nur 250 ausgewertet werden
25. Fragebogen
26. Datenverarbeitung Auswertung erfolgte mittels berfhrung in numerischen Code bei Ja/ Nein Antworten und
Zuweisung in vorher festgelegten Kategoriensystemen (wurden berprft durch 2 unabhngige Beurteiler ?Kappa- Koeffizient zwischen .72 und .98)
27. Ergebnisse 169 von 250 Psychologen (67,9%) setzten Tests in der Berufspraxis ein
200 Tests waren erkennbar (von 254)
28. Ergebnisse
29. Vergleich
30. Qualittsmerkmale
31. Abgelehnte Verfahren Gar nicht oder ungern verwendete Tests (N=121):
- Rorschach- Test (24 Nennungen)
- MMPI (13)
- TAT (12)
- IST/ IST 70 (11)
- HAWIK/ HAWIK-R (8)
- HAWIE/ HAWIE-R (3)
Grnde / Nachteile:
- Unkonomisch
- Hauptgtekriterien/ Konstruktion ungengend
- Geringe /keine diagnostische Relevanz
- Geringe /keine Akzeptanz
- Auswertung schwer handhabbar
32. Subtest und Anwendung 53 der Befragten gaben an, sich bei den Tests auf einzelne Subtests zu beschrnken
- v.a. bei HAWIE/ HAWIE-R; IST/ IST 70; HAWIK/ HAWIK-R; LPS; PFK u.a.
58 Befragte gaben an, die Tests in abweichender Form anzuwenden
- v.a. bei HAWIK/ HAWIK-R; TAT u.a.
Abweichungen beziehen sich auf Instruktion, Durchfhrung (Zweckentfremdung, Verkrzung, Modifizierung des Testmaterials) und Auswertung
33. Fazit zur Umfrage Gehrt mit zu den am hufigsten verwendeten Tests (national und international)
Hat einen relativ stabilen Platz in der Rangordnung der letzten 20 Jahre
34. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
35. Auswertung/1 Allgemein:
Auswertung erfolgt ber die Anzahl richtig gelster Aufgaben
Berechnung von Verbal- IQ, Handlungs- IQ und Gesamt- IQ
daneben werden noch alters- und bildungsspezifische Wertpunkttabellen angeben
Dauer der Testauswertung: 5- 10 Minuten Auswertung, allgemein:
die Auswertung erfolgt ber die Anzahl der richtig gelsten Aufgaben
es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet
fr diesen Zweck werden die Wertpunktsummen fr die 6 Verbaltests, die 5 Handlungstests und fr alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert
direkt aus Umrechnungstabellen
daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen
Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten
Auswertung, allgemein:
die Auswertung erfolgt ber die Anzahl der richtig gelsten Aufgaben
es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet
fr diesen Zweck werden die Wertpunktsummen fr die 6 Verbaltests, die 5 Handlungstests und fr alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert
direkt aus Umrechnungstabellen
daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen
Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten
36. Auswertung/2 Berechnung der Wertpunkte:
zunchst Berechnung der Punktzahl jeden Untertests
= Rohwert
die Rohwerte knnen in verschiedene Wertpunkte transformiert werden
Ankreuzen der Rohwerte ergibt das Testprofil des Probanden Berechnung der Wertpunkte:
zunchst Berechnung der Punktzahl jeden Untertests
= Rohwert
die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen
die Rohwerte knnen in verschiedene Wertpunkte transformiert werden
Voraussetzung fr die Bestimmung des IQ sind die Wertpunkte A
hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre
durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erhlt man auch das Testprofil des Pb
fr die Interpretation der Testergebnisse kann es unter Umstnden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen
hierfr gibt es die Spalte Wertpunkte B
10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte)
Berechnung der Wertpunkte:
zunchst Berechnung der Punktzahl jeden Untertests
= Rohwert
die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen
die Rohwerte knnen in verschiedene Wertpunkte transformiert werden
Voraussetzung fr die Bestimmung des IQ sind die Wertpunkte A
hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre
durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erhlt man auch das Testprofil des Pb
fr die Interpretation der Testergebnisse kann es unter Umstnden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen
hierfr gibt es die Spalte Wertpunkte B
10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte)
37. Wertpunktequivalente fr die Rohwerte
38. Auswertung/3 Berechnung der IQ- Werte:
Berechnung erfolgt ber Wertpunkte A
Berechnung der Wertpunkte
der 6 Verbaltests
der 5 Handlungstests
aller 11 Untertests
drei Summenwerte werden im Protokollbogen eingetragen
m.H. der IQ- Umrechnungstabelle wird der IQ bestimmt
Berechnung der IQ- Werte:
Berechnung erfolgt ber Wertpunkte A
Berechnung der Wertepunkte
der 6 Verbaltests
der 5 Handlungstests
aller 11 Untertests
diese drei Summenwerte werden im Protokollbogen eingetragen
m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt
Berechnung der IQ- Werte:
Berechnung erfolgt ber Wertpunkte A
Berechnung der Wertepunkte
der 6 Verbaltests
der 5 Handlungstests
aller 11 Untertests
diese drei Summenwerte werden im Protokollbogen eingetragen
m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt
39. Inhaltliche Bedeutung der Skalen/1 Gesamt- IQ:
Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums
ob eine Person eher praktisch oder verbal- theoretisch begabt ist
Leistungsbeeintrchtigungen vor bestimmtem Hintergrund interpretieren Inhaltliche Bedeutung der Skalen:
der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums
gibt Auskunft darber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist
Leistungsbeeintrchtigungen sollten immer vor dem Hintergrund milieuspezifischer Einflsse und mglicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werdenInhaltliche Bedeutung der Skalen:
der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums
gibt Auskunft darber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist
Leistungsbeeintrchtigungen sollten immer vor dem Hintergrund milieuspezifischer Einflsse und mglicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werden
41. Inhaltliche Bedeutung der Skalen/2 Allgemeines Wissen:
berprft dasjenige Wissen, das sich ein Durchschnittsmensch [...] selbst aneignen kann (MATARAZZO, 1982)
kulturabhngig
Zahlengedchtnis:
geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau
Inhaltliche Bedeutung der Skalen:
Allgemeines Wissen:
berprft dasjenige Wissen, dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsmglichkeiten selbst aneignen kann (MATARAZZO, 1982)
kulturabhngig/ sprachabhngig
Zahlengedchtnis:
scheint von geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau zu sein
trotzdem sind Leistungsausflle klinisch bedeutsam, da es klinische Zshg.e geben kann
Inhaltliche Bedeutung der Skalen:
Allgemeines Wissen:
berprft dasjenige Wissen, dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsmglichkeiten selbst aneignen kann (MATARAZZO, 1982)
kulturabhngig/ sprachabhngig
Zahlengedchtnis:
scheint von geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau zu sein
trotzdem sind Leistungsausflle klinisch bedeutsam, da es klinische Zshg.e geben kann
42. Inhaltliche Bedeutung der Skalen/3 Wortschatztest:
exzellentes Maߓ der allgemeinen Intelligenz
weitgehend unabhngig vom Lebensalter
Rechnerisches Denken:
gutes allgemeines Intelligenzma
Leistungen sind abhngig von schulischer und beruflicher Erfahrung
Inhaltliche Bedeutung der Skalen:
Wortschatztest:
gilt als exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO)
weitgehend unabhngig vom Lebensalter
gutes Ma fr Lernfhigkeit und verbale Informationsbreite des Probanden
Rechnerisches Denken:
gutes allgemeines Intelligenzma (MATARAZZO)
Leistungen sind abhngig von schulischer und beruflicher Erfahrung
COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverstndnis zurckzufhren sein knnen Inhaltliche Bedeutung der Skalen:
Wortschatztest:
gilt als exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO)
weitgehend unabhngig vom Lebensalter
gutes Ma fr Lernfhigkeit und verbale Informationsbreite des Probanden
Rechnerisches Denken:
gutes allgemeines Intelligenzma (MATARAZZO)
Leistungen sind abhngig von schulischer und beruflicher Erfahrung
COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverstndnis zurckzufhren sein knnen
43. Inhaltliche Bedeutung der Skalen/4 Allgemeines Verstndnis:
prft den gesunden Menschenverstand
erfasst die Fhigkeit zum logischen Denken (WECHSLER)
Gemeinsamkeiten finden:
erlaubt quantitativen und qualitative Aussagen
logische Struktur der Denkprozesse (WECHSLER, MATARAZZO)
Inhaltliche Bedeutung der Skalen:
Allgemeines Verstndnis:
prft den gesunden Menschenverstand
erfasst die Fhigkeit zum logischen Denken (WECHSLER)
abhngig von Sprachverstndnis
Gemeinsamkeiten finden:
nach WECHSLER groe Bedeutung
sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen
gibt Auskunft ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO)
abhngig von sprachlichen FhigkeitenInhaltliche Bedeutung der Skalen:
Allgemeines Verstndnis:
prft den gesunden Menschenverstand
erfasst die Fhigkeit zum logischen Denken (WECHSLER)
abhngig von Sprachverstndnis
Gemeinsamkeiten finden:
nach WECHSLER groe Bedeutung
sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen
gibt Auskunft ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO)
abhngig von sprachlichen Fhigkeiten
44. Inhaltliche Bedeutung der Skalen/5 Bilderergnzen:
Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER)
Bilderordnen:
Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER)
Inhaltliche Bedeutung der Skalen:
Bilderergnzen:
erfasst die Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER)
unterschiedliche Meinungen aller Forscher darber, was der Test misst
Bilderordnen:
Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER)
Inhaltliche Bedeutung der Skalen:
Bilderergnzen:
erfasst die Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER)
unterschiedliche Meinungen aller Forscher darber, was der Test misst
Bilderordnen:
Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER)
45. Inhaltliche Bedeutung der Skalen/6 Mosaik- Test:
ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER)
fr qualitative Aussagen geeignet
besonders gut fr klinische Diagnostik
Figuren legen:
Hinweise ber die Arbeitsstil der Probanden
Inhaltliche Bedeutung der Skalen:
Mosaik- Test:
ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER)
fr qualitative Aussagen geeignet
besonders gut fr klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere Lsungsstrategien whlen als Gesunde
Figuren legen:
WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in hheren Intelligenzbereichen differenziert
er gibt jedoch Hinweise ber die Arbeitsstil der ProbandenInhaltliche Bedeutung der Skalen:
Mosaik- Test:
ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER)
fr qualitative Aussagen geeignet
besonders gut fr klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere Lsungsstrategien whlen als Gesunde
Figuren legen:
WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in hheren Intelligenzbereichen differenziert
er gibt jedoch Hinweise ber die Arbeitsstil der Probanden
46. Inhaltliche Bedeutung der Skalen/7 Zahlen- Symbol- Test:
erfasst die allgemeine psychometrische Geschwindigkeit
gutes Ma fr das Konzentrationsvermgen (WECHSLER)
Ergebnisse sind in starkem Mae altersabhngig
Inhaltliche Bedeutung der Skalen:
Zahlen- Symbol- Test:
erfasst die allgemeine psychometrische Geschwindigkeit
gutes Ma fr das Konzentrationsvermgen (WECHSLER)
Ergebnisse sind in starkem Mae altersabhngigInhaltliche Bedeutung der Skalen:
Zahlen- Symbol- Test:
erfasst die allgemeine psychometrische Geschwindigkeit
gutes Ma fr das Konzentrationsvermgen (WECHSLER)
Ergebnisse sind in starkem Mae altersabhngig
47. Gliederung Einfhrung
Ziele und Aufbau
Praktische Handhabung
Gtekriterien
Studie von P. Steck
Auswertung
Kritik
48. Kritik/1 Mngel am HAWIE-R:
keine Bezug auf die probabilistische Testtheorie
Vorwurf: artifizielle Messung
Orientierung auf
Denkresultat statt Denkprozess
Status statt Entwicklungspotential
Vernachlssigung der kreativen Komponenten
Konzept des IQ
Mngel am HAWIE-R:
der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert
ihm wird deshalb vorgeworfen, vllig artifiziell zu messen
Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernfhigkeit)
Vernachlssigung der kreativen Komponenten und der fr die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg)
Unterschtzung der Intelligenz von Unterprivilegierten und kulturellen Minoritten
ein grundstzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ
als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- Tiefs einer Testperson durch beliebige Untertests- Hochs egalisiert werden knnen
Mngel am HAWIE-R:
der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert
ihm wird deshalb vorgeworfen, vllig artifiziell zu messen
Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernfhigkeit)
Vernachlssigung der kreativen Komponenten und der fr die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg)
Unterschtzung der Intelligenz von Unterprivilegierten und kulturellen Minoritten
ein grundstzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ
als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- Tiefs einer Testperson durch beliebige Untertests- Hochs egalisiert werden knnen
49. Kritik/2 Mngel am HAWIE-R:
Validitt zu wenig untersucht
einzelne Testitems werden bemngelt
Probanden werden mit diagnostisch wenig informativen Items konfrontiert
HAWIE- und HAWIE-R- Ergebnisse lassen sich nicht direkt vergleichen
Normierungsstichprobe
TEWES Replik Einzelkritikpunkte:
bereits frhe Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validitt hin untersucht wurde
besonders die Tatsache, dass zur prognostischen Validitt (schulpsychologische Beratung) berhaupt keine Ergebnisse im Handbuch referiert werden
das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterfhrende Analysen erheblich differenziert worden
danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch JGERs Intelligenzstrukturmodell)
Vertreter der probabilistischen Testtheorie bemngeln, dass fr die einzelnen Untertests nicht geprft wurde, ob berhaupt homogene Fhigkeiten geprft werden
FAY, 1993 bemngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE)
Die Testperson wird wegen des groen Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert
i.d.R. endet der Untertest bei klinischen Patienten mit einer Frustration
ein adaptiver Testaufbau knnte diesen Mangel berwinden
direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben
der HAWIE bringt durchschnittlich hhere Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verhltnis um)
Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht fr die BRD 1986 reprsentativ war
wann genau die Normierung stattfand, ist nicht ersichtlich
dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht fr die neuen Bundeslnder gelten (auch fr sterreich und Schweiz nicht gegeben)
TEWES:
Normenaktualisierung:
Normierung vor Vereinigung
keine bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden
Validitt:
die Kritik am Fehlen von Informationen zur prognostischen Validitt ist nicht verstndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.)
Einzelkritikpunkte:
bereits frhe Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validitt hin untersucht wurde
besonders die Tatsache, dass zur prognostischen Validitt (schulpsychologische Beratung) berhaupt keine Ergebnisse im Handbuch referiert werden
das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterfhrende Analysen erheblich differenziert worden
danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch JGERs Intelligenzstrukturmodell)
Vertreter der probabilistischen Testtheorie bemngeln, dass fr die einzelnen Untertests nicht geprft wurde, ob berhaupt homogene Fhigkeiten geprft werden
FAY, 1993 bemngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE)
Die Testperson wird wegen des groen Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert
i.d.R. endet der Untertest bei klinischen Patienten mit einer Frustration
ein adaptiver Testaufbau knnte diesen Mangel berwinden
direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben
der HAWIE bringt durchschnittlich hhere Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verhltnis um)
Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht fr die BRD 1986 reprsentativ war
wann genau die Normierung stattfand, ist nicht ersichtlich
dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht fr die neuen Bundeslnder gelten (auch fr sterreich und Schweiz nicht gegeben)
TEWES:
Normenaktualisierung:
Normierung vor Vereinigung
keine bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden
Validitt:
die Kritik am Fehlen von Informationen zur prognostischen Validitt ist nicht verstndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.)
50. Kritik/3 1. Allgemeines Wissen:
Normdaten
medialer Darstellung
2. Bilderergnzen:
physikalische Details
Distraktoreninformationen 1. Allgemeines Wissen:
sehr problematisches Item: Zahl der Bundeslnder und Zahl der Einwohner Deutschlands
wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch
problematisches Item: Wer whlt bei uns den Bundeskanzler?
es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist
2. Bilderergnzen:
physikalische Details werden nicht beachtet, der Pb knnte abgelenkt werden (Item 7, Glas- Wasser)
eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen mglich 1. Allgemeines Wissen:
sehr problematisches Item: Zahl der Bundeslnder und Zahl der Einwohner Deutschlands
wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch
problematisches Item: Wer whlt bei uns den Bundeskanzler?
es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist
2. Bilderergnzen:
physikalische Details werden nicht beachtet, der Pb knnte abgelenkt werden (Item 7, Glas- Wasser)
eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen mglich
51. Kritik/4 4. Bilderordnen:
Distraktoren
Unachtsamkeiten der Konstrukteure
6. Mosaik- Test:
Kategorie des Drehfehlers 4. Bilderordnen:
unntige Distraktoren stren den Problemlseprozess
einige Unachtsamkeiten primen den Probanden
6. Mosaik- Test:
neu eingefhrt wurde die Kategorie des Drehfehlers
der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen
warum 30 Grad, wird nicht erklrt
4. Bilderordnen:
unntige Distraktoren stren den Problemlseprozess
einige Unachtsamkeiten primen den Probanden
6. Mosaik- Test:
neu eingefhrt wurde die Kategorie des Drehfehlers
der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen
warum 30 Grad, wird nicht erklrt
52. Kritik/5 9. Allgemeines Verstndnis:
Fragestellung- Problematik
Warum muss man Steuern zahlen?
Wozu werden Steuereinnahmen gebraucht?
Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder?
9. Allgemeines Verstndnis:
Fragestellung- Problematik
Item 5: Warum muss man Steuern zahlen?
wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort Weil es ein Gesetz ist. erhlt 0 Punkte
eine Antwort auf die gar nicht gestellte Frage Wozu werden Steuereinnahmen gebraucht? dagegen bringt die volle Punktzahl (2 Punkte)
Item 7: Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder? (2 Antworten werden erfragt)
antwortet man auf die Frage Das Kind wird zu schlecht bezahlt und macht auerdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt., erhlt man die volle Punktzahl (!)
die Aussage Kinderarbeit kann zu krperlichen und seelischen Entwicklungsschden fhren wird als 1-Punkt- Antwort klassifiziert
also ist die Auswertungsobjektivitt mangelhaft
9. Allgemeines Verstndnis:
Fragestellung- Problematik
Item 5: Warum muss man Steuern zahlen?
wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort Weil es ein Gesetz ist. erhlt 0 Punkte
eine Antwort auf die gar nicht gestellte Frage Wozu werden Steuereinnahmen gebraucht? dagegen bringt die volle Punktzahl (2 Punkte)
Item 7: Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder? (2 Antworten werden erfragt)
antwortet man auf die Frage Das Kind wird zu schlecht bezahlt und macht auerdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt., erhlt man die volle Punktzahl (!)
die Aussage Kinderarbeit kann zu krperlichen und seelischen Entwicklungsschden fhren wird als 1-Punkt- Antwort klassifiziert
also ist die Auswertungsobjektivitt mangelhaft
53. Kritik/6 11. Gemeinsamkeiten finden:
'darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind?
Dilemma der theoriegeleitete Testkonstruktion 11. Gemeinsamkeiten finden:
Gemeinsamkeit von Apfelsine und Banane
anerkannt wird u.a. Baumobst, was falsch ist, denn Bananen wachsen nun mal nicht auf Bumen
darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind?
man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion
einerseits der psychologisch schlssigen Operationalisierung dessen, was sprachliches Abstraktionsvermgen sei und der Konfrontation dieser berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz fr ein berdurchschnittlich ausgeprgtes sprachliches Abstraktionsvermgen herangezogen werden kann
es gibt also Stze, ber deren Richtigkeit sich unschwer Konsens herstellen lsst
sie lassen sich nicht per Mehrheitsbeschluss von richtig in falsch umdefinieren
es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts richtigen Antworten sind11. Gemeinsamkeiten finden:
Gemeinsamkeit von Apfelsine und Banane
anerkannt wird u.a. Baumobst, was falsch ist, denn Bananen wachsen nun mal nicht auf Bumen
darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind?
man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion
einerseits der psychologisch schlssigen Operationalisierung dessen, was sprachliches Abstraktionsvermgen sei und der Konfrontation dieser berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz fr ein berdurchschnittlich ausgeprgtes sprachliches Abstraktionsvermgen herangezogen werden kann
es gibt also Stze, ber deren Richtigkeit sich unschwer Konsens herstellen lsst
sie lassen sich nicht per Mehrheitsbeschluss von richtig in falsch umdefinieren
es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts richtigen Antworten sind
54. Fazit HAWIE-R:
lngst fllige Verbesserung des praktisch bewhrten Tests HAWIE
Ntzlichkeit des HAWIE-R steht auer Frage
globale Abschtzung des Intelligenzstatus
fr die klinische Einzelfalluntersuchung konkurrenzlos Fazit
der HAWIE-R stellt gegenber dem HAWIE eine bereits lngst fllige Verbesserung eines praktisch bewhrten Tests dar
die Ntzlichkeit des HAWIE-R steht auer Frage
allerdings gestattet er lediglich eine globale Abschtzung des Intelligenzstatus durch Vorgabe mglichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll
der berzeugende Beweis fr diese Behauptung ist aber immer noch nicht erbracht
davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden
trotz der aufgezeigten Mngel bleibt der HAWIE-R fr die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung fr die klinisch-psychologische Forschung gegenwrtig konkurrenzlos Fazit
der HAWIE-R stellt gegenber dem HAWIE eine bereits lngst fllige Verbesserung eines praktisch bewhrten Tests dar
die Ntzlichkeit des HAWIE-R steht auer Frage
allerdings gestattet er lediglich eine globale Abschtzung des Intelligenzstatus durch Vorgabe mglichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll
der berzeugende Beweis fr diese Behauptung ist aber immer noch nicht erbracht
davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden
trotz der aufgezeigten Mngel bleibt der HAWIE-R fr die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung fr die klinisch-psychologische Forschung gegenwrtig konkurrenzlos
55.
Vielen Dank fr die Aufmerksamkeit!