1 / 56

HAWIE-R Hamburg-Wechsler Intelligenztest f r Erwachsene Revision 1991

Gliederung. Einf

gabrielle
Télécharger la présentation

HAWIE-R Hamburg-Wechsler Intelligenztest f r Erwachsene Revision 1991

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    2. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von Peter Steck Auswertung Kritik

    3. HAWIE-R deutsche Version des WAIS-R (Wechsler Adult Intelligence Scale - Revised 1981, Tewes 1991) lst HAWIE von 1956 ab (=Aktualisierung der Iteminhalte) ist ausschlielich ein Individualtestverfahren mit Intelligenzleistungen von Altersstufe 16 bis 74 Jahre vor allem fr klinisch- psycholog. Diagnostik entwickelt, in der es vorrangig um die Untersuchung von Ausfallerscheinungen geht Die wesentlichen Unterschiede zum HAWIE sind: ber die Hlfte der Items wurden verndert, wobei insbesondere veraltete Items (z.B. der fehlende Schlips) ausgetauscht wurden. Die Anzahl der Items in den einzelnen Untertests wurde z.T. verndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erhht). Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen. Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch. Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht verndert. Der Protokollbogen enthlt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.Die wesentlichen Unterschiede zum HAWIE sind: ber die Hlfte der Items wurden verndert, wobei insbesondere veraltete Items (z.B. der fehlende Schlips) ausgetauscht wurden. Die Anzahl der Items in den einzelnen Untertests wurde z.T. verndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erhht). Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen. Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch. Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht verndert. Der Protokollbogen enthlt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.

    4. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    5. Definition von Intelligenz Intelligenz ist die zusammengesetzte oder globale Fhigkeit des Individuums, zweckvoll zu handeln, vernnftig zu denken und sich mit seiner Umgebung wirkungsvoll auseinander zu setzen. (nach David Wechsler, 1956; S.13) Wechslers berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz: Gerade fr seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einflsse groe Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen. Explizit nennt er: Trieb und Anreiz, in gewisser Weise ist aber auch das Gedchtnis und die Fhigkeit zur sozialen Anpassung zu subsumieren. Vorstellung basiert auf Alexander (1935): Er besttigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollstndig zu erklren. Alexander zieht daraus den Schlu, da sich neben einem allgemeinen Faktor der Intelligenz je ein Faktor abstrakter und praktischer Fhigkeiten fr alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erklrung der Korrelationsmatrix nicht ausreicht, nimmt er ergnzende Faktoren, wie Temperaments- und Persnlichkeitsfaktoren an. Wechslers berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz: Gerade fr seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einflsse groe Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen. Explizit nennt er: Trieb und Anreiz, in gewisser Weise ist aber auch das Gedchtnis und die Fhigkeit zur sozialen Anpassung zu subsumieren. Vorstellung basiert auf Alexander (1935): Er besttigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollstndig zu erklren. Alexander zieht daraus den Schlu, da sich neben einem allgemeinen Faktor der Intelligenz je ein Faktor abstrakter und praktischer Fhigkeiten fr alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erklrung der Korrelationsmatrix nicht ausreicht, nimmt er ergnzende Faktoren, wie Temperaments- und Persnlichkeitsfaktoren an.

    6. Theoret. Konzept von Wechsler Allgemeine Intelligenz = Gesamt-IQ resultiert aus der durchschnittl. Leistung in allen 11 Untertests sie teilt sich in : Verbal-Intelligenz = Verbal-IQ setzt sich aus der durchschnittl. Leistung in den dazugehrigen Untertests zusammen Handlungs-Intelligenz = Handlungs-IQ; erfasst vor allem die nicht-intellektuellen Faktoren intelligenten Verhaltens Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben): Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als strende Elemente angesehen und so weit wie mglich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests bentigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses mglich wre), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv abschtzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung. theoretisches Konzept von Wechsler ist implizit hierarchisch: Spitze bildet die Allgemeine Intelligenz (= Gesamt-IQ) sie teilt sich in : Verbal-Intelligenz Handlungs-Intelligenz (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens) ! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer Fhigkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional quivalend fr die Messung der Intelligenz betrachtet werden.Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben): Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als strende Elemente angesehen und so weit wie mglich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests bentigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses mglich wre), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv abschtzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung. theoretisches Konzept von Wechsler ist implizit hierarchisch: Spitze bildet die Allgemeine Intelligenz (= Gesamt-IQ) sie teilt sich in : Verbal-Intelligenz Handlungs-Intelligenz (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens) ! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer Fhigkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional quivalend fr die Messung der Intelligenz betrachtet werden.

    7. Testaufbau Wechsler stellte Testbatterien zusammen, die aus zwei gleichwertigen Testteilen bestehen (=Verbalteil & Handlungsteil) Testteile bestehen aus mehreren Untertests (mglichst viele spezifische Fhigkeiten im Sinne Spearmans sollen erfasst werden) Wechsler erhebt nicht den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) whlt Untertests, die sich in Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben; nicht nach Reprsentativitt Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen Fhigkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen Fhigkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren Da jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch mglichst viele spezifische Fhigkeiten im Sinne Spearmans zu erfassen. Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) Zitat Wechsler 1956, S.22: denn kein Test wrde dazu gegenwrtig in der Lage sein. Wir knnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigermaen zuverlssigen Index der globalen Leistungsfhigkeit des Prflings bentzen knnen. Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Reprsentativitt auszuwhlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben. Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen Fhigkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen Fhigkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren Da jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch mglichst viele spezifische Fhigkeiten im Sinne Spearmans zu erfassen. Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) Zitat Wechsler 1956, S.22: denn kein Test wrde dazu gegenwrtig in der Lage sein. Wir knnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigermaen zuverlssigen Index der globalen Leistungsfhigkeit des Prflings bentzen knnen. Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Reprsentativitt auszuwhlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigermaen zuverlssig, gltig und trennscharf erwiesen haben.

    8. Verbalteil besteht aus sechs Untertests: 1) Allgemeines Wissen (AW, 24 Items) 2) Zahlennachsprechen (ZN, 14 Items) 3) Wortschatz-Test (WT, 32 Items) 4) Rechnerisches Denken (RD,14 Items) 5) Allgemeines Verstndnis (AV, 13 Items) 6) Gemeinsamkeiten finden (GF, 16 Items)

    9. Handlungsteil setzt sich aus 5 Untertests zusammen: 1) Bilderergnzen (BE, 17 Items) 2) Bilderordnen (BO, 10 Items) 3) Mosaik-Test (MT, 9 Items) 4) Figurenlegen (FL, 4 Items) 5) Zahlen-Symbol-Test (ZS, 93 Items)

    10. Einsatzbereich des HAWIE-R Auf dem Umschlag des Handbuchs heit es: Der Test eignet sich zur Einschtzung des allgemeinen geistigen Entwicklungsstandes und der Untersuchung von alters-, milieu- oder krankheitsbedingten Leistungsbeeintrchti-gungen in bestimmten Bereichen. Er wird mit Vorteil auch bei Schlern in den oberen Klassen weiterbildender Schulen eingesetzt. Weiteres Zitat aus dem Handbuch: Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da die Wechsler-Intelligenztests fr Erwachsene in der klinischen Praxis und Forschung zu den am hufigs-ten eingesetzten Testverfahren gehren ... Der HAWIE ist ... ein zur Zeit noch sehr gebruchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind. (Handbuch, S.8)Weiteres Zitat aus dem Handbuch: Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da die Wechsler-Intelligenztests fr Erwachsene in der klinischen Praxis und Forschung zu den am hufigs-ten eingesetzten Testverfahren gehren ... Der HAWIE ist ... ein zur Zeit noch sehr gebruchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind. (Handbuch, S.8)

    11. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    12. Praktische Handhabung/1 Testmaterialien: Handbuch mit Testanweisung (121 Seiten, davon 32 Seiten Tabellen und 15 Seiten Anhang: Bewertungskriterien) Vorlageheft fr die Untertests Bildergnzen und Mosaik-Test Bildkarten zum Untertest Bildordnen neun Wrfel fr den Mosaik-Test Puzzelteile des Untertests Figurenlegen Auswertschablone fr den Zahlen-Symbol-Test 25 Protokollbgen Handbuch: Im Handbuch sind die Modalitten der Test-applikation festgelegt, die Instruktionen sind wrtlich vorgegeben. Handbuch: Im Handbuch sind die Modalitten der Test-applikation festgelegt, die Instruktionen sind wrtlich vorgegeben.

    13. Praktische Handhabung/2 Mehrzahl der Tests sind reine power-Tests beim Handlungsteil fliet in die Verrechnung zumeist auch die speed-Komponente mit ein Zahlen-Symbol-Test ist ein reiner speed-Test Abbruchkriterium beinhalten die meisten Untertests Untertest wird unterbrochen, wenn die Tpn 3 bzw. 4 Aufgaben in ununterbrochener Reihenfolge nicht lsen knnen Testdauer: 60 bis 90 Minuten Auswertungsdauer: keine Angaben Die meisten Untertests sind power-Tests, im Handlungsteil knnen zustzliche Zeitbonuspunkte erreicht werden (speed-Komponente); der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest. Fr eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gelst hat. Testdauer wird mit 60 bis 90 Minuten angegeben, die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht) Die meisten Untertests sind power-Tests, im Handlungsteil knnen zustzliche Zeitbonuspunkte erreicht werden (speed-Komponente); der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest. Fr eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gelst hat. Testdauer wird mit 60 bis 90 Minuten angegeben, die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht)

    14. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    15. Gtekriterien/1 Durchfhrungsobjektivitt aufgrund der meist sehr klaren Instruktionen gegeben; unterliegt lediglich den bei allen im Dialog durchge-fhrten Individualtests typischen Einschrnkungen (reduziert wegen Einzeltestvorgabe) Ausnahme: Bilderordnen Auswertungsobjektivitt wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden Interpretationsobjektivitt ist gegeben Objektivitt (=Anwenderunabhngigkeit) Durchfhrungsobjektivitt - Ausnahme: Dem Testleiter wird beim Bilderordnen die Empfehlung gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die Lsungen zu begrnden oder beim Lsen eine Geschichte zu erzhlen - damit wird eine Verletzung der Durchfhrungsobjektivitt in Kauf genommen. Auswertungsobjektivitt wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden. Aber: trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da insbesondere beim Untertest Allgemeines Verstndnis noch Bewertungsdifferenzen auftreten knnen. Im Mosaik-Test mu jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier drften Auswertungsdifferenzen auftreten.Objektivitt (=Anwenderunabhngigkeit) Durchfhrungsobjektivitt - Ausnahme: Dem Testleiter wird beim Bilderordnen die Empfehlung gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die Lsungen zu begrnden oder beim Lsen eine Geschichte zu erzhlen - damit wird eine Verletzung der Durchfhrungsobjektivitt in Kauf genommen. Auswertungsobjektivitt wurde gegenber dem HAWIE wahrscheinlich verbessert, da einfachere und hufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden. Aber: trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da insbesondere beim Untertest Allgemeines Verstndnis noch Bewertungsdifferenzen auftreten knnen. Im Mosaik-Test mu jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier drften Auswertungsdifferenzen auftreten.

    16. Gtekriterien/2 Reliabilitt wurde mittels Cronbachs-a bestimmt: liegt fr die einzelnen Untertests und pro Altersgruppe zwischen .64 (FL) und .95 (ZS, mit Testhalbierung) beim Gesamt-IQ bei mindestens .95 Standardmessfehler werden getrennt nach Skalen und Altersgruppen angegeben kritische Differenzen fr Profilinterpretationen nicht angegeben Reliabilitt (=Zuverlssigkeit, d.h. wie genau mit der Test das, was er mit) FL = Figurenlegen ZS = Zahlen-Symbol-Test ein Cronbachs-a von mindestens .90 wird darber hinaus nur gelegentlich fr die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtetReliabilitt (=Zuverlssigkeit, d.h. wie genau mit der Test das, was er mit) FL = Figurenlegen ZS = Zahlen-Symbol-Test ein Cronbachs-a von mindestens .90 wird darber hinaus nur gelegentlich fr die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtet

    17. Gtekriterien/3 faktorielle Validitt (= im Sinne einer Konstruktvalidierung) die Wechslersche Unterteilung in einen Verbal- und Handlungsfaktor wird besttigt (allerdings haben ZN und RD auf beiden Faktoren substantielle Ladungen) Extremgruppenvalidierung Gruppenunterschiede zwischen Absolventen verschiedener Schultypen sowie zwischen Alkoholikern und Nicht-Alkoholikern bzw. hnlichkeiten zwischen Verwandten (z.B. Geschwister) werden als Hinweis fr die Validitt aufgefhrt. Validitt (=Gltigkeit, d.h. sie gibt an, ob der Test das mit, was er zu messen vorgibt) Faktorielle Validitt: ZN =Zahlennachsprechen RD = Rechnerisches Denken die hchsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78 die Ladungen mit jeweils anderen Faktoren sind durchweg klein Extremgruppenvalidierung: es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen Hauptschule, Realschule und Gymnasium sowie zwischen Alkoholikern und Nicht-Alkoholikern.Validitt (=Gltigkeit, d.h. sie gibt an, ob der Test das mit, was er zu messen vorgibt) Faktorielle Validitt: ZN =Zahlennachsprechen RD = Rechnerisches Denken die hchsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78 die Ladungen mit jeweils anderen Faktoren sind durchweg klein Extremgruppenvalidierung: es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen Hauptschule, Realschule und Gymnasium sowie zwischen Alkoholikern und Nicht-Alkoholikern.

    18. Gtekriterien/4 Skalierung dazu werden nur Analysen der klassischen Test-theorie angefhrt Trennschrfen sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983) Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfaller-scheinungen geht (nicht fr die Untersuchung Hochbegabter, S.46) Skalierung: hierzu werden nur Analysen der klassischen Testtheorie angefhrt - Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.(Handbuch S.9) Trennschrfen: sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983); Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert - Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.(S.46). Skalierung: hierzu werden nur Analysen der klassischen Testtheorie angefhrt - Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.(Handbuch S.9) Trennschrfen: sind gering, wie bei den Wechsler-Skalen blich (vgl. z.B. Kubinger, 1983); Schwierigkeiten sind absichtlich so gewhlt, da der Test im unteren Leistungsbereich besser differenziert - Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie fr die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.(S.46).

    19. Gtekriterien/5 Normierung beruht auf Gesamtstichprobe von N=2000 Testpersonen, die hinsichtlich Alter zwischen 16 und 74 Jahre sind, wobei die 20 bis 34jhrigen berwiegen. aber: Schulbildung und Geschlecht der Stich- probe war fr die BRD ca. um 1986 reprsentativ (wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen) Normierung: Die eigentlichen Normen basieren lediglich auf den 20- bis 34jhrigen, weil laut Wechsler: die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe (S. 13) - die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ. ! Ergnzend knnen altersspezifische Normwerte bzw. Normwerte fr Gymnasiasten bestimmt werden, jedoch nur fr die einzelnen Untertests, nicht fr den IQ. Aber: wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch fr die neuen Bundeslnder gelten; dieser Einwand gilt mglicherweise auch fr die Schweiz und sterreich.Normierung: Die eigentlichen Normen basieren lediglich auf den 20- bis 34jhrigen, weil laut Wechsler: die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe (S. 13) - die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ. ! Ergnzend knnen altersspezifische Normwerte bzw. Normwerte fr Gymnasiasten bestimmt werden, jedoch nur fr die einzelnen Untertests, nicht fr den IQ. Aber: wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch fr die neuen Bundeslnder gelten; dieser Einwand gilt mglicherweise auch fr die Schweiz und sterreich.

    20. Das Verfahren ist: konomisch bietet gute Beobachtungsmglichkeiten (z.B. im Handlungsteil Vorgehen nach Versuch und Irrtum vs. planvolles Handeln) zumutbar (insbesondere fr klinisches Klientel) Simulationen sind wie bei allen Leistungstests mglich; sie sind aber wegen guter Beobach-tungsmglichkeiten eher erkennbar als bei anderen erwachsenendiagnostischen Verfahren keine systematischen Untersuchungen zur Fairne vorhanden konomisch: fr einen Individualtest und entsprechend der Komplexitt des Gltigkeitsbereichs sehr konomisch und Ntzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsmglichkeit des Arbeits- und Kontaktverhaltens, erfasst wird. Fr den Test gibt es im Erwachsenenbereich keine Alternative. Zumutbarkeit: ist im Sinne des Testkuratoriums (der Fderation deutscher Psychologenverbnde; 1986) gegeben; vielleicht mit der Einschrnkung, da jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird. Verflschbarkeit/Simulationen: bei Fragestellungen wie z.B. Rentenbegehren wichtig Fairne: (d.h. ist nicht geprft!) aber der Wortschatz-Test zeigt die hchsten Korrelationen zum Gesamt-IQ, das bedeutet, da Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeuropischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da weniger Gebildete wohl auch als weniger intelligent erscheinen.konomisch: fr einen Individualtest und entsprechend der Komplexitt des Gltigkeitsbereichs sehr konomisch und Ntzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsmglichkeit des Arbeits- und Kontaktverhaltens, erfasst wird. Fr den Test gibt es im Erwachsenenbereich keine Alternative. Zumutbarkeit: ist im Sinne des Testkuratoriums (der Fderation deutscher Psychologenverbnde; 1986) gegeben; vielleicht mit der Einschrnkung, da jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird. Verflschbarkeit/Simulationen: bei Fragestellungen wie z.B. Rentenbegehren wichtig Fairne: (d.h. ist nicht geprft!) aber der Wortschatz-Test zeigt die hchsten Korrelationen zum Gesamt-IQ, das bedeutet, da Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeuropischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da weniger Gebildete wohl auch als weniger intelligent erscheinen.

    21. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    22. Umfrage Psychologische Testverfahren in der Praxis

    23. Umfrage Im wesentlichen 3 Kategorien von Tests im dt. Raum (Kubinger; 1995)

    24. Datenerhebung Fragebogen wurde an 1000 zufllig ausgewhlte Mitgliedern des Berufsverbandes Deutscher Psychologen (BDP) verschickt Rcklauf von 271 Fragebgen (27,1 %) davon konnten nur 250 ausgewertet werden

    25. Fragebogen

    26. Datenverarbeitung Auswertung erfolgte mittels berfhrung in numerischen Code bei Ja/ Nein Antworten und Zuweisung in vorher festgelegten Kategoriensystemen (wurden berprft durch 2 unabhngige Beurteiler ?Kappa- Koeffizient zwischen .72 und .98)

    27. Ergebnisse 169 von 250 Psychologen (67,9%) setzten Tests in der Berufspraxis ein 200 Tests waren erkennbar (von 254)

    28. Ergebnisse

    29. Vergleich

    30. Qualittsmerkmale

    31. Abgelehnte Verfahren Gar nicht oder ungern verwendete Tests (N=121): - Rorschach- Test (24 Nennungen) - MMPI (13) - TAT (12) - IST/ IST 70 (11) - HAWIK/ HAWIK-R (8) - HAWIE/ HAWIE-R (3) Grnde / Nachteile: - Unkonomisch - Hauptgtekriterien/ Konstruktion ungengend - Geringe /keine diagnostische Relevanz - Geringe /keine Akzeptanz - Auswertung schwer handhabbar

    32. Subtest und Anwendung 53 der Befragten gaben an, sich bei den Tests auf einzelne Subtests zu beschrnken - v.a. bei HAWIE/ HAWIE-R; IST/ IST 70; HAWIK/ HAWIK-R; LPS; PFK u.a. 58 Befragte gaben an, die Tests in abweichender Form anzuwenden - v.a. bei HAWIK/ HAWIK-R; TAT u.a. Abweichungen beziehen sich auf Instruktion, Durchfhrung (Zweckentfremdung, Verkrzung, Modifizierung des Testmaterials) und Auswertung

    33. Fazit zur Umfrage Gehrt mit zu den am hufigsten verwendeten Tests (national und international) Hat einen relativ stabilen Platz in der Rangordnung der letzten 20 Jahre

    34. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    35. Auswertung/1 Allgemein: Auswertung erfolgt ber die Anzahl richtig gelster Aufgaben Berechnung von Verbal- IQ, Handlungs- IQ und Gesamt- IQ daneben werden noch alters- und bildungsspezifische Wertpunkttabellen angeben Dauer der Testauswertung: 5- 10 Minuten Auswertung, allgemein: die Auswertung erfolgt ber die Anzahl der richtig gelsten Aufgaben es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet fr diesen Zweck werden die Wertpunktsummen fr die 6 Verbaltests, die 5 Handlungstests und fr alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert direkt aus Umrechnungstabellen daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten Auswertung, allgemein: die Auswertung erfolgt ber die Anzahl der richtig gelsten Aufgaben es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet fr diesen Zweck werden die Wertpunktsummen fr die 6 Verbaltests, die 5 Handlungstests und fr alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert direkt aus Umrechnungstabellen daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten

    36. Auswertung/2 Berechnung der Wertpunkte: zunchst Berechnung der Punktzahl jeden Untertests = Rohwert die Rohwerte knnen in verschiedene Wertpunkte transformiert werden Ankreuzen der Rohwerte ergibt das Testprofil des Probanden Berechnung der Wertpunkte: zunchst Berechnung der Punktzahl jeden Untertests = Rohwert die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen die Rohwerte knnen in verschiedene Wertpunkte transformiert werden Voraussetzung fr die Bestimmung des IQ sind die Wertpunkte A hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erhlt man auch das Testprofil des Pb fr die Interpretation der Testergebnisse kann es unter Umstnden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen hierfr gibt es die Spalte Wertpunkte B 10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte) Berechnung der Wertpunkte: zunchst Berechnung der Punktzahl jeden Untertests = Rohwert die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen die Rohwerte knnen in verschiedene Wertpunkte transformiert werden Voraussetzung fr die Bestimmung des IQ sind die Wertpunkte A hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erhlt man auch das Testprofil des Pb fr die Interpretation der Testergebnisse kann es unter Umstnden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen hierfr gibt es die Spalte Wertpunkte B 10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte)

    37. Wertpunktequivalente fr die Rohwerte

    38. Auswertung/3 Berechnung der IQ- Werte: Berechnung erfolgt ber Wertpunkte A Berechnung der Wertpunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle wird der IQ bestimmt Berechnung der IQ- Werte: Berechnung erfolgt ber Wertpunkte A Berechnung der Wertepunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests diese drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt Berechnung der IQ- Werte: Berechnung erfolgt ber Wertpunkte A Berechnung der Wertepunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests diese drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt

    39. Inhaltliche Bedeutung der Skalen/1 Gesamt- IQ: Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintrchtigungen vor bestimmtem Hintergrund interpretieren Inhaltliche Bedeutung der Skalen: der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums gibt Auskunft darber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintrchtigungen sollten immer vor dem Hintergrund milieuspezifischer Einflsse und mglicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werdenInhaltliche Bedeutung der Skalen: der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsvermgen des Individuums gibt Auskunft darber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintrchtigungen sollten immer vor dem Hintergrund milieuspezifischer Einflsse und mglicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werden

    41. Inhaltliche Bedeutung der Skalen/2 Allgemeines Wissen: berprft dasjenige Wissen, das sich ein Durchschnittsmensch [...] selbst aneignen kann (MATARAZZO, 1982) kulturabhngig Zahlengedchtnis: geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau Inhaltliche Bedeutung der Skalen: Allgemeines Wissen: berprft dasjenige Wissen, dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsmglichkeiten selbst aneignen kann (MATARAZZO, 1982) kulturabhngig/ sprachabhngig Zahlengedchtnis: scheint von geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau zu sein trotzdem sind Leistungsausflle klinisch bedeutsam, da es klinische Zshg.e geben kann Inhaltliche Bedeutung der Skalen: Allgemeines Wissen: berprft dasjenige Wissen, dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsmglichkeiten selbst aneignen kann (MATARAZZO, 1982) kulturabhngig/ sprachabhngig Zahlengedchtnis: scheint von geringer Bedeutung fr das allgemeine intellektuelle Leistungsniveau zu sein trotzdem sind Leistungsausflle klinisch bedeutsam, da es klinische Zshg.e geben kann

    42. Inhaltliche Bedeutung der Skalen/3 Wortschatztest: exzellentes Maߓ der allgemeinen Intelligenz weitgehend unabhngig vom Lebensalter Rechnerisches Denken: gutes allgemeines Intelligenzma Leistungen sind abhngig von schulischer und beruflicher Erfahrung Inhaltliche Bedeutung der Skalen: Wortschatztest: gilt als exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO) weitgehend unabhngig vom Lebensalter gutes Ma fr Lernfhigkeit und verbale Informationsbreite des Probanden Rechnerisches Denken: gutes allgemeines Intelligenzma (MATARAZZO) Leistungen sind abhngig von schulischer und beruflicher Erfahrung COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverstndnis zurckzufhren sein knnen Inhaltliche Bedeutung der Skalen: Wortschatztest: gilt als exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO) weitgehend unabhngig vom Lebensalter gutes Ma fr Lernfhigkeit und verbale Informationsbreite des Probanden Rechnerisches Denken: gutes allgemeines Intelligenzma (MATARAZZO) Leistungen sind abhngig von schulischer und beruflicher Erfahrung COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverstndnis zurckzufhren sein knnen

    43. Inhaltliche Bedeutung der Skalen/4 Allgemeines Verstndnis: prft den gesunden Menschenverstand erfasst die Fhigkeit zum logischen Denken (WECHSLER) Gemeinsamkeiten finden: erlaubt quantitativen und qualitative Aussagen logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) Inhaltliche Bedeutung der Skalen: Allgemeines Verstndnis: prft den gesunden Menschenverstand erfasst die Fhigkeit zum logischen Denken (WECHSLER) abhngig von Sprachverstndnis Gemeinsamkeiten finden: nach WECHSLER groe Bedeutung sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen gibt Auskunft ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) abhngig von sprachlichen FhigkeitenInhaltliche Bedeutung der Skalen: Allgemeines Verstndnis: prft den gesunden Menschenverstand erfasst die Fhigkeit zum logischen Denken (WECHSLER) abhngig von Sprachverstndnis Gemeinsamkeiten finden: nach WECHSLER groe Bedeutung sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen gibt Auskunft ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) abhngig von sprachlichen Fhigkeiten

    44. Inhaltliche Bedeutung der Skalen/5 Bilderergnzen: Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) Bilderordnen: Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER) Inhaltliche Bedeutung der Skalen: Bilderergnzen: erfasst die Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) unterschiedliche Meinungen aller Forscher darber, was der Test misst Bilderordnen: Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER) Inhaltliche Bedeutung der Skalen: Bilderergnzen: erfasst die Fhigkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) unterschiedliche Meinungen aller Forscher darber, was der Test misst Bilderordnen: Fhigkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzuschtzen (WECHSLER)

    45. Inhaltliche Bedeutung der Skalen/6 Mosaik- Test: ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER) fr qualitative Aussagen geeignet besonders gut fr klinische Diagnostik Figuren legen: Hinweise ber die Arbeitsstil der Probanden Inhaltliche Bedeutung der Skalen: Mosaik- Test: ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER) fr qualitative Aussagen geeignet besonders gut fr klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere Lsungsstrategien whlen als Gesunde Figuren legen: WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in hheren Intelligenzbereichen differenziert er gibt jedoch Hinweise ber die Arbeitsstil der ProbandenInhaltliche Bedeutung der Skalen: Mosaik- Test: ausgezeichnete Prfung der allgemeinen Intelligenz (WECHSLER) fr qualitative Aussagen geeignet besonders gut fr klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere Lsungsstrategien whlen als Gesunde Figuren legen: WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in hheren Intelligenzbereichen differenziert er gibt jedoch Hinweise ber die Arbeitsstil der Probanden

    46. Inhaltliche Bedeutung der Skalen/7 Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma fr das Konzentrationsvermgen (WECHSLER) Ergebnisse sind in starkem Mae altersabhngig Inhaltliche Bedeutung der Skalen: Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma fr das Konzentrationsvermgen (WECHSLER) Ergebnisse sind in starkem Mae altersabhngigInhaltliche Bedeutung der Skalen: Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma fr das Konzentrationsvermgen (WECHSLER) Ergebnisse sind in starkem Mae altersabhngig

    47. Gliederung Einfhrung Ziele und Aufbau Praktische Handhabung Gtekriterien Studie von P. Steck Auswertung Kritik

    48. Kritik/1 Mngel am HAWIE-R: keine Bezug auf die probabilistische Testtheorie Vorwurf: artifizielle Messung Orientierung auf Denkresultat statt Denkprozess Status statt Entwicklungspotential Vernachlssigung der kreativen Komponenten Konzept des IQ Mngel am HAWIE-R: der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert ihm wird deshalb vorgeworfen, vllig artifiziell zu messen Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernfhigkeit) Vernachlssigung der kreativen Komponenten und der fr die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg) Unterschtzung der Intelligenz von Unterprivilegierten und kulturellen Minoritten ein grundstzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- Tiefs einer Testperson durch beliebige Untertests- Hochs egalisiert werden knnen Mngel am HAWIE-R: der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert ihm wird deshalb vorgeworfen, vllig artifiziell zu messen Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernfhigkeit) Vernachlssigung der kreativen Komponenten und der fr die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg) Unterschtzung der Intelligenz von Unterprivilegierten und kulturellen Minoritten ein grundstzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- Tiefs einer Testperson durch beliebige Untertests- Hochs egalisiert werden knnen

    49. Kritik/2 Mngel am HAWIE-R: Validitt zu wenig untersucht einzelne Testitems werden bemngelt Probanden werden mit diagnostisch wenig informativen Items konfrontiert HAWIE- und HAWIE-R- Ergebnisse lassen sich nicht direkt vergleichen Normierungsstichprobe TEWES Replik Einzelkritikpunkte: bereits frhe Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validitt hin untersucht wurde besonders die Tatsache, dass zur prognostischen Validitt (schulpsychologische Beratung) berhaupt keine Ergebnisse im Handbuch referiert werden das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterfhrende Analysen erheblich differenziert worden danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch JGERs Intelligenzstrukturmodell) Vertreter der probabilistischen Testtheorie bemngeln, dass fr die einzelnen Untertests nicht geprft wurde, ob berhaupt homogene Fhigkeiten geprft werden FAY, 1993 bemngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE) Die Testperson wird wegen des groen Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert i.d.R. endet der Untertest bei klinischen Patienten mit einer Frustration ein adaptiver Testaufbau knnte diesen Mangel berwinden direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben der HAWIE bringt durchschnittlich hhere Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verhltnis um) Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht fr die BRD 1986 reprsentativ war wann genau die Normierung stattfand, ist nicht ersichtlich dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht fr die neuen Bundeslnder gelten (auch fr sterreich und Schweiz nicht gegeben) TEWES: Normenaktualisierung: Normierung vor Vereinigung keine bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden Validitt: die Kritik am Fehlen von Informationen zur prognostischen Validitt ist nicht verstndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.) Einzelkritikpunkte: bereits frhe Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validitt hin untersucht wurde besonders die Tatsache, dass zur prognostischen Validitt (schulpsychologische Beratung) berhaupt keine Ergebnisse im Handbuch referiert werden das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterfhrende Analysen erheblich differenziert worden danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch JGERs Intelligenzstrukturmodell) Vertreter der probabilistischen Testtheorie bemngeln, dass fr die einzelnen Untertests nicht geprft wurde, ob berhaupt homogene Fhigkeiten geprft werden FAY, 1993 bemngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE) Die Testperson wird wegen des groen Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert i.d.R. endet der Untertest bei klinischen Patienten mit einer Frustration ein adaptiver Testaufbau knnte diesen Mangel berwinden direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben der HAWIE bringt durchschnittlich hhere Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verhltnis um) Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht fr die BRD 1986 reprsentativ war wann genau die Normierung stattfand, ist nicht ersichtlich dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht fr die neuen Bundeslnder gelten (auch fr sterreich und Schweiz nicht gegeben) TEWES: Normenaktualisierung: Normierung vor Vereinigung keine bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden Validitt: die Kritik am Fehlen von Informationen zur prognostischen Validitt ist nicht verstndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.)

    50. Kritik/3 1. Allgemeines Wissen: Normdaten medialer Darstellung 2. Bilderergnzen: physikalische Details Distraktoreninformationen 1. Allgemeines Wissen: sehr problematisches Item: Zahl der Bundeslnder und Zahl der Einwohner Deutschlands wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch problematisches Item: Wer whlt bei uns den Bundeskanzler? es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist 2. Bilderergnzen: physikalische Details werden nicht beachtet, der Pb knnte abgelenkt werden (Item 7, Glas- Wasser) eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen mglich 1. Allgemeines Wissen: sehr problematisches Item: Zahl der Bundeslnder und Zahl der Einwohner Deutschlands wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch problematisches Item: Wer whlt bei uns den Bundeskanzler? es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist 2. Bilderergnzen: physikalische Details werden nicht beachtet, der Pb knnte abgelenkt werden (Item 7, Glas- Wasser) eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen mglich

    51. Kritik/4 4. Bilderordnen: Distraktoren Unachtsamkeiten der Konstrukteure 6. Mosaik- Test: Kategorie des Drehfehlers 4. Bilderordnen: unntige Distraktoren stren den Problemlseprozess einige Unachtsamkeiten primen den Probanden 6. Mosaik- Test: neu eingefhrt wurde die Kategorie des Drehfehlers der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen warum 30 Grad, wird nicht erklrt 4. Bilderordnen: unntige Distraktoren stren den Problemlseprozess einige Unachtsamkeiten primen den Probanden 6. Mosaik- Test: neu eingefhrt wurde die Kategorie des Drehfehlers der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen warum 30 Grad, wird nicht erklrt

    52. Kritik/5 9. Allgemeines Verstndnis: Fragestellung- Problematik Warum muss man Steuern zahlen? Wozu werden Steuereinnahmen gebraucht? Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder? 9. Allgemeines Verstndnis: Fragestellung- Problematik Item 5: Warum muss man Steuern zahlen? wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort Weil es ein Gesetz ist. erhlt 0 Punkte eine Antwort auf die gar nicht gestellte Frage Wozu werden Steuereinnahmen gebraucht? dagegen bringt die volle Punktzahl (2 Punkte) Item 7: Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder? (2 Antworten werden erfragt) antwortet man auf die Frage Das Kind wird zu schlecht bezahlt und macht auerdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt., erhlt man die volle Punktzahl (!) die Aussage Kinderarbeit kann zu krperlichen und seelischen Entwicklungsschden fhren wird als 1-Punkt- Antwort klassifiziert also ist die Auswertungsobjektivitt mangelhaft 9. Allgemeines Verstndnis: Fragestellung- Problematik Item 5: Warum muss man Steuern zahlen? wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort Weil es ein Gesetz ist. erhlt 0 Punkte eine Antwort auf die gar nicht gestellte Frage Wozu werden Steuereinnahmen gebraucht? dagegen bringt die volle Punktzahl (2 Punkte) Item 7: Warum gibt es ein gesetzliches Arbeitsverbot fr Kinder? (2 Antworten werden erfragt) antwortet man auf die Frage Das Kind wird zu schlecht bezahlt und macht auerdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt., erhlt man die volle Punktzahl (!) die Aussage Kinderarbeit kann zu krperlichen und seelischen Entwicklungsschden fhren wird als 1-Punkt- Antwort klassifiziert also ist die Auswertungsobjektivitt mangelhaft

    53. Kritik/6 11. Gemeinsamkeiten finden: 'darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind? Dilemma der theoriegeleitete Testkonstruktion 11. Gemeinsamkeiten finden: Gemeinsamkeit von Apfelsine und Banane anerkannt wird u.a. Baumobst, was falsch ist, denn Bananen wachsen nun mal nicht auf Bumen darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind? man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion einerseits der psychologisch schlssigen Operationalisierung dessen, was sprachliches Abstraktionsvermgen sei und der Konfrontation dieser berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz fr ein berdurchschnittlich ausgeprgtes sprachliches Abstraktionsvermgen herangezogen werden kann es gibt also Stze, ber deren Richtigkeit sich unschwer Konsens herstellen lsst sie lassen sich nicht per Mehrheitsbeschluss von richtig in falsch umdefinieren es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts richtigen Antworten sind11. Gemeinsamkeiten finden: Gemeinsamkeit von Apfelsine und Banane anerkannt wird u.a. Baumobst, was falsch ist, denn Bananen wachsen nun mal nicht auf Bumen darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennschrfe besagt, dass die ansonsten in diesem Untertest Guten dieser irrigen Auffassung sind? man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion einerseits der psychologisch schlssigen Operationalisierung dessen, was sprachliches Abstraktionsvermgen sei und der Konfrontation dieser berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz fr ein berdurchschnittlich ausgeprgtes sprachliches Abstraktionsvermgen herangezogen werden kann es gibt also Stze, ber deren Richtigkeit sich unschwer Konsens herstellen lsst sie lassen sich nicht per Mehrheitsbeschluss von richtig in falsch umdefinieren es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts richtigen Antworten sind

    54. Fazit HAWIE-R: lngst fllige Verbesserung des praktisch bewhrten Tests HAWIE Ntzlichkeit des HAWIE-R steht auer Frage globale Abschtzung des Intelligenzstatus fr die klinische Einzelfalluntersuchung konkurrenzlos Fazit der HAWIE-R stellt gegenber dem HAWIE eine bereits lngst fllige Verbesserung eines praktisch bewhrten Tests dar die Ntzlichkeit des HAWIE-R steht auer Frage allerdings gestattet er lediglich eine globale Abschtzung des Intelligenzstatus durch Vorgabe mglichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll der berzeugende Beweis fr diese Behauptung ist aber immer noch nicht erbracht davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden trotz der aufgezeigten Mngel bleibt der HAWIE-R fr die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung fr die klinisch-psychologische Forschung gegenwrtig konkurrenzlos Fazit der HAWIE-R stellt gegenber dem HAWIE eine bereits lngst fllige Verbesserung eines praktisch bewhrten Tests dar die Ntzlichkeit des HAWIE-R steht auer Frage allerdings gestattet er lediglich eine globale Abschtzung des Intelligenzstatus durch Vorgabe mglichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll der berzeugende Beweis fr diese Behauptung ist aber immer noch nicht erbracht davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden trotz der aufgezeigten Mngel bleibt der HAWIE-R fr die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung fr die klinisch-psychologische Forschung gegenwrtig konkurrenzlos

    55. Vielen Dank fr die Aufmerksamkeit!

More Related