Название: Erstellung von Fragebogen
Автор: K. Wolfgang Kallus
Издательство: Bookwire
Жанр: Социология
isbn: 9783846344651
isbn:
Wenn ein Merkmalsbereich besonders ökonomisch erfasst werden soll (z. B. für die Entwicklung eines Screeningverfahrens zur Burnout-Prophylaxe), stellt die orthogonale Rotation die Methode der Wahl dar. Orthogonale Rotationen sind auch dann vorzuziehen, wenn der Merkmalsbereich noch nicht hinreichend strukturiert ist und die Beschreibung von „Kerndimensionen“ im Zentrum der Entwicklung steht. Orthogonal sollte auch immer rotiert werden, wenn die späteren NutzerInnen keine Übung im Umgang mit Merkmalsprofilen haben. Als abschließender Hinweis sei erwähnt, dass das Kaiser’sche Eigenwertkriterium als Standard für die Faktorenextraktion bei Items fraglich ist, da die „wahre“ Varianz von Items in der Regel weit unterhalb von 1 liegt.
Bei der (orthogonal rotierten) Faktorenanalyse von Items ergeben sich in der Regel eher wenige Basisfaktoren, die im Sinne eines Screeningverfahrens sehr gut eine erste Einordnung von Personen erlauben. Beispiele für faktorenanalytisch entwickelte Verfahren sind das NEO-FFI (Costa & McCrae, 1992), das Persönlichkeitsmerkmale in fünf Bereichen ökonomisch erfasst.
Für die faktorenanalytische „Suche“ nach Subtests stellt sich oft das Problem der unterschiedlichen Abstraktionsebene/begrifflichen Ebene von Items und der nur selten eingesetzten repräsentativen Itempools. Unterschiedliche Abstraktionsniveaus von Items lassen sich in linearen Korrelationen nicht angemessen abbilden. Faktorenanalysen „kranken“ oft daran, dass die Faktorenanalyse nicht mehr „herausbringt“ als an Information „hineingesteckt“ wurde. Somit lässt sich ein Test nur dann faktorenanalytisch sinnvoll konstruieren, wenn die Items den Merkmalsbereich repräsentativ auf vergleichbarem Niveau mit einer vergleichbaren Skala (z. B. Häufigkeiten) so abbilden, dass alle relevanten Abhängigkeiten in der linearen Korrelation angemessen repräsentiert sind. Für interessierte LeserInnen sei hier auf die parallelen Probleme bei der Anwendung und Interpretation linearer Strukturgleichungsmodelle verwiesen (siehe auch Kapitel 6.4.2). Andererseits sei an dieser Stelle darauf hingewiesen, dass die Faktorenanalyse auch einsetzbar ist, um bei mäßigen Trennschärfen die (faktorielle) Struktur innerhalb von Subtests (insbesondere von Subtests mit mehr als sechs bis acht Items) zu prüfen.
Ein Grundproblem der faktorenanalytischen Testkonstruktion stellt die Informationsbasis „Item“ an sich dar. Einzelitems sind in der Regel nicht sehr zuverlässig – aus diesem Grund werden in Fragebogen Summenwerte gebildet, die eine höhere Reliabilität aufweisen. Faktorenanalysen mit wenig reliablen Einzelvariablen benötigen generell eine eigene Methodik (s. a. Cronbach, Gleser, Nanda & Rajaratnam, 1972). Diese Überlegungen werden jedoch oft nicht (mehr) berücksichtigt, da SPSS und andere Rechenprogramme entsprechende Optionen (z. B. Schätzung der Kommunalitäten durch das Quadrat der multiplen Korrelation) nicht (mehr) eröffnen. Damit scheint es sinnvoll, in vielen Fällen den Stellenwert der Faktorenanalyse zu relativieren. Bei komplexen Merkmalen wird der Einsatz der weiter oben dargestellten Methoden zur Entwicklung von (korrelierten) Subtests empfohlen. Dabei wird versucht, die unterschiedlichen Facetten oder Ebenen des Merkmals mit jeweils vier bis sechs Items aus der Perspektive der Befragten abzubilden. Der Königsweg ist hier immer der theoriegeleitete. Dieser stellt sicher, dass die ermittelten Subtestwerte gut interpretierbar sind und damit auch gute Validitäten erreichen. Der Einsatz der Faktorenanalyse erfolgt dabei dann in einem gestuften Vorgehen. Nach Bildung der Subtests kann einer explorativen Faktorenanalyse der Subtests oder mit einer konfirmatorischen Faktorenanalyse in linearen Strukturgleichungsmodellen die Merkmalsstruktur dargestellt werden.
2.5.2 Faktorenanalysen auf Subtestebene
Bei den Analysen auf Subtestebene werden zunächst hinreichend homogene Subtests entwickelt, wobei neben den Trennschärfen auch Itemreliabilitäten aus Messwiederholungen oder Itemvaliditäten einbezogen werden können (s. Kapitel 4). Die Prüfung der Subtestqualität kann über die Homogenität erfolgen, die sich in hinreichend hohen Werten von Cronbach’s α niederschlägt.
Alternativ kann die Testkonstruktion in den sog. Messmodellen eines linearen Strukturgleichungsmodells vorgenommen werden. Dabei schlagen sich Verletzungen der Annahme, dass jedes Item nur zwei Varianzanteile aufweisen sollte („wahre“ Varianz plus der von den anderen Items völlig unabhängigen Fehlervarianz), direkt in schlechten Kennwerten für die Modellpassung nieder (vgl. Eid & Schmidt, 2014). Die Verletzung der Grundannahme der Klassischen Testtheorie (Unkorreliertheit von wahrem Wert und Messfehler) schlägt sich in korrelierten Messfehlern nieder. Korrelierte Messfehler ergeben sich, wenn zwei oder mehr Items spezifische Gemeinsamkeiten haben, die die übrigen Items des Subtests nicht aufweisen. Diese Gemeinsamkeiten können durch die Iteminhalte bedingt sein, aber auch durch Formulierungsähnlichkeiten, itemspezifische Antworttendenzen etc.
Die alte Regel, 50% der Items negativ zu formulieren, um einer Zustimmungstendenz vorzubeugen, ist im Licht der Ergebnisse aus Strukturgleichungsmodellen neu zu betrachten. Negativ formulierte Items erfassen das Konzept oft in anderer Form und haben jeweils eine durch die Negation bedingte, gemeinsame merkmalsunabhängige Varianz. Diese schlägt sich entweder in korrelierten Messfehlern oder in eigenen Unterfaktoren für positiv und negativ formulierte Items nieder. Möglicherweise liegt aber auch kein bipolares Konzept vor – wie wir es am Beispiel der (Arbeits-)Zufriedenheit (Herzberg, 1966) oder auch der Messung der Stimmung (Diener & Emmons, 1984) bereits aus unterschiedlichen Modellen kennen. Umgepolte Items sind bestenfalls für Zustimmungsskalen (z. B. die Antwortskala „trifft zu“/„trifft nicht zu“) zur Kontrolle von Zustimmungstendenzen notwendig. Eine Umformulierung/Negation von Items mit anderen Antwortskalen (z. B. Häufigkeitsskalen) ist inhaltlich in vielen Fällen kaum möglich, nicht notwendig und nur sinnvoll, wenn der „negative“ Aspekt (möglicherweise in einem eigenen Subtest) explizit einbezogen werden soll. Zumindest innerhalb eines Subtests (und insbesondere außerhalb der Einstellungsmessung) ist die alte Regel der „50 : 50-Polung von Items“ daher als überholt zu bewerten.
Wenn eine Faktorenanalyse der Subtests zwei oder mehr unabhängige Faktoren ergibt, die sinnvoll interpretierbar sind, ist die Bildung eines einzelnen Gesamtwerts in der Regel wenig sinnvoll, auch wenn Statistikprogramme wie SPSS dafür routinemäßig einen Wert ausgeben. Dazu sei jedoch auf die langjährige Diskussion zum „Generalfaktor“ der Intelligenz und den IQ verwiesen.
2.5.3 Grenzen der faktorenanalytischen Konzeptdefinition
Die möglichst ökonomische Charakterisierung von Individuen zur Beschreibung interindividueller Unterschiede ist nur einer der Einsatzbereiche von Fragebogen. Bei der Zustands- und Prozessbeschreibung und der Ableitung von Interventionsansätzen, d. h. im Bereich der (formativen) Evaluation und des Monitorings, geht es nicht um eine möglichst sparsame Differenzierung von Personen. Vielmehr sollen Facetten von Veränderungsprozessen abgebildet werden, die frühestmöglich eine Korrektur unerwünschter Wirkungen, aber auch das Ausbleiben angezielter Effekte aufzeigen. Die Ableitung konkreter Beratungs- und Interventionshinweise erfordert ein differenziertes, verhaltensnahes Monitoring der Umsetzung von Veränderungen bei Personen, Teams und Organisationen. Ein Monitoring des Zustandes von Teams oder Personen sollte so verhaltensnah wie möglich stattfinden. Damit wird neben der Messung auf dem Niveau von Globalwerten (vergleichbar der Typenebene im Eysenck’schen Modell der Personenbeschreibung; s. Stemmler, Hagemann, Amelang & Bartusek, 2011, S. 57) eine Messung auf der Ebene konkreter Verhaltensmuster СКАЧАТЬ