Itemanalyse und psychometrische Kennwerte

ITEMANALYSE

Die erste deutsche Übersetzung des CSAI-2 (WAI-S 1.0) wurde einer heterogenen Stichprobe von insgesamt N = 251 Sportlerinnen und Sportlern vorgelegt. Von den 133 Frauen und 118 Männern im Alter zwischen 10 und 51 Jahren (M = 21,90) nahmen über 2/3 regelmäßig an Wettkämpfen teil, über 80 % trainierten mehr als 3 x in der Woche ihre Sportart bei einem mittleren Umfang von 5,5 Stunden. Die Athletinnen und Athleten kamen aus den Sportarten: Baseball (8), Handball (47), Tanz (14), Surfen (1), Leichtathletik (24), Schwimmen (27), Basketball (60), Judo (18) und Fußball (38), ohne Angabe (14).

Die Daten der Stichprobe wurden einer Itemanalyse (Bühner, 2004; Lienert & Raatz, 1998) unterzogen, um die Itemkennwerte der übersetzten Fragen zu ermitteln und ungeeignete Fragen bzw. Übersetzungen zu entdecken.

Test auf Normalverteilung der Item-Rohwerte

Die Verteilung der Rohwerte liefert erste Hinweise für die Eignung von Items. Prinzipiell sollte die Verteilung einer Normalverteilung gleichen, denn sie ist aus Perspektive der Testkonstruktion eine Voraussetzung für hohe Trennschärfen und die Berechnung konfirmatorischer Faktorenanalysen. Vor allem aber sind normalverteilte Rohwerte einer guten interindividuellen Differenzierung dienlich und sind für eine Standardnormierung der Testwerte notwendig (Lienert & Raatz, 1998). Zur Überprüfung der Normalverteilung stehen der Kolmogorov-Smirnov-Test und die Überprüfung der Schiefe und des Exzess der Verteilung zur Verfügung. Eine Abweichung einer Normalverteilung liegt bei z > 1,96 vor. Für die Art der Verteilung gilt, dass von einer linkssteilen Verteilung bei positivem und einer rechtssteilen Verteilung bei negativem S gesprochen wird, positiver Exzess bedeutet eine schmalgipflige, negativer Exzess eine breitgipflige Verteilung.

Tabelle 2

Wie die Daten in Tabelle 2 zeigen, sind die Rohwerte offensichtlich nicht normalverteilt, für die beiden Angst-Subskalen finden sich linksteile, in der Zuversichts-Subskala rechtssteile Verteilungen. Als Ursache wird die generelle Heterogenität der Stichprobe (in Bezug auf Alter, Sportart, Leistungsniveau) und der Untersuchungssituationen vermutet. Eine weitere Ursache könnten Geschlechtsunterschiede sein, diese sollten sich aber eigentlich in einer zweigipfligen oder zumindest generell breitgipfligen Verteilung zeigen. Dies ist aber nicht bei allen Items der Fall. Es wurde darum überprüft, ob es Mittelwertsunterschiede zwischen weiblichen und männlichen Athleten in der Beantwortung der Fragen gibt. Wie Tabelle 3 zeigt, finden sich bis auf wenige Items in der somatischen Skala durchweg signifikante Unterschiede zwischen den Geschlechtern, wobei Männer eine niedrige Intensität der Angst und eine höhere Zuversicht als Frauen angaben.

[BILD]

Eine getrennte Analyse der Rohwerteverteilung lieferte jedoch keine anderen Ergebnisse als für die Gesamtstichprobe. Weiterhin sind alle Items entfernt von einer Normalverteilung. Es ergeben sich hieraus unter diagnostischer Perspektive eine eingeschränkte Differenzierungsmöglichkeit im Bereich gering ausgeprägten Angsterlebens. Dies stellt einen Bereich dar, der in der diagnostischen Praxis wohl auch nicht von großer Bedeutung ist. Aus TestKonstruktions-Perspektive ergibt sich jedoch eine wahrscheinlich eingeschränkte Trennschärfe der Items und ein zu erwartender höher X2-Wert bei der Modelltestung im Rahmen konfirmatorischer Analysen.

Schwierigkeitsanalyse und Schwierigkeitsindex

Der Schwierigkeitsindex gibt an, wie schwer oder leicht ein Item von den Probanden gelöst werden kann, sowie die Streuung, welche Auskunft über die Unterscheidung der Itemantworten der Probanden in Bezug auf ein Item gibt. Von Vorteil ist hier immer eine mittlere Itemschwierigkeit (p = .50), weil sie die Wahrscheinlichkeit hoher Streuungen der Itembeantwortung erhöhen. Dennoch ist auf eine ausgewogene Verteilung der Schwierigkeitsindizes zu achten, damit der Test auch in Randbereichen differenzieren kann. Nach Lienert und Raatz (1998) und Fisseni (1997) sollte der Schwierigkeitsindex daher zwischen p = 0.15 und p = 0.85 liegen. Wie Tabelle 4 zeigt, sind die Items der Angstskalen insgesamt zu leicht (p < .35) und die Items der Zuversichtsskala vergleichsweise gut verteilt. Die untersuchten Athleten geben damit an, dass sie keine bis wenige Angstsymptome erleben.

Trennschärfe

Nach Bühner (2004) stellt die Trennschärfe „die korrigierte Korrelation einer Aufgabe mit einer Skala“ dar. Inhaltlich drückt eine Trennschärfe aus, wie gut ein Item eine Skala, die aus den restlichen Items gebildet wird, widerspiegelt bzw. wie prototypisch ein Item für diese Skala ist. Trennschärfen in einem Bereich von rit >.50 gelten als hoch (Fisseni, 1997), sodass bei den Items von einer zufrieden stellenden Trennschärfe gesprochen werden kann (vgl. Tabelle 4).

Selektionskennwert

Für die rationale Selektion von Items schlagen Lienert und Raatz (1998) einen Selektionskennwert vor, der die Itemkennwerte Schwierigkeit und Trennschärfe berücksichtigt und für eine hohe Differenzierungsfähigkeit des Tests in allen Bereichen sorgen soll. Selegiert werden Items mit relativ niedrigem Selektionskennwert.

[BILD]

GÜTEKRITERIEN

Wichtiger Hinweis: Bei den im Folgenden dargestellten Kennwerten handelt es sich um Zwischenergebnisse aus einem laufenden Forschungsprojekt beim BISp, die mit entsprechendem Vorbehalt zu interpretieren sind. Auf der Projekt-Homepage unter der Internet-Adresse http://www.sport.uni-stuttgart.de/wettkampfangst/ können weitere Informationen abgerufen werden.

Reliabilität

Die Reliabilität wurde anhand einer Stichprobe von N = 221 Athletinnen (n = 101) und Athleten (n = 120) berechnet. Die internen Konsistenzen der Skalen (Reliabilität nach Cronbach’s-Alpha) sind insgesamt als gut zu bewerten. Für die somatische Angstkomponente liegt diese bei α = .81. Für die Skala Besorgnis errechnet sich ein Wert von α = .79 und die Skala Zuversicht erreicht einen Wert von α = .82.

Interskalenkorrelation

An der gleichen Stichprobe wurde die Korrelation zwischen den Skalen bestimmt. Die drei Skalen korrelieren in erwarteter Weise (berechnet wurden Pearson Produkt-Moment-Korrelationskoeffizienten). Die Analysen zeigen einen Zusammenhang zwischen der somatischen Skala und der Besorgnisskala mit r = .63. Die Korrelationen zwischen der Zuversichtsskala und der somatischen Skala (r = -.50) und der Besorgnisskala (r = -.65) fallen ebenfalls recht hoch aus.

Änderungs-Sensibilität

Als Evidenz dafür, dass das WAI-S tatsächlich einen zeitlich relativ instabilen Zustand, als Reaktion auf eine Situation misst, ist es notwendig, die Daten von Personen zu mehreren Messzeitpunkten zu erheben. Dabei sollten die Summenwerte mit zunehmender Nähe zu einem Wettkampf als Angst auslösender Situation zunehmen. Hierzu füllten N = 17 Kampfsportler drei Tage (T1) und direkt am Morgen (T2) vor ihrer Deutschen Meisterschaft das WAI-S aus.

Es zeigte sich nur für die somatische Komponente ein signifikanter Anstieg zum Wettkampf hin, nicht jedoch für die Besorgnisskala. Auch für die Zuversichtsskala zeigte sich kein signifikanter Anstieg. Vergleichbare Ergebnisse ergaben sich bei einer heterogenen Stichprobe von Athleten, bei denen ebenfalls ein Anstieg nur auf der somatischen Skala gefunden wurde, nicht jedoch auf der Besorgnis-Skala. Hier ergab sich aber auch ein signifikanter Abfall der Zuversichts-Komponente. Schließlich zeigte sich in einem Experiment zum „Versagen unter Druck“ (Schorer et al., in Vorbereitung) ein signifikanter Anstieg sowohl der somatischen als auch der Besorgnis-Komponente nur für Probanden, die eine motorische Aufgabe unter wettkampfähnlichen Bedingungen ausführen sollten.

Die Skalen erweisen sich somit als änderungssensibel. Warum die Besorgnis-Komponente nicht in gleichem Maße steigt wie die somatische Komponente, bleibt zu untersuchen.

Konvergente Validität

Zur Überprüfung der konvergenten Validität des WAI-S wurde das STAI-G Form X1 (State-Trait-Inventory-German, State Form, Laux et. al., 1981) direkt vor einem Wettkampf gemeinsam mit dem WAI-S ausgefüllt. Es nahmen 29 Athletinnen und 12 Athleten teil, von denen über 50% einem Kader angehörten.

Das „State-Trait Anxiety Inventory“ (STAI) von Spielberger, Gorsuch und Lushene (1970) hat die Forschung entscheidend geprägt und ist nach wie vor eines der am häufigsten verwendeten Messinventare der psychologischen Angstforschung. Es handelt sich um einen nicht bereichsspezifischen Fragebogen, der Angst und Ängstlichkeit in jeweils nur einer Komponente unabhängig vom Phänomenbereich Wettkampfsport misst.

Für die vorliegende Untersuchung wurde nur der State-Anteil des Fragebogens berücksichtigt.

Die Ergebnisse liefern das erwartete Ergebnis. Es bestehen hohe Zusammenhänge zwischen WAI-S und STAI-State, wobei die WAI-S-Besorgniskomponente erwartungskonform höher als die somatische Komponente mit der STAI- State Skala korreliert (die deutschsprachige STAI- State ist im Wesentlichen über Items operationalisiert, die für eine hohe Besorgnis stehen).

Tabelle 2: Korrelationen der Skalen der WAI-S und dem STAI (A- State).

	n	WAI-S
		somatische Angst	Besorgnis	Zuversicht
STAI (A-State)	41	.59*	.68*	-0.52*
**.Die Korrelation ist auf dem Niveau = .05 (2-seitig) signifikant.

nach oben

Navigation und Service

Servicemenü

Hauptmenu

Sportpsychologie im BISp

Unternavigationspunkte

Informationsportal

Unternavigationspunkte

Diagnostikportal

Unternavigationspunkte

Suche

Bereichsmenu

Itemanalyse und psychometrische Kennwerte

ITEMANALYSE

Test auf Normalverteilung der Item-Rohwerte

Schwierigkeitsanalyse und Schwierigkeitsindex

Trennschärfe

Selektionskennwert

GÜTEKRITERIEN

Reliabilität

Interskalenkorrelation

Änderungs-Sensibilität

Konvergente Validität

Zusatzinformationen

Eckdaten zum Inventar

Downloads

Auswertungsmodi

Interpretationshilfen

Hilfe

Sportpsychologie im BISp

Informationsportal

Diagnostikportal

Service