Benutzer: Gast  Login
Titel:

Auswertung von stratifizierten Largescale-Daten mit R am Beispiel von PISA 2012

Dokumenttyp:
Konferenzbeitrag
Art des Konferenzbeitrags:
Vortrag / Präsentation
Autor(en):
Heine, Jörg-Henrik
Abstract:
Öffentlich verfügbare Datensätze aus internationalen oder nationalen "large scale“ Studien stellen eine attraktive Datengrundlage für die psychologische und sozialwissenschaftliche Forschung dar. Bei solchen Studien werden meist, für die Bevölkerung oder für spezifische Populationen, repräsentative Stichproben erhoben (Rammstedt & Spinath, 2013). Diese Repräsentativität, welche durch die Art der Stichprobenziehung sichergestellt wird, verbessert die Grundlage verallgemeinernder Schlüsse aus statistischen Analysen. Untersuchungen oder auch replizierende Analysen auf Basis solcher Datensätze können daher Studien zu gleichartigen Fragestellungen auf Basis von einfachen ad hoc Stichproben, in ihrer Aussagekraft übertreffen. Aufgrund der besonderen Art der Stichprobenziehung bei solchen "large scale assessments“ ‐ in der Regel keine einfachen Zufallsstichproben ‐ verkomplizieren sich aber die Methoden bei der inferenzstatistischen Auswertung. Gegenüber der Auswertung einfacher Zufallsstichproben müssen hier meist zwei Aspekte berücksichtigt werden. Einerseits erfolgt (1) die Stichprobeziehung der Analyseeinheiten, aus pragmatischen Gründen der Erreichbarkeit, meist in Form einer Klumpen{Stichprobe. Und (2) werden zur repräsentativen Auswahl der Analyseeinheiten meist zusätzliche Stratifizierungsvariablen herangezogen. Dies führt dazu, dass ‐ im Vergleich zur einfachen Zufallsstichprobe ‐ die Wahrscheinlichkeiten zur Aufnahme in die jeweilige Stichprobe jeder einzelnen Analyseeinheit aus der Population, nicht gleich sind. Die gängige inferenzstatistische Methodik für einfache Zufallsstichproben, kann daher für solche stratifizierten Datensätze nicht adäquat angewendet werden. In der hier angekündigten Computerwerkstatt sollen anhand des Datensatzes für die deutsche Teilstichprobe der PISA 2012 Erhebung (vgl. Heine, Sälzer, Borchert, Siberns & Mang, 2013), verschiedene statistische Methoden bei der Auswertung strati_zierter Datensätze aufgezeigt und selbst angewendet werden.Die Analysen stützen sich dabei auf die freie Statistiksoftware R (R Development Core Team, 2014) sowie die Pakete survey (Lumley, 2014) und mitools (Lumley, 2012).
Kongress- / Buchtitel:
20. Workshop Angewandte Klassifikationsanalyse (AKA)
Datum der Konferenz:
19.-21 .11. 2014
Jahr:
2014
 BibTeX