Table Of ContentUdo Kuckartz . Stefan Rädiker .Thomas Ebert . Julia Schehl
Statistik
Udo Kuckartz . Stefan Rädiker
Thomas Ebert . Julia Schehl
Statistik
Eine verständliche Einführung
III
VSVERLAG
Bibliografische Information der DeutschenNationalbibliothek
OieDeutscheNationalbibliothekverzeichnetdiesePublikation inder
Deutschen Nationalbibliografie; detailliertebibliografische Daten sind im Internet über
chtto.z/dnb.d-nb.des abrutbar.
1.Auflage 2010
Alle Rechtevorbehalten
©VSverlagfür SozialwissenschaftenISpringerFachmedienWiesbaden GmbH2010
Lektorat: FrankEngelhardt
VSVerlagfür Sozialwissenschaftenisteine Markevon Springer sacrmeden
SpringerFachmedienistTeilder Fachverlagsgruppe Springer scence-eusmessMedia.
wwwvs-verleg.de
DasWerkeinschließlichaller seinerTeileisturheberrechtlichgeschützt.Jede
Verwertung außerhalb derengen Grenzen des Urheberrechtsgesetzes ist
ohne ZustimmungdesVerlagsunzulässigundstrafbar.Dasgiltinsbesondere
für vervielfältigungen,Übersetzungen,Mikroverfilmungen und die Einspei
cherungundverarbeitunginelektronischenSystemen.
OieWiedergabevon ceoraucnsnamen. Handelsnamen.Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnungnicht zu derAnnahme, dass solche
Namen im Sinnederwarenzechen-und Markenschutz-Gesetzgebungals frei zu betrachten
wären unddahervon jedermann benutzt werden dürften.
Umschlaggestaltung: künkenopkaMedienentwicklung.Heidelberg
Druck und bucnbmcenscneVerarbeitung:reo Brink, Meppel
Gedrucktauf säurefreiem und chlorfreigebleichtemcapter
ennteointhe Netnertenos
ISBN978-3-531-16662-9
Inhalt
9
~~rt
1 DieAufbereitungderDatenfürdiestatistischeAnalyse 13
1.1 Der Codeplan 14
1.2 FehlendeWerte,immer ein Problem 20
1.3 Der EntwurfeinesCodeplans- ein Beispiel 21
1.4 Sogehtes mitSPSSjSYSTAT 26
2 Häufigkeitsverteilungen und ihregrafischeu Darstellungen 33
2.1 Häufigkeitstabellen 34
2.2 Bildung vonKategorienbei intervallskaliertenVariablen 37
2.3 Grafische Darstellungeneinfacher Häufigkeitsverteilungen 38
2.4 SogehtesmitSPSSjSYSTAT 51
3 MittelwerteundStreuungsmaße 57
3.1 Mittelwerte 57
3.2 Streuungsmaße 64
3.3 Boxplots:Grafische DarstellungvonStreuungen 70
3.4 Standardisierungsverfahren 72
3.5 SogehtesmitSPSSjSYSTAT 75
3.6 Mittelwerteund Streuungsmaßeinder Forschungsliteratur 80
4 Kreuztabelle,Chi-QuadratundZusammenbangsmaße 81
4.1 DasPrinzipder Kreuztabelle 81
4.2 Absolute Häufigkeiten,SpaltensummenundZeilensummen 83
4.3 Relative Häufigkeiten, Spaltenprozente und Zeilenprozente 84
4.4 Erwartungswerte unddie Berechnungvon Chi-Quadrat 86
4.5 Die Kreuztabelle mit mehrfachgestuften Merkmalen 89
4.6 Zusammenhangsmaßefürdie Kreuztabellenanalyse 91
4.7 WeitereVariablenindieAnalyseeinbeziehen 93
4.8 Chi-Quadrat-Berechnungfür univariate Verteilungen 93
4.9 Grafische Darstellungvon Kreuztabellen 95
4.10 SogehtesmitSPSSjSYSTAT 98
4.11 Die KreuztabellenanalyseinderForschungsliteratur 101
6 Inhalt
5 WahrscheinlichkeitundWahrscheinlichkeitsverteilungen 103
5.1 WasistWahrscheinlichkeitundwieberechnetmansie? 104
5.2 Irrenistnichtnurmenschlich, sondernauchwahrscheinlich 111
5.3 Wahrscheinlichkeitsverteilungen 112
5.4 DieBinomialverteilung 115
5.5 DieNormalverteilung 119
5.6 Diet-Verteilung 126
5.7 DieChi-Quadrat-Verteilung 127
5.8 DieF-Verteilung 128
6 DieLogikdesstatistischenSchließens 129
6.1 DieVerteilungvon Stichprobenkennwerten 129
6.2 Konfidenzintervalle 133
6.3 Diestatistische Hypothese 135
6.4 Der Hypothesentest 138
6.5 EinseitigeundzweiseitigeTests 140
6.6 Alpha-FehlerundBeta-Fehler 142
6.7 Signifikanz- ein Begriff,derindie Irreführenkann 144
6.8 Effektgröße 145
7 t-Test: zweiMittelwertevergleichen 147
7.1 Mittelwertevon zwei unabhängigenStichprobenvergleichen 149
7.2 Mittelwertevon zwei abhängigenStichprobenvergleichen 154
7.3 Sogehtes mitSPSS/SYSTAT 158
7.4 DerVergleichvon Mittelwerteninder Forschungsliteratur 165
8 Varianzanalyse: mehrals zweiMittelwertevergleichen 167
8.1 GrundbegriffederVarianzanalyse 167
8.2 DasPrinzip dereinfaktoriellenVarianzanalyse 168
8.3 DurchführungeinereinfaktoriellenVarianzanalyse 170
8.4 DiemehrfaktorielleVarianzanalyse 178
8.5 Voraussetzungenfür die DurchführungeinerANOVA 180
8.6 Sogehtes mitSPSS/SYSTAT 181
8.7 DieVarianzanalyseinder Forschungsliteratur 186
9 Korrelation: Zusammenhängeidentifizieren 189
9.1 Zusammenhängevon Variablengrafischdarstellen 189
9.2 DieKorrelationvon intervallskaliertenVariablen 192
9.3 DieKorrelationvonordinalskaliertenVariablen 198
9.4 DieKorrelationvonnominalskaliertenVariablen 200
9.5 KorrelationundKausalität 203
9.6 Sogehtes mitSPSS/SYSTAT 206
9.7 DieKorrelationsanalyseinder Forschungsliteratur 211
Inhalt 7
10 Skalenbildung 215
10.1 Was istüberhaupteineSkala? 216
10.2 Skalierungsverfahren 219
10.3 KonstruktioneinerLikertSkala 220
10.4 DieQualitäteinerSkala 227
10.5 AngabenderSkalengüteinderForschungsliteratur 228
10.6 Sogehtes mitSPSS/SYSTAT 228
11 Regression: komplexeZusammenhängeanalysierenund
Vorhersagentreffen 233
11.1 Einfachelineare Regression 233
11.2 MultiplelineareRegression 239
11.3 Ausblickaufdie logistischeRegression 244
11.4 Sogehtes mitSPSS/SYSTAT 246
11.5 DieRegressionsanalyseinderForschungsliteratur 250
Glossar 253
Literatur 261
Anhang 263
A.Datensätzevon sozial- underziehungswissenschaftlichenStudien 263
B.Tabellen 267
Register 272
Vorwort
Dieses Lehrbuchder sozialwissenschaftlichen Statistikist speziellfür die neuen
Bachelor-und Master-Studiengänge konzipiert: Esist forschungsorientiert,ver
ständlichundanwendungsorientiertWasheißt das?
Forschungsorientiertbedeutet,dasszu Beginnder PlanungdesInhalts dieses
Buches die methodenkritische Lektüre der Top-Fachzeitschriften stand.Wir ha
ben zunächst katalogisiert,welchestatistischen Verfahreninden forschungsori
entiertenArtikelnverwendet werden,die bspw.inder KölnerZeitschriftfür So
ziologie,derZeitschrift für Erziehungswissenschaft,der Zeitschrift für Evaluati
on,der Zeitschrift für Soziologie oder der Zeitschrift für Pädagogik abgedruckt
wurden.Verfahren,diedorthäufigVerwendung finden,mussman als Fachwis
senschaftlerjin kennen,allein schon um die Fachbeiträge verstehen und kriti
sieren zu können.Solche Verfahren haben prioritär Eingang in dieses Buch ge
funden, weil diese Zeitschriften den Stare-of-the-art von Forschung und For
schungsmethodikrepräsentieren.
Verständlich bedeutet, dass wir darauf verzichtet haben, ein Lehrbuch der
Stochastik mit sozialwissenschaftliehen Beispielen zu schreiben.Unsere Devise
lautete: Soviel Mathematik und soviel Formeln wie nötig, soviel sozialwissen
schaftliehe Forschungs- und Interpretationslogik wie möglich.Wir wollen also
indiesem Buchdarstellen,wasmanausder Perspektiveder empirischenSozial
forschung an Statistikkenntnissen besitzen muss und nicht der inneren Logik
derstatistischenVerfahren und ihrer mathematischenGrundlagen folgen.
Anwendungsorientiert bedeutet, dass wir die Leser und Leserinnen in den
Stand versetzen wollen, die dargestellten Verfahren auch praktisch im For
schungsalltag einsetzen zu können - und dies geschieht heutzutage mit Statis
tik-Software, die preisgünstig und teilweise kostenlos für herkömmliche P'Cs
verfügbar ist. Die Fähigkeit, all dies auch per Hand mit dem eigenen Taschen
rechner ausführen zu können, ist dagegen von begrenztem Nutzen.Wir haben
deshalbWert daraufgelegt,jeweilszuerklären,wiediebesprochenenStatistik
verfahren in die Praxis umsetzbarsind, und zwarzum einen mit dem weit ver
breiteten ProgrammSPSSundzumanderenmitdem ProgrammSYSTAT,dessen
Version für Studierende unter dem Namen MYSTAT kostenlos zur Verfügung
gestelltwird.
Statistik-Puristen werden vielleicht vorbringen,dass die Darstellungin die
sem Buch zu oberflächlich sei und die Kompetenz preisen, auch eine Varianz-
10 Vorwort
analyse oder eine multiple Regression mit dem Taschenrechner lösen zu kön
nen. Wir halten diese Fähigkeitfür entbehrlich. Vielwichtiger istes unseres Er
achtens, die Ergebnisse statistischerAnalyseninterpretieren zu könnenunddie
Realität empirischer Forschung mit kritischem Blickwahrzunehmen. Was nützt
bspw. die theoretisch unbestrittene Überlegenheit von Zufallsstichproben als
Auswahlverfahren, wenn mehr als die Hälfte der so ausgewählten Menschen
aus was für Motivlagen auchimmer- nichtzueinemInterviewbereitsind?
Die Kritik, die an den quantitativ-statistischen Methoden und den mitihnen
produzierten Ergebnissen in den letzten Jahrzehnten vorgetragen worden ist,
hatnichtzuletztdeshalb gegriffen, weil das Festhaltenam standardisiertenVor
gehen und mathematisch-statistischen Prinzipien oftmals an den Realitäten der
Lebensweltvorbeiging.Eswäreallerdings falsch,aus derteilweiseberechtigten
Kritikgleich eine fundamentale Ablehnungzu folgern. DieBetrachtungvon zah
lenmäßigen Verteilungen, Relationen und Korrelationen kann sehr erhellend
sein und stellt ein machtvolles Instrumentarium empirischer Sozialforschung
dar. Dasist auch trotz der Ablehnung, aufdie der LerngegenstandStatistikdes
Öfteren stößt, den Studentinnen und Studenten durchaus bewusst. Im Rahmen
unserer Vorlesung "Einführung in die sozialwissenschaftliehe Statistik haben
wir Studierende im 2.Semesterschriftlich gefragt"Was ist der Nutzenvon sta
tistischen Erhebungen für die Pädagogik?" Von den mehreren hundertAntwor
tenaufdieseoffen gestellte Frageseienhier nurwenigeexemplarischgenannt:
Erfolg oder Misserfolg von bestimmten Maßnahmen/Experimenten über
prüfen
Aktuelles, repräsentatives Bildvon der Gesellschafterhalten
Bedürfnisse, Wünsche, Meinungen der Klienten und Klientinnen kennenler
nen
TheorienundHypothesenüberprüfen
Ursachenund Problemfeldererkennen
Verbesserungder QualitätpädagogischerArbeit
Schon diese kleine Auswahl zeigt in ihrer verblüffenden Vielschichtigkeit, wie
wichtigein solides BasiswisseninstatistischenMethodenseinkann.
Dieses Buch folgt der Logik der statistischen Datenanalyse. wie sie typi
scherweise in Forschungsprojekten praktiziert wird. Die Kapitel bauen aufei
nander aufund sollten deshalb auch der Reihe nach gelesen werden. Der Pro
zess der Datenerhebung und deren verschiedene Formen wie Interview, Be
obachtung, Experiment oder Inhaltsanalyse bleiben in diesem Buch außen vor.
Wir starten mit dem ersten Kapitel an dem Punkt, wo die auszuwertenden Da
ten bereits vorliegen, z.B. in Form ausgefüllter Fragebögen oder Beobachtungs
bögen. Inden folgenden zehn Kapiteln wird ein anwendungsorientiertes statis
tisches Grundwissenvermittelt.
Vorwort 11
AlleKapitel,in denen Berechnungen erläutertwerden, beinhalteneinenAb
schnitt"Sogehtes mit SPSS/SYSTAT",in dem die Umsetzungdes Beschriebenen
mit Statistiksoftwareerklärtwird. DenAbschluss der meisten Kapitel bildetein
Abschnitt, in dem Beispiele aus der aktuellen Forschungsliteratur dargestellt
werden. Der Anhang enthält unter anderem ein Glossar der zentralen Begriffe
sowie Hinweiseaufwichtige, für die Forschungfrei zugängliche Datensätzegro
ßersozial- und erziehungswissenschaftlicherStudien.
DasBuchist als Begleitbuchfür einen einsemestrigen Hochschulkurs mit 15
Terminen konzipiert, wobei der erste Terminwie üblich als Einführungstermin
und der letzte Termin für die abschließend Klausur vorgesehen ist. Jenach in
tendierter Schwerpunktsetzung können dann zwei Kapitel, bspw. Kapitel 4
.Kreuztabellenanalyse" und Kapitel 11 "Regression", vertiefend an zwei Termi
nenbearbeitetwerden. Esist empfehlenswertund höchstsinnvoll, parallel zum
inhaltlichen Seminar/Vorlesungeinen Übungstermin oder ein Tutorium vorzu
sehen.
Wirmöchtenuns bei allen bedanken,die uns bei der Erarbeitungund Fertig
stellungdieses Buches unterstützt haben. Diesgiltvor allem für die Mitarbeite
rinnen der MarburgerArbeitsgruppe für Methoden & Evaluation (magma), ins
besondere für Katrin Peyerl, Dina Weiler, [anika Olschewski, Julia Busch und
Stefanie Zanetti, die bei der Erstellungder Grafiken sowie beim Satzund Layout
sehrengagiertund zuverlässiggearbeitethaben.
UdoKuckartz, Siefan Rädiker,Thomas Ebert,juliaSchehl
Marburg, imApril 2010
P.S.: Im Internet stellen wir unter V\TWV\l.statistik-verständlich.de zusätzliche In
formationen (interessante Links,Formelsammlungetc.) bereit.
Description:Dieses Lehrbuch der statistischen Datenanalyse wurde speziell für Einführungskurse konzipiert und richtet sich an alle, die eine leicht verständliche Einführung in die sozialwissenschaftliche Statistik suchen. Es bezieht sich auf das Feld der Erziehungs- und Sozialwissenschaften und behandelt de