Table Of ContentReihenherausgeber:
Prof. Dr. Holger Dette · Prof. Dr. Wolfgang Härdle
Statistik und ihre Anwendungen
Weitere Bände in dieser Reihe
http://www.springer.com/series/5100
Andreas Quatember
Datenqualität in
Stichprobenerhebungen
Eine verständnisorientierte Einführung in
Stichprobenverfahren und verwandte
Themen
2., überarbeitete Auflage 2015
Andreas Quatember
Institut fürAngewandte Statistik
Johannes Kepler Universität (JKU) Linz
Linz
Österreich
Statistik und ihreAnwendungen
ISBN 978-3-662-47458-7 ISBN 978-3-662-47459-4 (eBook)
DOI 10.1007/978-3-662-47459-4
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie;
detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Spektrum
© Springer-Verlag Berlin Heidelberg 2014, 2015
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht
ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung desVerlags.
Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und
die Einspeicherung und Verarbeitung in elektronischen Systemen.
DieWiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesemWerk be-
rechtigtauchohnebesondereKennzeichnungnichtzuderAnnahme, dasssolcheNamenimSinneder
Warenzeichen-undMarkenschutz-Gesetzgebungalsfreizubetrachtenwärenunddahervonjedermann
benutzt werden dürften.
DerVerlag, dieAutoren und die Herausgeber gehen davon aus, dass dieAngaben und Informationen
in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag
nochdieAutorenoderdieHerausgeberübernehmen,ausdrücklichoderimplizit,GewährfürdenInhalt
des Werkes, etwaige Fehler oder Äußerungen.
Planung: Iris Ruhmann
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer-Verlag GmbH Berlin Heidelberg ist Teil der Fachverlagsgruppe Springer Science+Business
Media (www.springer.com)
Vorwort
Eines Tages erhielt ich eine E-Mail vom Springer Verlag, in der angefragt wurde, ob
ichmeinLehrveranstaltungsskript„DatenqualitätinStichprobenerhebungen“nichtinder
Buchreihe „Statistik und IhreAnwendungen“ publizieren möchte. Nun – Sie halten das
Buch ja gerade in Ihren Händen – ich wollte.
SchonwährendmeinesStatistikstudiumshabeichdieStichprobenthematikalsbeson-
ders spannend empfunden:Wie kann man aus einer geringenAnzahl an Beobachtungen
auf dieVerhältnisse in Populationen rückschließen? Wie groß ist die Ungenauigkeit der
Stichprobenergebnisseundwielässtsichdiesemessenundbeeinflussen?Betrachtetman
unser tägliches Leben, dann ist genau diese Rückschlussproblematik vom Teil auf das
Ganze geradezu allgegenwärtig. Nur selten sind wir im Besitz der ganzen „Wahrheit“.
Setzen wir beimAutofahren zum Überholen an, schließen wir in Bezug auf die Gefähr-
lichkeit des Überholmanövers von dem uns verfügbaren Teil der gesamten Information
aufdasGanze. LassenwirunsBlutentnehmen, legenwireinePrüfungab–immerwird
von einem beobachteten Teil auf die Gesamtheit rückgeschlossen.
Später habe ich meine Dissertation zu einem bestimmten Stichprobenverfahren, dem
Quotenverfahren, verfasst und mich in meinem Beruf als Wissenschaftler am IFAS-
Institut für Angewandte Statistik der Johannes Kepler Universität Linz in Forschung,
Projektenund–nichtzuletzt–auchinderLehredemStichprobenthemagewidmet. Das
inderobenzitiertenE-MailangesprocheneManuskriptzumeinerLehrveranstaltungaus
„Stichprobenverfahren“wurdenunzudiesemBuch.DemnachhabenvielePartnermitge-
wirkt, denn das Manuskript ist über die Jahre an den Erfahrungen mit den Studierenden
auchimWortsinngewachsen. EshatsichdenneuenAnforderungenandieVerständlich-
keitderAusführungenundauchandiezuvermittelndenInhalteimmerwiederangepasst.
IndiesemSinnewurdeauchfürdiehiermitvorliegende2.AuflagederTextüberarbeitet,
korrigiert und abermals inhaltlich ergänzt.
Das Buch bietet eine verständnisorientierte Einführung in Stichprobenverfahren,
Schätzmethoden und andere Aspekte, die die Datenqualität in Stichprobenerhebungen,
damit ist hier vordergründig die Ergebnisqualität gemeint, beeinflussen und ihre An-
wendungen. Das Methodenverständnis wird gestützt durch die möglichst anschauliche
Darstellung der jeweiligen Basisidee. DieseAnschaulichkeit wird durch kleine direkt in
V
VI Vorwort
denTexteingebauteundgeradedadurchdasVerständnisförderndeBeispieleunterstützt.
Beweise für mathematische Behauptungen werden dabei nicht ausgespart. Dennoch soll
sich das Buch auch einfach nur lesen lassen. So jedenfalls will es meine Intention.
Es deckt alle wesentlichen Aspekte der Stichprobenthematik ab und soll den Leser-
innen und Lesern durch das gewonneneVerständnis auch erleichtern, sich mit einzelnen
dieser Aspekte vertiefend auseinanderzusetzen. Natürlich kann man darin hin und her
springen und einzelne Abschnitte herausnehmen, die in Beruf oder Ausbildung gerade
eine Rolle spielen. Ich möchte aber empfehlen, das Buch beim ersten Gebrauch vor-
ne zu beginnen und sich mit dem 1. Kapitel „Vom Teil aufs Ganze – Einführung in
die Stichprobentheorie“ daran zu gewöhnen. Dies soll den weiteren gemeinsamen Weg
erleichtern, vielleicht sogar dazu ermuntern.
Naturgemäß gibt es bei einem solchen Buchprojekt Menschen, bei denen man sich
bedanken möchte.Allen voran sind das in diesem Fall die damit beschäftigten Mitarbei-
terinnen und Mitarbeiter im Springer Verlag – an erster Stelle Clemens Heine, Annika
Denkert und Iris Ruhmann: Dankeschön! Für ihre Einschätzung meinerArbeit den Her-
ausgebernderReihe„StatistikundihreAnwendungen“HolgerDetteundWolfgangKarl
Härdle: Dankeschön! Ich möchte ferner einen herzlichen Dank an jene Kolleginnen und
KollegenanmeinemInstitutrichten, diemichinmeinerArbeitsounterstützenundauch
fördern,dasssiefürmichbeinahejedenTagspannendbleibt,anvordersterFrontWerner
Müller: Dankeschön! UndschließlichbedankeichmichbeijenemMenschen, dermeine
Begeisterung für das Leben teilt. Du weißt schon, dass Du gemeint bist: Dankeschön!
August 2015 Andreas Quatember
Inhaltsverzeichnis
1 Vom Teil aufs Ganze – Einführung in die Stichprobentheorie ........... 1
1.1 AmAnfang war das Feuer........................................ 1
1.2 DieAufgabenstellung............................................ 7
1.3 Die schließende Statistik ......................................... 13
1.3.1 Die Punktschätzung ....................................... 14
1.3.2 Die Intervallschätzung..................................... 16
1.3.3 Das Testen von statistischen Hypothesen..................... 18
1.4 Der Horvitz-Thompson-Schätzer für die Merkmalssumme ............ 21
1.4.1 Die Unverzerrtheit des Schätzers............................ 21
1.4.2 DieVarianz des Schätzers.................................. 25
1.5 Zusammenfassung und Notationen................................. 31
Literatur ............................................................ 32
2 Die Mutter aller Zufallsstichprobenverfahren – Die uneingeschränkte
Zufallsauswahl...................................................... 35
2.1 Das Ziehungsmodell............................................. 35
2.2 Die praktische Umsetzung........................................ 36
2.3 Die Schätzung einer Merkmalssumme.............................. 38
2.3.1 Die Schätzung und ihre Genauigkeit......................... 38
2.3.2 Der erforderliche Stichprobenumfang ........................ 43
2.4 Die Schätzung eines Mittelwerts .................................. 46
2.4.1 Die Schätzung und ihre Genauigkeit......................... 46
2.4.2 Der erforderliche Stichprobenumfang ........................ 47
2.5 Die Schätzung einerAnzahl ...................................... 48
2.5.1 Die Schätzung und ihre Genauigkeit......................... 48
2.5.2 Der erforderliche Stichprobenumfang ........................ 49
2.6 Die Schätzung einesAnteils ...................................... 50
2.6.1 Die Schätzung und ihre Genauigkeit......................... 50
2.6.2 Der erforderliche Stichprobenumfang ........................ 52
VII
VIII Inhaltsverzeichnis
2.7 Zusammenfassung und neue Notationen............................ 52
Literatur ............................................................ 53
3 Es geht auch anders – Weitere Schätzmethoden ....................... 55
3.1 Andere Schätzer für eine Merkmalssumme ......................... 55
3.1.1 DerVerhältnisschätzer..................................... 55
3.1.2 Der Regressionsschätzer ................................... 60
3.1.3 Die SmallArea-Schätzer................................... 62
3.2 Schätzer für andere Parameter .................................... 64
3.2.1 Die Schätzung der Größe einer Grundgesamtheit.............. 64
3.2.2 Die Schätzung der Populationsverteilung..................... 66
3.2.3 Die Schätzung von Quantilen............................... 69
3.2.4 Die Schätzung des Korrelationskoeffizienten.................. 70
3.3 Methoden zur Berechnung von Schätzern für die Schätzervarianz...... 72
3.3.1 Die Taylorlinearisierung ................................... 72
3.3.2 Das Bootstrapverfahren.................................... 74
3.4 Schätzung beiAntwortausfällen und Falschantworten................. 78
3.4.1 Gewichtungsanpassung .................................... 80
3.4.2 Die Datenimputation ...................................... 81
3.5 Zusammenfassung und neue Notationen............................ 84
Literatur ............................................................ 86
4 Zerlegen macht’s genauer – Die geschichtete uneingeschränkte
Zufallsauswahl...................................................... 87
4.1 Das Ziehungsmodell............................................. 87
4.2 Die Schätzung einer Merkmalssumme.............................. 90
4.3 Die Schätzung eines Mittelwerts .................................. 93
4.4 Die proportionaleAufteilung...................................... 95
4.5 Die optimaleAufteilung.......................................... 99
4.6 Der erforderliche Stichprobenumfang .............................. 102
4.7 Die nachträgliche Schichtung ..................................... 103
4.8 DieVerhältnisschätzung.......................................... 105
4.9 Zusammenfassung und neue Notationen............................ 106
Literatur ............................................................ 108
5 Nahe Liegendes gemeinsam erheben spart Geld – Die uneingeschränkte
Klumpenauswahl ................................................... 109
5.1 Das Ziehungsmodell............................................. 109
5.2 Die Schätzung einer Merkmalssumme.............................. 114
5.3 Genauigkeitsbetrachtungen ....................................... 117
5.4 DieVerhältnisschätzung.......................................... 120
5.5 Zusammenfassung und neue Notationen............................ 121
Literatur ............................................................ 123
Inhaltsverzeichnis IX
6 Nahebeisammenunddochauseinander–Diezweistufigeuneingeschränkte
Zufallsauswahl...................................................... 125
6.1 Das Ziehungsmodell............................................. 125
6.2 Die Schätzung einer Merkmalssumme.............................. 128
6.3 Zusammenfassung............................................... 132
Literatur ............................................................ 133
7 Grenzt an Zauberei – Die größenproportionale Zufallsauswahl ......... 135
7.1 Das Ziehungsmodell............................................. 135
7.2 Die Schätzung einer Merkmalssumme.............................. 138
7.3 Zusammenfassung............................................... 141
Literatur ............................................................ 141
8 Welcher Zweck heiligt solche Mittel? – Die nichtzufälligenAuswahlen... 143
8.1 Die Quotenauswahlen............................................ 143
8.2 Andere bewussteAuswahlen...................................... 148
8.3 Die willkürlichenAuswahlen ..................................... 149
8.4 Zusammenfassung............................................... 150
Literatur ............................................................ 150
Anhang ............................................................... 151
Sachverzeichnis ........................................................ 157