Table Of ContentLEXIKON
STATISTIK
RÖNZ/STROHE (Hrsg.)
LEXIKON
STATISTIK
HERAUSGEBER:
PROF. DR. BERND RÖNZ
PROF. DR. HANS GERHARD STROHE
AUTOREN:
PROF. DR. PETER ECKSTEIN
PROF. DR. WOLFGANG GÖTZE
DR. FRIEDRICH HARTL
PROF. DR. BERND RÖNZ
PROF. DR. HANS GERHARD STROHE
GABLER
Die Deutsche Bibliothek - CIP-Einheitsaufnahme
Lexikon Statistik / Hrsg.: Bernd Ronz ; Hans Gerhard Strohe.
Autoren: Peter Eckstein ... - Wiesbaden : Gabler, 1994
(Gabler Wirtschaft)
ISBN 978-3-409-19952-0 ISBN 978-3-322-91144-5 (eBook)
DOI 10.1007/978-3-322-91144-5
NE: Ronz, Bernd [Hrsg.]; Eckstein, Peter
Der Gabler Verlag ist ein Unternehmen der Verlagsgruppe Bertelsmann International.
© Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH, Wiesbaden 1994
Softcover reprint of the hardcover 1s t edition 1994
Lektorat: Dr. Walter Nachtigall
Das Werk einschlieBlich aller seiner Teile ist urheberrechtlich
geschiitzt. Jede Verwertung auBerha1b der engen Grenzen des
Urheberrechtsgesetzes ist ohne Zustimmung des Ver1ags unzu
lassig und strafbar. Das gilt insbesondere flir Vervielfaltigungen,
Ubersetzungen, Mikroverfilmungen und die Einspeicherung und
Verarbeitung in elektronischen Systemen.
Hochste inhaltliche und technische Qualitat unserer Produkte ist unser Ziel. Bei der
Produktion und Verbreitung unserer Biicher wollen wir die Umwelt schonen: Dieses
B uch ist auf saurefreiem und chlorfrei gebleichtem Papier gedruckt. Die EinschweiBfolie
besteht aus Polyathylen und damit aus organischen Stoffen, die weder bei der Herstellung
noch bei der Verbrennung Schadstoffe freisetzen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in
diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daB
solche Namen im Sinne der Warenzeichen-und Markenschutz-Gesetzgebung als frei zu
betrachten waren und daher von jederrnann benutzt werden diirften.
Umschlaggestaltung: Schrimpf und Panner, Wiesbaden
ISBN 978-3-409-19952-0
Vorwort
Das vorliegende Lexikon ist als Nachschlagewerk für alle bestimmt, die in ihrer
praktischen Arbeit und bei Studien mit Statistik konfrontiert werden. Es gab bis
her kein allgemeinverständliches Statistik-Lexikon in deutscher Sprache, das ne
ben der Stochastik auch die beschreibende Statistik sowie die Begriffswelt der
Wirtschafts-und Sozialstatistik darbietet. Die Nutzer werden in der Mehrzahl im
Wirtschaftsleben Tätige und Mitarbeiter von verschiedensten Institutionen bzw.
Verwaltungen sein. Auch für Studenten von Studiengängen auf vorgenannten
Fachgebieten soll das Lexikon zu einer vielgenutzten Lern- und Arbeitshilfe
werden. Nicht zuletzt kann sich das Nachschlagewerk auch Wissenschaftlern
aller anderen Disziplinen in Lehre, Forschung und bei analytischen Arbeiten als
dienlich erweisen.
Den Kern des Buches bildet die Erklärung von Begriffen aus den Bereichen der
Erhebung, Aufbereitung, Darstellung und Analyse von Daten. Das Schwerge
wicht muß dabei wegen der leichteren Eingrenzbarkeit auf dem Gebiet der Me
thodenlehre liegen. Aufgebrochen wurde diese Selbstbeschränkung jedoch vor
allem durch die Aufnahme vieler Begriffe aus der Bevölkerungs- und Wirt
schafts statistik, ohne hier ein ähnliches Maß an Vollständigkeit anzustreben. Die
wichtigsten Verfahren der Statistik werden unter den jeweiligen Stichworten an
wendungsbereit mit den eventuell notwendigen Formeln dargestellt, wobei auf
deren Ableitung verzichtet wurde. Bei einfachen Verfahren wird das Vorgehen
an einem numerischen Beispiel gezeigt und zum Teil durch die Ausweisung rea
ler Datensätze, vor allem aus dem Bereich der Ökonomie und der Bevölkerungs
statistik, ergänzt. Bei sehr umfangreichen oder anspruchsvollen Verfahren be
schränkten sich die Autoren auf die Darstellung des Anwendungsgebietes, der
Zielstellung und die grobe Skizzierung der Vorgehensweise. Auf Grenzen der
Anwendbarkeit und Interpretationsfähigkeit der statistischen Verfahren und ihrer
Resultate wird hingewiesen.
Obwohl die Mehrzahl der genannten Nutzer aus Wirtschaft, Wissenschaft und
Verwaltung vorwiegend mit beschreibender Statistik arbeitet, enthält unser Le
xikon auch die wichtigsten Begriffe der Wahrscheinlichkeitsrechnung, der
induktiven Statistik und der Theorie stochastischer Prozesse. Diese Gebiete wur
den aufgenommen, um hier Schranken abzubauen, Schwellenängste zu mindern
und eventuell neue Wege für diesen Nutzerkreis zu öffnen.
Tafeln der gebräuchlichsten Wahrscheinlichkeitsverteilungen, allerdings mit ei
nem sehr groben Punkteraster, werden beim jeweiligen Stichwort angeführt, um
die exemplarische Vermittlung der Gestalt der zugehörigen Verteilungsfunktion
und zumindest Beispielrechnungen zu ermöglichen.
Die Herausgeber sind sich darüber im klaren, daß ein Lexikon vom Umfang des
vorliegenden Buches nicht· einmal annähernd den gegenwärtigen Wissensstand
auf dem Gebiet der Statistik im Überblick darstellen kann. Das betrifft bei einem
Lexikon für Praktiker natürlich vor allem die theoretischen Bereiche. Beschrän
kungen in der Stichwortwahl und in der Tiefe der Ausführungen waren daher
unumgänglich.
Für Kritiken und Hinweise zur Verbesserung des Lexikons sind wir jederzeit
aufgeschlossen und dankbar.
Wir danken dem Betriebswirtschaftlichen Verlag Dr. Th. Gabler für die Unter
stützung der Herausgabe des Lexikons und insbesondere dem Prograrnmbe
reichsleiter in der Berliner Geschäftsstelle des Verlages, Herrn Dr. Walter
Nachtigall, für die verständnisvolle Zusammenarbeit. Gleichermaßen sind wir
der Lektorin Frau Ingrid Stolte für die kritische und konstruktive Durchsicht des
Manuskripts sehr verbunden. Weiterhin danken wir Herrn Dipl.-Math. Jörg
Betzin und Herrn Dipl.-Volkswirt Sascha Rieken für ihre Hilfe bei der Illustra
tion bzw. der Korrektur des Manuskriptes.
Berlin und Potsdarn, Juni 1994
Die Herausgeber
Benutzerhinweise
I. Die Stichwörter des Lexikons sind nach Art eines Konversationslexikons
geordnet. Die alphabetische Reihenfolge wird -auch bei zusammengesetzten
Stichwörtern - strikt gewahrt und folgt den allgemeingültigen Regeln nach
Duden.
Zusammengesetzte Begriffe, wie "gleitender Durchschnitt", sind unter dem
alphabetisch eingeordneten Adjektiv zu finden. Das gilt ebenso für fachliche
Abkürzungen, wie "PLS", "AR-Prozeß" u.a.
Begriffe, die griechische Buchstaben oder mathemathische Symbole enthalten,
wie z. B. ''x:2-Verteilung'', werden als Stichwort mit dem ausgeschriebenen
deutschen Namen dieser Buchstaben oder Symbole, also z. B. "Chi-Quadrat
Verteilung", lexikographisch eingeordnet.
Bindestriche und Leerzeichen in Begriffen werden bei der lexikographischen
Einordnung ignoriert, d. h., das Stichwort wird so eingeordnet, als ob die
beiden angrenzenden Buchstaben unmittelbar aufeinander folgen.
2. Synonyme von Stichwörtern stehen vor dem erklärenden Text in kursiver
Schrift.
3. Verweise (~) finden sich in drei Formen:
- als Hauptverweis, d. h., von einem Stichwort wird mit Pfeil auf ein anderes
verwiesen, unter dem das betreffende definiert und erläutert ist;
- als Textverweis, d. h., im laufenden Test eines Stichwortes wird der Leser
mit Pfeil vor einem Begriff darauf aufmerksam gemacht, daß dieser an der
entsprechenden Stelle definiert ist und eventuell der gerade behandelte
Sachverhalt dort näher erläutert wird;
- als Schlußverweis, d. h., am Ende eines Artikels wird der Leser auf einen
Begriff aufmerksam gemacht, der mit dem hier behandelten in engem
Zusammenhang steht und den zusätzlich nachzuschlagen sich lohnen
könnte.
A
ABC-Kurven Beginn des Zeitabschnittes sowie die
Sammlung von ---7 Zeitreihen, die in relative Häufigkeit der Nichtausfälle
den zwanziger Jahren als Konjunktur (als maßgebliche Angabe für die A.)
indikatoren eingeführt, später wegen tabellarisch erfaßt. Die graphische
deutlich falscher Prognosen aufgege Wiedergabe der A. ist die Abgangs
ben wurden. Die Kurvenklasse A linie, wobei auf der Abszisse die Zeit
umfaßte 4 Zeitreihen mit einem In und auf der Ordinate der Anteil über
dex der Erwartungsbildung, die Kur lebender Elemente abgetragen wird.
venklasse B 5 Zeitreihen mit einem Die Abgangslinie ist monoton fal
Index für die Produktivitätsentwick lend .. Stochastisch gesehen gibt die
lung und die Klasse C 4 Zeitreihen A. zu jedem Zeitpunkt t die Überle
mit einem Index der Finanzmarktsi benswahrscheinlichkeit an, d.h., mit
tuation in New York City (Harvard welcher Wahrscheinlichkeit ein Ele
Barometer). Die Zeitreihen in jeder ment noch zu der Gesamtheit gehört
Klasse wiesen Ähnlichkeiten bei peri- (---7 Lebensdauer). Ein klassisches Bei
0dischen Schwingungen und Wende spiel einer A. ist die ---7 Sterbetafel.
punkten (Umkehrzeitpunkte) auf. Die Die Kenntnis der A. spielt u.a. eine
moderne Konjunkturdiagnose stützt wichtige Rolle bei der Bestimmung
sich dagegen auf stochastische Pro der mittleren Lebensdauer in der Be
zesse (---7 BSM, ---7 Kointegration), auf völkerungsstatistik und in der Tech
Methoden der ---7 Szenario-Technik nik sowie bei der Ermittlung des
oder auf eine ---7 Expertenbefragung. Umfangs und des Ersatzbedarfs bei
Eine Kombination verschiedener An der Lagerhaltung. Im Gegensatz zu
sätze ist sinnvoll (---7 kombinierte Pro biologischen Gesamtheiten, deren A.
gnose). sich nur allmählich in der Zeit ver
ändern, sind A. technischer und wirt
Abgangsfunktion ---7 dynamische schaftlicher Gesamtheiten durch rela
ModelIierung tiv rasche Veränderungen der Tech
nik bzw. der wirtschaftlichen Gege
Abgangsordnung benheiten weniger stabil. ---7 Ausfall
Lebenskurve einer Gesamtheit, die rate, ---7 dynamische ModelIierung
den Abbau der Gesamtheit bis zu ih
rem "Aussterben" beschreibt. Zur Abgangsprozeß ---7 dynamische
empirischen Darstellung der A. wer ModelIierung
den die Zeitintervalle, die Anzahl der
Ausfälle in dem jeweiligen Zeitinter Abhängige Variable ---7 endogene
vall, die Anzahl der Nichtausfälle zu Variable
Abhängigkeit von Zufallsvariablen
Abhängigkeit von Zufallsvaria licher Stichprobenresultate (XI"'" xn),
blen deren Elemente zur Ablehnung der ~
Stochastischer Zusammenhang von ~ Nullhypothese Ho führen. Die Null
Zufallsvariablen. Es seien X und Y hypothese wird abgelehnt, wenn die
zwei Zufallsvariablen mit den ~ Er Testvariable auf Grund einer Stich
wartungswerten E(X) = !-Ix und E(Y) probe einen Wert im A. annimmt. I.
= Ilv sowie den ~ Varianzen Var(X) allg. wird der A. durch einen oder
= 0/ und Var(Y) = 0/. Die Kova zwei kritische Werte begrenzt, die
rianz von X und Y ist Cov(X,Y) = von der ~ Wahrscheinlichkeitsvertei
E[(X-E(X»(Y-E(Y»J. Die Zufalls lung der Testvariablen und vom ge
variablen X und Y heißen korreliert, wählten ~ Signifikanzniveau a ab
wenn der Korrelationskoeffizient hängen. Beispiel: Wird eine Hypothe
se über den unbekannten Erwartungs
Q xr = Cov (X,y) , - 1 S Q S + 1, wert 11 der Zufallsvariablen X auf
0x 0r einem Signifikanzniveau a geprüft
und ist X in der Grundgesamtheit
verschieden von Null ist. Der Zahlen normal verteilt (~ Normalverteilung),
wert von Q ist ein Maß für die linea so ist der A. bei einem zweiseitigen
re Abhängigkeit von X und Y. Ist Q Test durch die Menge aller Stichpro
= 0, so heißen X und Y unkorreliert. bendurchschnitte x mit der Eigen
Aus der Unabhängigkeit von X und schaft x $ CI oder x ;:: c2, bei einem
Y folgt ihre Unkorreliertheit. Diese linksseitigen Test durch die Menge
Beziehung ist nur mit Einschränkun aller Stichprobendurchschnitte x mit
gen umkehrbar. Sind X und Y dis der Eigenschaft x $ c und bei einem
krete Zufalls variablen mit den Wahr rechtsseitigen Test durch die Menge
scheinlichkeiten P;k = P(X=x;, Y=y,) aller Stichprobendurchschnitte x mit
und mit den ~ Randverteilungen p;= der Eigenschaft x ;:: c gegeben, wobei
P(X=x;) und Pk = P(Y=Yk)' so ist die die Konstante c als kritischer Wert
quadratische ~ Kontingenz geeignet festgelegt werden muß. Die
drei folgenden Graphiken skizzieren
L L (
<1>2 = Pik - Pi. P.k )2 diese A. für einen zweiseitigen Test
auf 11, für einen linksseitigen Test auf
i k Pi. P.k
11 und einen rechtsseitigen Test auf 11,
ein Maß für die Abhängigkeit zwi wobei die schraffierte Fläche unter
schen X und Y. Können X und Y der Dichtefunktion von X das vorge
nur n bzw. m Werte annehmen (mit gebene Signifikanzniveau a kenn
m $ n), so gilt $2 $ rn-I. X und Y zeichnet.
sind genau dann unabhängig, wenn $2
Ver leitunQ von X
= 0 ist.
Ablehnungsbereich
Kritischer Bereich, kritische Region.
Verwerfungsbereich, bei einem stati
stischen ~ Test Teil des Wertebe
reichs der Testvariablen oder entspre
chende Teilmenge der Menge mög-
2
Abstand
elastizität des Absatzes (also der
Verteilung von X Nachfrage aus der Sicht des Anbie
unte' HO
ters) berechnen. Betrachtet man einen
bestimmten Punkt (Mo. P(Mo)) der A.
P = g(M) und den entsprechenden
Punkt (Po. M(Po)) der Nachfragefunk
tion M = f(P). dann gilt für die ent
sprechenden Punktelastizitäten die
folgende Beziehung:
Verteilung ..on X
Demnach ist die Preiselastizität be
züglich der abgesetzten Menge die
reziproke Nachfrage-oder Absatzela
stizität bezüglich des Preises.
----~------~---*~~----x
Abschneidestichprobenverfah
Abnehmerrisiko ---7 Attributprüfung. ren
---7 Variablenprüfung Auswahl nach dem Konzenfrafions
prinzip. spezielles nichtzufälliges (so
Absatzelastizität ---7 Absatzfunktion genanntes bewußtes) Auswahlverfah
ren (---7 Stichprobenverfahren). das im
Absatzfunktion Fall einer Grundgesamtheit mit sehr
Formale Beschreibung der Abhängig schiefer ---7 Häufigkeitsverteilung an
keit der in einem bestimmten Zeit gewandt wird. Durch das Abschnei
raum abgesetzten Menge Meines den eines Teiles der Verteilung kon
Gutes oder Produktionsfaktors von zentriert man sich auf das Wesentli
seinem Preis P. Die A .• die auch als che der Grundgesamtheit. Beispiel:
Preis-Absatz-Funktion bezeichnet Nichtberücksichtigung aller Kleinbe
wird. wird i.allg. als ein Spezialfall triebe aus der Grundgesamtheit der
der ---7 Nachfragefunktion behandelt. Industriebetriebe eines Landes. wenn
weil hier der Absatz eines Gutes aus der Umsatz oder der Absatz von In
der Sicht des Nachfragers in Abhän teresse ist.
gigkeit vom Preis betrachtet wird.
Existiert eine Nachfragefunktion M = Absolute Häufigkeit ---7 Häufigkeit
f(P). dann existiert auch ihre Um
=
kehrfunktion P g(M). die als A. aus Absolutskala ---7 Skala
der Sicht des Anbieters aufgefaßt
werden kann. Mit Hilfe der aus die Abstand
ser A. ermittelten Elastizitätsfunktion Distanz. Maß dU,k) für die Unähn
e(M) (---7 Elastizität) kann man für lichkeit zwischen zwei Objekten j
eine (infinitesimal) kleine Verände und k mit Variablen X; (i = I . .... I)
rung in den abgesetzten Mengen M metrischen Skalenniveaus (---7 Skala).
auf dem Niveau M = Mo die Preis- Je unähnlicher die Objekte sind. de-
3
Abstand
sto größer ist der A. Zwei Objekte
sind als gleich anzusehen, wenn ihr b) x
2 J
A. null ist. Weit verbreitete Ab
L
standsmaße sind die sogenannten 5
Minkowski-Metriken oder L,-Nor
men:
k
[t
I x
dU,k) = XJI - Xkll' ]; , 5 1
1=1
wobei Xj; und Xto die Werte der Va Zur Beurteilung der Homogenität
riablen X; bei den Objekten j bzw. k einer Klasse K von Objekten ist es
und r die Minkowski-Konstante (r~l) üblich, aufbauend auf dem A. dG,k),
=
sind. Für r I ist dG,k) die Summe die folgenden drei Homogenitätsmaße
der absoluten A. der Variablenwerte (~ Clusteranalyse ) zu verwenden:
zwischen den Objekten j und kund a) minimaler Distanzindex
wird als LI-Norm oder City-Block
Metrik bezeichnet. Die sich für r = 2 kl(K) = min d(j,k) ,
J,keK
ergebende L,-Norm ist auch als eu
klidischer A. bekannt. Eine Verall b) maximaler Distanzindex
gemeinerung der L,-Norm ist der ~
Mahalanobissche Abstand. Vorausset k,(K) = max d(i,k) ,
J,keK
zung für die Anwendung der Min
kowski-Metriken sind gleiche Maß c) normierte Summe der Distanzen
einheiten der Variablen. Beispiel: Ge
geben seien zwei Objekte j und k mit k3(K) =1. L L d(i,k) ,
den Koordinaten (1;5) bzw. (5;1). C JeK keK
Dann beträgt der A. zwischen diesen
Objekten nach der L,-Norm wobei c eine Normierungskonstante
dG,k) = [11 - 51' + 15 - 11' jO,5 = 5,66, ist. Zur Einschätzung der Heterogeni
graphisch veranschaulicht im Teil a) tät zwischen zwei Klassen KI und K,
der nachfolgenden Abbildung, und werden als Verschiedenheitsmaße ge
nach der LI-Norm nutzt:
dG,k) = 11 - 51 + 15 - 11 = 8, a) single linkage (die Verschiedenheit
graphisch dargestellt im Teil b) der des ähnlichsten Objektpaares)
nachfolgenden Abbildung.
yl(KI'K2) = min d(i,k) ,
JeK"keK,
a) x
2 j
b) complete linkage (die Verschie
denheit des unähnlichsten Objektpaa
5~.
res)
y2(KI'K2) = max dU,k) ,
jEK1,CEK2
x
5 1 c) average linkage (die durchschnittli
che Verschiedenheit der Objekte)
4