Table Of ContentAlla memoria del nostro caro Maestro, Gianni Tranquilli
Pier Luigi Conti Daniela Marella
•
Campionamento da
popolazioni finite
Il disegno campionario
PierLuigiConti
DipartimentodiScienzeStatistiche
SapienzaUniversita`diRoma
DanielaMarella
DipartimentodiScienzedell’Educazione
Universita`RomaTre
Contenutiintegrativisonoconsultabilisuhttp://extras.springer.com
Password:978-88-470-2576-9
UNITEXT–CollanadiStatisticaeProbabilita`Applicata
ISSN2038-5714 e-ISSN2038-5765
Additional material to this book can be downloaded from http://extras.springer.com
ISBN978-88-470-2576-9 ISBN978-88-470-2577-6 (eBook)
DOI10.1007/978-88-470-2577-6
SpringerMilanHeidelbergNewYorkDordrechtLondon
©Springer-VerlagItalia2012
Quest’operae`protettadallalegge suldirittod’autoreelasuariproduzione ancheparzia-
lee`ammessaesclusivamente neilimitidellastessa.Tuttiidiritti,inparticolareidirittidi
traduzione,ristampa,riutilizzodiillustrazioni,recitazione,trasmissioneradiotelevisiva,ri-
produzione sumicrofilm oaltri supporti,inclusione in databaseosoftware,adattamento
elettronico,o conaltri mezzi oggi conosciutio sviluppati in futuro,rimangonoriservati.
Sonoesclusibrevistralciutilizzatiafinididatticiematerialefornitoadusoesclusivodel-
l’acquirente dell’opera per utilizzazione sucomputer.I permessi di riproduzione devono
essereautorizzatidaSpringerepossonoessererichiestiattraversoRightsLink(Copyright
ClearanceCenter).Laviolazionedellenormecomportalesanzioniprevistedallalegge.
Lefotocopieperusopersonalepossonoessereeffettuateneilimitidel15%diciascunvolu-
medietropagamentoallaSIAEdelcompensoprevistodallalegge,mentrequelleperfinalita`
dicarattereprofessionale,economicoocommercialepossonoessereeffettuateaseguitodi
specificaautorizzazionerilasciatadaCLEARedi,CentroLicenzeeAutorizzazioniperleRi-
produzioniEditoriali,[email protected].
L’utilizzoinquestapubblicazionedidenominazionigeneriche,nomicommerciali,marchi
registrati,ecc.,anchesenonspecificatamente identificati,nonimplicache talidenomina-
zioniomarchinonsianoprotettidallerelativeleggieregolamenti.
Leinformazionicontenutenellibrosonodaritenersiveritiere edesattealmomentodella
pubblicazione;tuttavia,gliautori,icuratoriel’editoredeclinanoogniresponsabilita`lega-
leperqualsiasiinvolontarioerrore odomissione.L’editorenonpuo` quindifornirealcuna
garanziacircaicontenutidell’opera.
9 8 7 6 5 4 3 2 1
Layoutcopertina:BeatriceB,Milano
Impaginazione:PTP-Berlin,ProtagoTEX-ProductionGmbH,Germany(www.ptp-berlin.eu)
Stampa:GrafichePorpora,Segrate(MI)
Springer-VerlagItaliaS.r.l.,ViaDecembrio28,I-20137Milano
Springer-VerlagfapartediSpringerScience+BusinessMedia(www.springer.com)
Prefazione
Viviamo nella societa` dell’informazione. Non passa giorno senza che questa
frase ci sia ricordata da giornali, televisioni, Internet. Non passa giorno sen-
za che veniamo bombardati di cifre riguardanti gli elementi piu` disparati del
nostro sistema sociale:andamento dei prezzi, livellodidisoccupazione, gradi-
mento nei confronti di questo o quel partito politico. Non passa giorno senza
che ci siano forniti i risultati di “sondaggi” riguardanti i piu` vari aspetti del
nostro vivere sociale.
Questa formidabile mole di numeri che ci vengono forniti in dosi sempre
piu` massicce, per`o, genera spesso scetticismo. Come stabilire quando l’infor-
mazionefornitapuo`definirsi“corretta”?Comeevitaredifornirenumerimolto
lontani dalla realta` che si pretende di rappresentare, e su cui si pretende di
informare i cittadini?
Questo libro si occupa della corretta acquisizione e dell’uso efficiente di
un tipo moltoimportante di informazione:l’informazione statistica.Con una
certa semplificazione, e con qualche imprecisione, l’acquisizione dell’informa-
zione statisticaha luogotramitel’osservazione diunao piu` caratteristiche di
interesse (status occupazionale,partitopoliticoper cuisiintendevotare,etc.)
sulle unita` di una popolazione di riferimento.
Un elemento critico del processo di acquisizione dei dati `e costituito dal
fatto che molto spesso le popolazioni di riferimento sono composte da un
numero molto elevato di unita`, la cui osservazione completa richiederebbe
costi e tempi proibitivi. Per tale ragione si ricorre a processi di acquisizione
dei dati basati sull’osservazione di una parte delle unita` della popolazione, la
quale costituisce un campione.
L’idea-guida del presente libro `e sostanzialmente una: sia il processo di
selezione delcampionechel’usodeidaticorrispondenti devonoessere voltiad
ottenere la massima efficienza. E` questo obiettivo a spingere la trattazione
versoregole di selezione del campionedi tipo“scientifico”, fondatesul calcolo
delle probabilita`. Solo in questo caso, infatti, `e possibile studiare in modo
corretto cosa si intenda per “uso efficiente dei dati statistici”.
vi Prefazione
Questo volume`e dedicato in larga misura agliaspetti di base del campio-
namentodapopolazionifinite.Vengonostabilitelebasilogichedelcampiona-
mento e ne vengono studiati i principali sviluppi elementari. L’unica fonte di
errore statistico`e dovutaalfattoche nonsi osservano tutte leunit`adellapo-
polazione, ma solo una parte. Ad esso seguir`a un successivo volume dedicato
atematiche piu` avanzate,generate (prevalentemente manon esclusivamente)
sia dal fatto che a volte puo` essere impossibile osservare alcune delle unit`a
del campione e/o `e possibile effettuare solo osservazioni affette da errori, sia
dalfatto che spesso l’interesse verte sulla costruzione di modelli statistici per
i dati concretamente osservati.
L’approccioespositivo seguitoconsiste nel procedere dalparticolarealge-
nerale,partendo daaspetti ilpiu` possibileelementari, che vengono poi“com-
plicati” per renderli via via piu` aderenti alle concrete situazioni applicati-
ve. Molti ragionamenti vengono prima basati su esempi concreti e poi su
aspetti teorici che, se forniti in prima battuta, potrebbero rendere un po’
ostica la comprensione di aspetti chiave. A questo proposito si sottolinea
l’importanza degli esempi basati su dati (tutti disponibili sulla pagina web
http://extras.springer.com), i quali non sono solo un utile complemento alla
teoria, ma una vera e propria chiave di accesso al “ragionamento statistico”.
Lo stesso ruolo`e anche svolto da molti degli esercizi proposti.
Il libro si rivolge sia a studenti universitari di corsi di laurea con una
robusta componente quantitativa (Scienze Statistiche, Economia, etc.), sia a
ricercatori incampoeconomicoosocialeche utilizzanoilmetodo statistico.Il
livellocomplessivo della trattazione `e, per quanto possibile, elementare. L’u-
nico pre-requisito richiesto per accedere a gran parte degli argomentitrattati
`e un corso elementare di statistica con elementi introduttivi di calcolo delle
probabilita` e inferenza statistica, come quelli impartiti nelle lauree triennali
di Economia e Scienze Politiche. Non strettamente necessario, anche se uti-
le, `e un corso elementare di matematica, modellato sui corsi di matematica
generale dei corsi di laurea in Economia.
Questo volume`e prevalentemente destinato allelauree triennali.Nellano-
stra esperienza, i Capitoli1–7, la Sezione 8.6,i Capitoli9–11 costituiscono il
materialeperuncorsodi32–36oreinunalaureatriennaleditagliostatistico.
L’aggiunta del Capitolo 12, di ampie parti del Capitolo 14 (lo stimatore di
Horvitz-Thompson,insostanza)edialcunesezionidelCapitolo15(disegnidi
Poisson,diPoissoncondizionatoediPareto)copre uncorso standard dicam-
pionamentodi 48ore, sempre per una laurea triennale di tagliostatistico. Lo
stessomateriale`estatoancheusato,avarilivelli,incorsidilaureaediMaster
in Facolta` di Economia. Alcune parti dei Capitoli 14 (stimatori di tipo cali-
brazione), 15 (disegno bilanciato) e gran parte del materiale sugli errori non
campionariesui modellistatistici per daticampionari(oggettoditrattazione
in un successivo volume) sono invece destinati alle lauree specialistiche.
Le parti (sezioni o interi capitoli) con asterisco sono piu` avanzate, e non
vengono utilizzate, in generale, nell’ambito delle lauree triennali. Alcune di
Prefazione vii
esse sono usate in lauree specialistiche, mentre altre sono state incluse in
quanto di diretto interesse applicativo.
Molti degli esempi proposti nel volume si basano su dataset disponibili
presso la pagina web http://extras.springer.com.
Nello scrivere il presente libro abbiamo contratto parecchi debiti di gra-
titudine. Il Dott. Mauro Scanu ha letto l’intero volume, indicando parecchi
erroriefornendoutilisuggerimenti.IProff.LudovicoPiccinato,MarcoRiani,
Paola Vicard hanno letto ampie parti del volume, fornendo spunti e consi-
derazioni di grande interesse. Utili suggerimenti sono stati anche forniti dal
Prof. Francesco Battaglia. Naturalmente, di errori e omissioni residui sono
responsabili i soli autori.
Roma,febbraio 2012 Pier Luigi Conti
Daniela Marella
Indice
1 Aspetti generali sul campionamento da popolazioni finite .. 1
1.1 Rilevazionicensuarie e rilevazionicampionarie .............. 1
1.2 Linee metodologiche di una rilevazione statistica............. 3
1.3 Popolazioni,etichette, modalit`aetichettate ................. 6
1.4 Popolazionisuddivise in sottopopolazioni................... 8
1.5 Liste di unita` di campionamento .......................... 10
1.6 Rilevazionistatistiche e indagini statistiche ................. 14
1.7 Fonti di errore e distorsioni ............................... 15
1.8 Come non progettare una rilevazione campionaria ........... 17
1.9 Campionamentonon probabilistico ........................ 18
2 Campionamento probabilistico............................. 21
2.1 Disegni campionari:definizione e proprieta` di base........... 21
2.2 Implementazione di disegni campionari mediante schemi:
brevi cenni ............................................. 25
2.3 Dati campionari etichettati ............................... 27
2.4 Inferenza da popolazioni finite e inferenza da modello: due
approcci a confronto ..................................... 28
2.5 Stimatori e loro proprieta`................................. 29
2.6 Intervallidi confidenza ................................... 37
Esercizi..................................................... 39
3 Disegno campionario semplice ............................. 41
3.1 Il disegno semplice senza ripetizione ....................... 41
3.1.1 Definizione del disegno semplice senza ripetizione...... 41
3.1.2 Simmetriatotale del disegno semplice senza ripetizione 42
3.1.3 Implementazione del disegno semplice senza ripetizione 43
3.2 Stima della media della popolazione: la media campionaria ... 43
3.3 Stima della varianza ..................................... 48
3.4 Approssimazione normale nel disegno ssr e intervalli di
confidenza per la media della popolazione .................. 51
3.5 Un importante caso speciale: la stima di proporzioni ......... 56