ISTAT ISTITUTO NAZIONALE DI STATISTICA
ISTITUTO SUPERIORE DI SANITÀ
Istituto Superiore di Sanità

Nota Metodologica (2)

2.  Secondo passo: il confronto tra la popolazione aggiornata e quella censita alla data del 20.10.91.

     Particolare rilievo assume il momento del confronto tra la popolazione ottenuta alla fine della procedura di aggiornamento e quella censita al 20.10.91.
     Nell’effettuare la ricostruzione della popolazione provinciale nel corso dell’ultimo intervallo intercensuario si è dovuto affrontare, come è noto, il problema delle distorsioni nella struttura per generazione della popolazione rilevata al censimento del 1991. In quella occasione si è dato ampio spazio all’analisi della struttura per generazione della popolazione risultante dall’ultimo censimento confrontando i contingenti di ciascuna generazione sia con quelli ottenuti con la procedura di aggiornamento sia con quelli rilevati in occasione del censimento 1981. In entrambi i casi è apparso evidente l’anomalo comportamento di alcune generazioni, non plausibile dal punto di vista demografico. Si rimanda, pertanto, il lettore che fosse interessato ad approfondire questo aspetto alla nota metodologica della pubblicazione della ricostruzione provinciale più volte citata (Istat, 1996). In questa sede, si vuole brevemente ricordare che la sistematicità e la geografia delle alterazioni nella struttura per generazione della popolazione del censimento 1991 hanno suggerito l’ipotesi, successivamente confermata dalle analisi di qualità dei dati censuari (Istat,1997b), che durante la fase di correzione e imputazione automatica dei dati mancanti o incongruenti si siano verificati alcuni errori di tipo sistematico. Le conseguenze di questi errori sono state tanto più marcate quanto più la qualità e la completezza delle informazioni rilevate è stata meno soddisfacente. Si è pertanto deciso, in analogia con quanto già effettuato a livello provinciale, di adottare come struttura per generazione della popolazione del censimento del 1991, quella risultante dai dati "grezzi" dello stesso censimento. Questa è stata ottenuta calcolando, separatamente per ciascun sesso e per ciascun comune di residenza, il peso di ogni generazione sul totale della popolazione, dopo aver eliminato dal conteggio i record individuali con informazione mancante o inammissibile per almeno una delle seguenti caratteristiche: sesso, anno di nascita e comune di residenza. Il criterio utilizzato ai fini dell’ammissibilità di una informazione è quello dell’appartenenza ad un intervallo di valori ritenuto accettabile (i codici prefissati per il sesso, le province e i Comuni e gli anni di calendario compresi tra il 1880 e il 1991 per l’anno di nascita). La struttura della popolazione così ottenuta è stata applicata all’ammontare della popolazione residente comunale distinto per sesso corrispondente al dato definitivo del censimento 1991. Questa popolazione, cui ci riferiremo in seguito come "rettificata", è stata quindi utilizzata come vettore di arrivo del processo di ricostruzione.
     Si illustrano di seguito i principali risultati dei confronti effettuati tra la popolazione censita rettificata e quella aggiornata alla data del censimento 1991. Il confronto dà luogo ad una differenza in termini di ammontare complessivo della popolazione che, come si è detto, è abbastanza contenuta: la popolazione censita è infatti inferiore a quella aggiornata di circa 196.000 unità. Questa quantità è il risultato della somma algebrica di differenze tra i contingenti delle generazioni in cui prevale il segno negativo. La figura 1 consente di apprezzare l’andamento delle differenze nelle generazioni per il complesso dei due sessi e della popolazione residente in Italia.


Figura 1.  Differenze per generazione tra popolazione censita al 1991 rettificata e popolazione aggiornata alla stessa data ( (Popcen’91-Popagg’91)/Popcen’91*1000).
Italia, maschi e femmine.

     Le differenze sono in termini relativi "accettabili", generalmente dell’ordine dell’1%, tranne nelle età iniziali e finali della vita in cui comunque si registrano valori per lo più inferiori al 5%. Per una corretta interpretazione di queste differenze occorre tenere presente che avendo escluso in fase di aggiornamento i movimenti migratori con l’estero, i contingenti aggiornati per ciascuna generazione coincidono, a livello nazionale, con quelli "attesi" per effetto della sola eliminazione per morte. Pertanto il confronto censiti-attesi dà luogo ad un residuo che, almeno in teoria e in presenza di dati di base congruenti, dovrebbe essere spiegabile in termini di saldo migratorio con l’estero. Nella realtà, le differenze rappresentate nella figura 2, evidenziano livelli e caratteristiche per età che indicano l’esistenza di alcune carenze nella qualità dei dati di base utilizzati. Si noti, in particolare, l’incongruenza tra popolazione censita e popolazione aggiornata nelle età estreme della vita e l’evidenza di saldi residui generalmente negativi anche nelle generazioni maggiormente interessate dai flussi di immigrazione. L’ammontare censito dei contingenti delle nuove generazioni, quelle formatesi nel decennio intercensuario, è decisamente inferiore rispetto a quello atteso per effetto della dinamica naturale. All’opposto, per le generazioni con oltre 90 anni di età (alla data del 31.12.91) il segno delle differenze è positivo ad indicare, verosimilmente, una sottostima da parte della procedura di aggiornamento ascrivibile agli errori che possono intercorrere nella stima di contingenti di numerosità esigua. In questo caso, infatti, eventuali problemi di qualità e completezza dei dati utilizzati hanno, evidentemente, conseguenze più rilevanti.
     Sulle cause delle differenze tra popolazione censita e popolazione aggiornata si possono fare diverse ipotesi. Certamente le incongruenze evidenziate sono il risultato della non perfetta coerenza delle diverse fonti di dati utilizzate, delle imprecisioni e degli errori delle diverse misure siano esse di fonte anagrafica o censuaria. I dati di flusso di fonte anagrafica relativi al movimento della popolazione, ad esempio, sono notoriamente affetti da errori di varia natura e spesso tendono a sottostimare il movimento migratorio reale della popolazione, anche quando si assume come riferimento i soli trasferimenti interni. Per le generazioni maggiormente interessate dalla mobilità, pertanto, i contingenti censiti tendono a superare quelli risultanti dalla procedura di aggiornamento nelle aree di attrazione dei flussi migratori, mentre si verifica generalmente l’opposto nel resto del paese.
     Anche i dati di censimento, sia quelli di partenza sia quelli di arrivo del procedimento di ricostruzione, possono essere affetti da errori. Nonostante il grande impegno di risorse umane, organizzative, tecnologiche e finanziarie il censimento rimane pur sempre una rilevazione statistica e in quanto tale l’errore va considerato come parte integrante del relativo processo di produzione.

     La possibilità di spingere i confronti tra popolazione censita e popolazione aggiornata al 1991 fino ad un livello di dettaglio comunale consente di fare luce ulteriormente sulle incongruenze tra le diverse fonti di dati di popolazione: queste presentano infatti una spiccata variabilità territoriale.
     Si è tentato di sintetizzare gli elementi salienti del confronto tra le due serie di popolazione per generazione calcolando per ciascun comune alcuni indicatori sintetici tipicamente utilizzati per misurare la distanza tra due distribuzioni. Si tratta sia di un indicatore sintetico della distanza globale, sia di indicatori della distanza "locale", ottenuti considerando alcuni specifici segmenti delle due popolazioni, ovvero quelli relativi alle generazioni formatesi nell’intervallo 1981-1991 e quelli per le generazioni corrispondenti alle età estreme della vita (85 anni e oltre). L’indice di distanza globale Z è stato ottenuto sommando rispetto a tutte le generazioni le differenze, espresse in valore assoluto, tra la popolazione censita e quella aggiornata, relativizzate rispetto alla popolazione censita al 1991. Gli indici Z0 e Z85+ sono costruiti in modo equivalente, ma nel primo caso la sommatoria è estesa alle generazioni 1981-1991, mentre nel secondo caso si è confrontato il valore corrispondente alla classe finale aperta (85 anni e oltre). Per le prime dieci generazioni, inoltre, si è voluto analizzare anche il verso delle differenze, per questo è stato calcolato l’indicatore Z’0 che è del tutto analogo a Z0, ad eccezione del valore assoluto. Gli indicatori descritti sono stati calcolati per ciascun comune facendo riferimento al complesso dei due sessi. Si è quindi effettuata una ulteriore sintesi calcolando la media di ciascun indicatore all’interno di ogni combinazione ottenuta considerando la ripartizione geografica (Nord, Centro, Sud e Isole) e la classe di ampiezza demografica di appartenenza del comune. Infine, per agevolare l’interpretazione dei risultati e per garantire il confronto tra indicatori il cui valore cumulato è stato ottenuto sommando rispetto ad un numero diverso di classi di generazioni (86 nel caso di Z, 11 nel caso di Z0), è stata stimata la distanza media per generazione dividendo il valore cumulato di Z e Z0 rispettivamente per 86 ed 11. I risultati, espressi in valore percentuale, sono presentati nel Prospetto 1.

     I valori più elevati degli indicatori si ritrovano, come era da attendersi, nei Comuni di ampiezza inferiore ai 1000 abitanti, e ciò in ragione della esigua numerosità dei contingenti delle generazioni poste a confronto. Ma già considerando i Comuni con una ampiezza demografica compresa tra 1000 e 4.999 abitanti, si nota un sostanziale accostamento tra le due popolazioni.


Prospetto 1.  Distanza media per generazione tra i contingenti di popolazione del censimento 1991 e quelli ottenuti, alla stessa data, in base alla procedura di aggiornamento: alcuni indicatori sintetici* (valori percentuali)
Ripartizione Nord
Ampiezza demografica dei Comuni Z Z0 Z’0 Z85+ n. di Comuni
Meno di 1.000 abitanti

1.000 - 4.999

5.000 - 9.999

10.000 - 14.999

15.000 - 19.999

20.000 e oltre
15.2

7.6

1.2

3.3

3.2

2.3
17.9

9.3

1.5

4.1

3.9

3.2
-1.4

0.7

0.2

0.5

0.2

-0.3
17.6

11.4

2.4

5.9

8.1

4.1
1417

2111

595

184

78

166
Ripartizione Centro
Ampiezza demografica dei Comuni Z Z0 Z'0 Z85+ n. di Comuni
Meno di 1.000 abitanti

1.000 - 4.999

5.000 - 9.999

10.000 - 14.999

15.000 - 19.999

20.000 e oltre
18.6

8.5

5.0

3.8

3.6

2.9
21.3

10.2

6.2

5.2

5.0

4.6
-0.1

1.3

1.5

0.4

0.1

-1.1
20.0

11.0

7.0

5.6

4.8

4.7
170

488

159

57

36

90
Ripartizione Sud e Isole
Ampiezza demografica dei Comuni Z Z0 Z'0 Z85+ n. di Comuni
Meno di 1.000 abitanti

1.000 - 4.999

5.000 - 9.999

10.000 - 14.999

15.000 - 19.999

20.000 e oltre
20.4

11.4

7.3

6.1

6.1

5.1
24.5

13.5

9.1

8.0

8.1

7.0
-5.1

-2.9

-2.9

-3.2

-4.2

-4.1
19.3

13.3

12.9

11.5

11.0

10.3
384

1338

402

162

65

200

*Si ha: Z=S | Popcen’91-Popagg’91| /Popcen’91 con la sommatoria estesa a tutte le generazioni; per Z0 la sommatoria è estesa alle generazioni 1981-1991, e per Z85+ il confronto è tra i valori della classe finale aperta 85 e +; infine Z’0=S (Popcen’91-Popagg’91) /Popcen’91 dove la sommatoria è estesa alle generazioni 1981-1991.


     Per i Comuni appartenenti a questa fascia di ampiezza demografica, infatti, la distanza media per generazione, stimata considerando il complesso delle età, va dal minimo del 7,6% del Nord all’11,4% del Sud, ed equivale ad uno scarto medio di popolazione in valore assoluto dell’ordine di 4-5 unità, data l’ampiezza demografica dei Comuni considerati.
     Il gradiente Nord-Sud si ritrova, a parità di dimensione demografica dei Comuni, per tutti gli indicatori di distanza sebbene sia meno evidente quando si considera la classe finale aperta (85 e più). Per i Comuni di ampiezza superiore a 15.000 abitanti della ripartizione Sud ed Isole le distanze tra le due serie di popolazioni sono circa il doppio di quelle riscontrate al Nord.
     L’accostamento migliore tra le due fonti di popolazione si osserva per i Comuni della ripartizione Nord di ampiezza demografica compresa tra 5.000 e 9.999 abitanti.

     Le incongruenze tra le due fonti si fanno, al contrario, più evidenti quando si considerano le età iniziali e finali della vita. Per quanto riguarda le generazioni più anziane si ritiene che, sebbene sia difficile individuare con certezza le cause delle differenze osservate, queste siano in gran parte ascrivibili alla procedura di aggiornamento utilizzata nel presente lavoro. Quando occorre stimare contingenti via via sempre più esigui, come avviene nel caso delle generazioni anziane, aumenta il rischio di errore dovuto a problemi di qualità e completezza dei dati di base.
     Diverso è il caso delle generazioni più giovani (1981-1991). Si è già avuto modo di constatare come a livello nazionale sia proprio in queste età che emergono i casi di più vistosa incongruenza tra la fonte anagrafica e la fonte censuaria. Il verso delle differenze suggerisce una possibile sotto-enumerazione, da parte di quest’ultima fonte, delle generazioni formatesi nel corso del decennio 1981-1991. Ebbene, l’analisi condotta a livello comunale rivela che esiste una realtà eterogenea. Escludendo il caso dei Comuni con meno di 1000 abitanti, sempre in ragione della numerosità esigua delle generazioni poste a confronto, le differenze di segno negativo prevalgono nei Comuni con oltre 20.000 abitanti, qualunque sia la ripartizione geografica di appartenenza, e nella ripartizione Sud ed Isole, qualunque sia la dimensione demografica dei Comuni. Per comprendere le ragioni alla base di queste incongruenze tra fonti sono necessari ulteriori approfondimenti. Occorre precisare che il fenomeno non è nuovo, si è prodotto seppure con diversa intensità anche in occasione dei precedenti decenni intercensuari 52-61, 62-71 e 72-81 (Gualtieri, 1998) e ciò sembrerebbe indicare una difficoltà dello strumento censuario nella rilevazione delle generazioni più giovani. Anche i dati sui nati vivi della popolazione residente, tuttavia, possono essere affetti da problemi di qualità e completezza. Nel corso dei controlli effettuati presso alcune anagrafi comunali si è potuto accertare come, in alcuni casi, ci sia una sovra-enumerazione nella rilevazione dei nati vivi dovuta ad una non corretta interpretazione del regolamento anagrafico; l'errore più frequente è, ad esempio, quello di conteggiare tra i nati vivi residenti in un comune anche quelli iscritti nel registro AIRE (Anagrafe degli Italiani Residenti all'Estero) o quelli relativi alla popolazione presente (Istat, 1999).

     Si conclude questa analisi delle differenze tra le due serie di popolazione con alcuni esempi che hanno lo scopo sia di rendere più esplicito il significato dell’indicatore Z presentato nel Prospetto 1, sia di valutare l’entità delle distorsioni che si possono attendere, in corrispondenza di un dato livello di Z, quando si assume come riferimento per il calcolo di indicatori riferiti alla popolazione residente o la popolazione censita al 1991 o, in alternativa, la popolazione risultante dalla procedura di aggiornamento. I Comuni scelti presentano dei livelli di Z prossimi a quello medio della classe di ampiezza demografica di appartenenza.
     La rappresentazione grafica della popolazione per età censita al ‘91 e di quella aggiornata alla stessa data consente di apprezzare l’entità e il verso delle differenze tra le due serie. L’indicatore utilizzato tende, come si è detto, ad amplificare la distanza tra le due distribuzioni per età delle popolazioni poste a confronto, essendo ottenuto come somma dei valori assoluti delle differenze relative fra i contingenti di ciascuna generazione. Come appare dalle figure (2-7), tuttavia, il verso delle differenze è spesso alternativamente positivo e negativo e quindi nel complesso si realizza generalmente una sostanziale compensazione.
     I valori più elevati di Z si riscontrano, come si è già avuto modo di rilevare, nei Comuni con ampiezza demografica inferiore ai 1000 abitanti. La figura 2 si riferisce al comune di Osiglia, in provincia di Savona, che alla data del censimento 1991 ha una popolazione di circa 500 abitanti. Il valore di Z calcolato per questo comune è di circa 16 unità ogni 100 unità di popolazione censita, livello a cui corrisponde, per questa classe di ampiezza demografica un buon accostamento tra le due distribuzioni. A titolo di esempio si consideri che la distanza maggiore si ha in corrispondenza della classe finale aperta (85 anni e oltre) per cui la popolazione aggiornata è pari a 43 unità mentre la censita ammonta a 37 unità.
     All’aumentare dell’ampiezza demografica dei Comuni le distanze tra le due distribuzioni, pur essendo più consistenti in termini assoluti, vedono diminuire il loro peso in termini relativi per cui il valore di Z si riduce notevolmente. In ogni caso, gli esempi mostrati evidenziano che in corrispondenza del valore medio di Z ci si può attendere un buon accostamento tra le due popolazioni poste a confronto.

     L’impatto potenziale delle differenze tra la popolazione censita e la popolazione aggiornata è stato esemplificato calcolando i decessi attesi che si otterrebbero, a parità di intensità della mortalità, assumendo come riferimento l’una o l’altra popolazione. I risultati sono riportati nei prospetti 2-7.
     Qualunque sia la dimensione demografica del comune considerato le due serie dei decessi attesi mostrano una buona corrispondenza, quando non una sostanziale coincidenza. Questo risultato è importante perché indica che gli effetti dovuti alla diversa popolazione di riferimento sono comunque trascurabili quando le differenze tra le due popolazioni sono inferiori o uguali a quelle mediamente riscontrate in corrispondenza di ciascuna classe di ampiezza demografica.
     L’indice Z può, quindi, essere considerato come una misura sintetica dell’accuratezza delle stime di popolazione. Sulla base del valore dell’indice Z sono state determinate, per ciascuna classe di ampiezza demografica, delle "soglie di attenzione" al di sopra delle quali l'accostamento tra popolazione censita e popolazione aggiornata alla stessa data è da ritenersi meno soddisfacente. In questo modo si è stimato che i Comuni che presentano un buon accostamento sono pari all'88%. Si ritiene che questo sia un risultato notevole: un buon accostamento tra le due serie di popolazioni si realizza, infatti, solamente se non si sono verificati casi di evidenti incongruenze tra le diverse fonti di dati utilizzate, nell'arco di tutto il decennio intercensuario.

Sezione successiva (terzo passo)

Torna alla pagina precedente