Marino, Massimiliano
(2008)
Analisi spaziale della longevità in Emilia-Romagna, [Dissertation thesis], Alma Mater Studiorum Università di Bologna.
Dottorato di ricerca in
Metodologia statistica per la ricerca scientifica, 19 Ciclo. DOI 10.6092/unibo/amsdottorato/666.
Documenti full-text disponibili:
Abstract
Negli ultimi anni la longevità è divenuto un argomento di notevole interesse in
diversi settori scientifici. Le ricerche volte ad indagare i meccanismi che regolano i
fattori della longevità si sono moltiplicate nell’ultimo periodo interessando, in maniera
diversa, alcune regioni del territorio italiano. Lo studio presentato nella tesi ha
l’obiettivo di identificare eventuali aggregazioni territoriali caratterizzate da una
significativa propensione alla longevità nella regione Emilia-Romagna mediante
l’impiego di metodologie di clustering spaziale, alcune delle quali di recente
implementazione.
La popolazione in esame è costituita dagli individui residenti in Emilia-
Romagna nel quinquennio 2000-2004 suddivisa in classi di età, sesso e comune.
L’analisi è di tipo puramente spaziale, in cui l’unità geografica elementare è
identificata dal comune, ed è stata condotta separatamente per i due sessi.
L’identificazione delle aree regionali ad elevata longevità è avvenuta utilizzando
quattro metodologie di clustering spaziale, basate sulla teoria della massima
verosimiglianza, che si differenziano tra loro per la modalità di ricerca dei potenziali
clusters. La differenza consiste nella capacità di identificare aggregazioni territoriali di
forma regolare (spatial scan statistic, Kulldorff e Nagarwalla,1995; Kulldorff,1997,
1999) o dall’andamento geometrico “libero” (flexible scan statistic, Tango e
Takahashi,2005; algoritmo genetico, Duczmal et al.,2007; greedy growth search,
Yiannakoulias et al.,2007). Le caratteristiche di ciascuna metodologia consentono, in
tal modo, di “catturare” le possibili conformazioni geografiche delle aggregazioni
presenti sul territorio e la teoria statistica di base, comune ad esse, consente di
effettuare agevolmente un confronto tra i risultati ottenuti. La persistenza di un’area
caratterizzata da un’elevata propensione alla longevità consente, infatti, di ritenere il
cluster identificato di notevole interesse per approfondimenti successivi. Il criterio
utilizzato per la valutazione della persistenza di un cluster è stato derivato dalla teoria
dei grafi, con particolare riferimento ai multigrafi. L’idea è confrontare, a parità di
parametri di ricerca, i grafi associati alle aggregazioni spaziali identificate con le
diverse metodologie attraverso una valutazione delle occorrenze dei collegamenti
esistenti tra le coppie di vertici.
Alcune valutazioni di carattere demografico ed un esame della letteratura
esistente sugli studi di longevità, hanno indotto alla definizione di una classe (aperta)
di età per rappresentare il fenomeno nella nostra ricerca: sono stati considerati gli
individui con età superiore o uguale a 95 anni (indicata con 95+). La misura di sintesi
utilizzata per descrivere il fenomeno è un indicatore specifico di longevità, mutuato
dalla demografia, indicato con Centenarian Rate (CR) (Robine e Caselli, 2005). Esso
è definito dal rapporto tra la popolazione 95+ e la popolazione residente, nello stesso
comune, al censimento del 1961. L’idea alla base del CR è confrontare gli individui
longevi di un istante temporale con quelli presenti, nella stessa area, circa 40 anni
prima dell’osservazione, ipotizzando che l’effetto migratorio di una popolazione
possa ritenersi trascurabile oltre i 60 anni di età.
La propensione alla longevità coinvolge in maniera diversa le aree del
territorio dell’Emilia-Romagna. Le province della regione caratterizzate da una
maggiore longevità sono Bologna, Ravenna e parte di Forlì-Cesena mentre la
provincia di Ferrara si distingue per un livello ridotto del fenomeno. La distinzione per
sesso non appare netta: gli uomini con età 95+, numericamente inferiori alle donne,
risiedono principalmente nei comuni delle province di Bologna e Ravenna, con
qualche estensione nel territorio forlivese, analogamente a quanto accade per la
popolazione femminile che mostra, tuttavia, una maggiore prevalenza nei territori di
Bologna e Forlì-Cesena, includendo alcune aree del riminese. Le province
occidentali della regione, invece, non risultano interessate significativamente da
questo fenomeno.
Le metodologie di cluster detection utilizzate nello studio hanno prodotto
risultati pressoché simili seppur con criteri di ricerca differenti. La spatial scan
statistic si conferma una metodologia efficace e veloce ma il vincolo geometrico
regolare imposto al cluster condiziona il suo utilizzo, rivelando una scarsa adattabilità
nell’identificazione di aggregazioni irregolari. La metodologia FSC ha evidenziato
buone capacità di ricerca e velocità di esecuzione, completata da una descrizione
chiara e dettagliata dei risultati e dalla possibilità di poter visualizzare graficamente i
clusters finali, anche se con un livello minimo di dettaglio. Il limite principale della
metodologia è la dimensione ridotta del cluster finale: l’eccessivo impegno
computazionale richiesto dalla procedura induce a fissare il limite massimo al di sotto
delle 30 aree, rendendola così utilizzabile solo nelle indagini in cui si ipotizza
un’estensione limitata del fenomeno sul territorio. L’algoritmo genetico GA si rivela
efficace nell’identificazione di clusters di qualsiasi forma ed estensione, seppur con
una velocità di esecuzione inferiore rispetto alle procedure finora descritte. Senza
un’adeguata selezione dei parametri di ricerca,la procedura può individuare clusters
molto irregolari ed estesi, consigliando l’uso di penalizzazione non nulla in fase di
ricerca. La scelta dei parametri di ricerca non è comunque agevole ed immediata e,
spesso, è lasciata all’esperienza del ricercatore. Questo modo di procedere, in
aggiunta alla mancanza di informazioni a priori sul fenomeno, aumenta il grado di
soggettività introdotto nella selezione dei parametri influenzando i risultati finali.
Infine, la metodologia GGS richiede un carico computazionale nettamente superiore
rispetto a quello necessario per le altre metodologie utilizzate e l’introduzione di due
parametri di controllo favorisce una maggiore arbitrarietà nella selezione dei valori di
ricerca adeguati; inoltre, la recente implementazione della procedura e la mancanza
di studi su dati reali inducono ad effettuare un numero maggiore di prove durante la
fase di ricerca dei clusters.
Abstract
Negli ultimi anni la longevità è divenuto un argomento di notevole interesse in
diversi settori scientifici. Le ricerche volte ad indagare i meccanismi che regolano i
fattori della longevità si sono moltiplicate nell’ultimo periodo interessando, in maniera
diversa, alcune regioni del territorio italiano. Lo studio presentato nella tesi ha
l’obiettivo di identificare eventuali aggregazioni territoriali caratterizzate da una
significativa propensione alla longevità nella regione Emilia-Romagna mediante
l’impiego di metodologie di clustering spaziale, alcune delle quali di recente
implementazione.
La popolazione in esame è costituita dagli individui residenti in Emilia-
Romagna nel quinquennio 2000-2004 suddivisa in classi di età, sesso e comune.
L’analisi è di tipo puramente spaziale, in cui l’unità geografica elementare è
identificata dal comune, ed è stata condotta separatamente per i due sessi.
L’identificazione delle aree regionali ad elevata longevità è avvenuta utilizzando
quattro metodologie di clustering spaziale, basate sulla teoria della massima
verosimiglianza, che si differenziano tra loro per la modalità di ricerca dei potenziali
clusters. La differenza consiste nella capacità di identificare aggregazioni territoriali di
forma regolare (spatial scan statistic, Kulldorff e Nagarwalla,1995; Kulldorff,1997,
1999) o dall’andamento geometrico “libero” (flexible scan statistic, Tango e
Takahashi,2005; algoritmo genetico, Duczmal et al.,2007; greedy growth search,
Yiannakoulias et al.,2007). Le caratteristiche di ciascuna metodologia consentono, in
tal modo, di “catturare” le possibili conformazioni geografiche delle aggregazioni
presenti sul territorio e la teoria statistica di base, comune ad esse, consente di
effettuare agevolmente un confronto tra i risultati ottenuti. La persistenza di un’area
caratterizzata da un’elevata propensione alla longevità consente, infatti, di ritenere il
cluster identificato di notevole interesse per approfondimenti successivi. Il criterio
utilizzato per la valutazione della persistenza di un cluster è stato derivato dalla teoria
dei grafi, con particolare riferimento ai multigrafi. L’idea è confrontare, a parità di
parametri di ricerca, i grafi associati alle aggregazioni spaziali identificate con le
diverse metodologie attraverso una valutazione delle occorrenze dei collegamenti
esistenti tra le coppie di vertici.
Alcune valutazioni di carattere demografico ed un esame della letteratura
esistente sugli studi di longevità, hanno indotto alla definizione di una classe (aperta)
di età per rappresentare il fenomeno nella nostra ricerca: sono stati considerati gli
individui con età superiore o uguale a 95 anni (indicata con 95+). La misura di sintesi
utilizzata per descrivere il fenomeno è un indicatore specifico di longevità, mutuato
dalla demografia, indicato con Centenarian Rate (CR) (Robine e Caselli, 2005). Esso
è definito dal rapporto tra la popolazione 95+ e la popolazione residente, nello stesso
comune, al censimento del 1961. L’idea alla base del CR è confrontare gli individui
longevi di un istante temporale con quelli presenti, nella stessa area, circa 40 anni
prima dell’osservazione, ipotizzando che l’effetto migratorio di una popolazione
possa ritenersi trascurabile oltre i 60 anni di età.
La propensione alla longevità coinvolge in maniera diversa le aree del
territorio dell’Emilia-Romagna. Le province della regione caratterizzate da una
maggiore longevità sono Bologna, Ravenna e parte di Forlì-Cesena mentre la
provincia di Ferrara si distingue per un livello ridotto del fenomeno. La distinzione per
sesso non appare netta: gli uomini con età 95+, numericamente inferiori alle donne,
risiedono principalmente nei comuni delle province di Bologna e Ravenna, con
qualche estensione nel territorio forlivese, analogamente a quanto accade per la
popolazione femminile che mostra, tuttavia, una maggiore prevalenza nei territori di
Bologna e Forlì-Cesena, includendo alcune aree del riminese. Le province
occidentali della regione, invece, non risultano interessate significativamente da
questo fenomeno.
Le metodologie di cluster detection utilizzate nello studio hanno prodotto
risultati pressoché simili seppur con criteri di ricerca differenti. La spatial scan
statistic si conferma una metodologia efficace e veloce ma il vincolo geometrico
regolare imposto al cluster condiziona il suo utilizzo, rivelando una scarsa adattabilità
nell’identificazione di aggregazioni irregolari. La metodologia FSC ha evidenziato
buone capacità di ricerca e velocità di esecuzione, completata da una descrizione
chiara e dettagliata dei risultati e dalla possibilità di poter visualizzare graficamente i
clusters finali, anche se con un livello minimo di dettaglio. Il limite principale della
metodologia è la dimensione ridotta del cluster finale: l’eccessivo impegno
computazionale richiesto dalla procedura induce a fissare il limite massimo al di sotto
delle 30 aree, rendendola così utilizzabile solo nelle indagini in cui si ipotizza
un’estensione limitata del fenomeno sul territorio. L’algoritmo genetico GA si rivela
efficace nell’identificazione di clusters di qualsiasi forma ed estensione, seppur con
una velocità di esecuzione inferiore rispetto alle procedure finora descritte. Senza
un’adeguata selezione dei parametri di ricerca,la procedura può individuare clusters
molto irregolari ed estesi, consigliando l’uso di penalizzazione non nulla in fase di
ricerca. La scelta dei parametri di ricerca non è comunque agevole ed immediata e,
spesso, è lasciata all’esperienza del ricercatore. Questo modo di procedere, in
aggiunta alla mancanza di informazioni a priori sul fenomeno, aumenta il grado di
soggettività introdotto nella selezione dei parametri influenzando i risultati finali.
Infine, la metodologia GGS richiede un carico computazionale nettamente superiore
rispetto a quello necessario per le altre metodologie utilizzate e l’introduzione di due
parametri di controllo favorisce una maggiore arbitrarietà nella selezione dei valori di
ricerca adeguati; inoltre, la recente implementazione della procedura e la mancanza
di studi su dati reali inducono ad effettuare un numero maggiore di prove durante la
fase di ricerca dei clusters.
Tipologia del documento
Tesi di dottorato
Autore
Marino, Massimiliano
Supervisore
Co-supervisore
Dottorato di ricerca
Ciclo
19
Coordinatore
Settore disciplinare
Settore concorsuale
Parole chiave
clustering spaziale scan statistic longevità centenarian rate
URN:NBN
DOI
10.6092/unibo/amsdottorato/666
Data di discussione
2 Aprile 2008
URI
Altri metadati
Tipologia del documento
Tesi di dottorato
Autore
Marino, Massimiliano
Supervisore
Co-supervisore
Dottorato di ricerca
Ciclo
19
Coordinatore
Settore disciplinare
Settore concorsuale
Parole chiave
clustering spaziale scan statistic longevità centenarian rate
URN:NBN
DOI
10.6092/unibo/amsdottorato/666
Data di discussione
2 Aprile 2008
URI
Statistica sui download
Gestione del documento: