M. D’Alo’, L. Di Biagio, S. Falorsi, A. Fasulo, F. Solari - Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali

SESSIONE I CAMPIONAMENTO E STIMA

Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali

Relatore: Fabrizio Solari

Michele D’Alo’, Lorenzo Di Biagio, Stefano Falorsi, Andrea Fasulo e Fabrizio Solari

GIORNATE DELLA RICERCA IN ISTAT | 10-11 NOVEMBRE 2014

Indice

1. Introduzione

2. La strategia di benchmark

3. Studio empirico – Dati simulati

4. Studio empirico – Indagine FL

5. Conclusioni e sviluppi futuri

Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari, Roma, 10-11/11/2014

Spesso le indagini hanno come obiettivo la stima di parametri disaggregati per dominio in corrispondenza dei quali le stime dirette non garantiscono sufficienti livelli di precisione

In tali casi si può ricorrere ai metodi di stima per piccole aree (SAE).

La maggior parte delle indagini sulle famiglie/imprese sono indagini ripetute nel tempo.

E’ importante considerare metodi SAE che prendono forza non soltanto dalle aree, ma che utilizzano anche le informazioni provenienti dalle indagini precedenti.

Introduzione

1Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali

F. Solari, Roma, 10-11/11/2014

Un problema si riscontra nel momento in cui le stime per piccole aree vengono aggregate a livello di domini più ampi. In questo caso la corrispondente stima differisce dalla stima diretta (affidabile) disponibile per tale dominio.

Due possibili approcci per ottenere stime per piccole aree che soddisfano i vincoli di benchmark:

– ex-ante: introducendo i vincoli direttamente nel modelloUgarte, Goicoa & Militino (2009), Montanari, Ranalli & Vicarelli (2010), Nandram & Sayit (2011)

– ex-post: aggiustando le stime successivamenteWang, Fuller & Qu (2008), Bell, Datta & Ghosh (2012), Datta, Ghosh, Steorts & Maples (2011), Bell, Datta & Ghosh (2013)


F. Solari, Roma, 10-11/11/2014

Il problema del benchmark: vincoli trasversali

Le indagini statistiche prevedono spesso la produzione di stime high-frequency (es. trimestriali) e stime low-frequency (es. annuali).

Per garantire la coerenza tra le serie storiche high-frequency e le corrispondenti serie storiche low-frequency si possano usare i metodi di riconciliazione dei dati.

Poiché le serie storiche low-frequency sono usualmente più affidabili,si possono considerare le serie storiche high-frequency come stime preliminari.


F. Solari, Roma, 10-11/11/2014

Il problema del benchmark: vincoli longitudinali

Il Benchmark

4

Il metodo Di Fonzo-Marini

Di Fonzo & Marini (2011) hanno proposto una procedura di riconciliazione, chiamata simultaneous reconciliation. Tale procedura si propone di trattare, in un unico passo, sia i vincoli longitudinali che i vincoli trasversali producendo infine la serie storica riconciliata.

Di Fonzo & Marini (2011) propongono anche una procedura di riconciliazione chiamata two-step reconciliation procedure, da utilizzare quando si usano serie storiche molto lunghe (generalizzazione del two-step approach proposto da Quenneville & Rancourt, 2005).


Il Benchmark

5

Il metodo Di Fonzo-Marini

Indicata con P la serie storica high-frequency, la procedura ha lo scopo di produrre la corrispondente serie storica riconciliata R, trovando il minimo della funzione:

I vincoli di benchmark sono introdotti attraverso i moltiplicatori di Langrange

Le soluzioni si ottengono risolvendo un sistema lineare sparso, simmetrico e singolare. Se le dimensioni del sistema non sono troppo elevate, allora può essere trovata una soluzione diretta del sistema lineare.


F DM=∑j=1

M

∑t=2

T

( R j , t−P j , t

P j , t

−R j , t−1−P j , t−1

P j , t−1)2

=∑j=1

M

∑t=2

T

( R j , tP j , t

−R j , t−1P j , t−1

)2

Il Benchmark

6

Come risolvere il sistema lineare in R?

package base [ solve(a, b, LAPACK = T) ] package pracma [ qrSolve(a,b) ] package limSolve [ nnls (a,b) ]


Il Benchmark

7

Dove P è la serie storica high-frequency originale e R la corrispondente serie storica riconciliata


F S=∑j=1

M

∑t=2

T

( R j , t−P j , t

P j , t )2

=∑j=1

M

∑t=2

T

( R j , tP j , t

−1)2

E' stata anche testata un‘ulteriore funzione obiettivo, poiché (data la scarsa lunghezza della serie storica), la funzione FDM potrebbe non essere la scelta migliore:

Il Benchmark

8

Il metodo è stato valutato tramite:

Una popolazione artificiale

Dati reali provenienti dall’indagine sulle FL

In entrambi i casi si è preso in considerazione lo stimatore EBLUP derivante da un modello lineare ad effetti misti con effetti casuali di spazio e tempo (effetti casuali con correlazione spaziale e correlazione temporale)


Studio empirico – Dati simulati

9

Popolazione

Popolazione artificiale (N=60,000,000)

107 aree e 4 tempi

Struttura spazio-temporale per la variabile target

Campione

2,000 campioni di 1,200,000 unità estratti dalla popolazione artificiale



Indicatori di performance

10

Indicatori per misurare la performance dei vari stimatori:

Average Absolute Relative Bias (AARB)

Average Relative Root Mean Squared Error (ARRMSE)



Risultati

11

AARB (MARB)

Variabili EBLUP baseDM nnlsDM baseS nnlsS

Disoccupazione 45.5 (647)

5.3(35.4)

5.8(34.2)

9.7(156)

13.9(183)

Occupazione 16.7(117)

1.9(10.2)

2.4(11.9)

2.4(16.7)

4.5(29.6)

Non Forze Lavoro 13.2(77.4)

1.1(13.1)

1.4(18.0)

1.6(24.1)

3.4(60.0)

Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali F. Solari. Roma. 10-11/11/2014


Risultati

12

ARRMSE (MRRMSE)

Variabili EBLUP baseDM nnlsDM baseS nnlsS

Disoccupazione 54.5(670)

19.2(45.8)

22.8(60,2)

21.8(167)

28.0(191)

Occupazione 19,1(118)

6,6(14.7)

8.7(25.5)

7.0(18.9)

10.3(33.1)

Non Forze Lavoro 14.6(77.9)

3.6(15.1)

5,1(19.8)

4,1(26.4)

6.7(63.5)


Studio empirico – Indagine FL

13

Variabile target: la condizione occupazionale tra i 15 e 24 anni

Aree d’interesse: province

Periodo di riferimento: 4 trimestri del 2011

Stimatore: EBLUP a livello di unità con effetti casuali d’area spazio-temporali

Dati: campioni FL dal 2008 al 2011



14

Il problema di Benchmark

Vincoli trasversali

Per ogni trimestre e per ogni variabile d’interesse, la somma delle stime prodotte a livello provinciale deve essere uguale alla stima diretta regionale.

A livello provinciale, la somma di occupati, inoccupati ed inattivi deve coincidere con la popolazione totale provinciale.

Vincoli longitudinali

La stime trimestrali devono essere coerenti con le corrispondenti stime annuali.

La procedura di riconciliazione si basa sui dati relativi ai 4 trimestri per ogni anno e viene applicata regione per regione separatamente.



15

Indicatori di performance

Le procedure di benchmark è stata valutata tramite indicatori che misurano il livello di aggiustamento a cui è stata sottoposta la serie originale per garantire il rispetto dei vincoli.

Sono stati considerati due differenti indicatori, il Mean Squared Percentage Adjustment (MSPA) che misura il livello di aggiustamento e il Mean Squared Adjustment (MSA) che tiene conto dei tassi di crescita tra le serie:

,



16

MSPA

Variabili baseDM nnlsDM baseS nnlsS

Mediana 9.0 8.9 9.0 8.9

Max 84.8 84.7 84.4 85.2

Min 0.3 0.2 0.4 0.2

MSA

Variabili baseDM nnlsDM baseS nnlsS

Mediana 3.5 2.0 4.5 3.9

Max 79.6 74.6 79.6 84.6

Min 0.1 0.03 0.1 0.03


Utilizzando il packag nnls le soluzioni trovate non rispettano tutti i vincoli imposti



F. Solari, Roma, 10-11/11/2014

MSA boxplot

Conclusioni e sviluppi futuri

18

La procedura di benchmark oltre a garantire la coerenza tra le stime che si producono, permette di contenere la distorsione delle stime SAE.

Oggetto di sviluppi futuri sarà:

– tenere in considerazione il problema delle misurazioni ripetute degli individui che compongono i vari campioni

– considerare funzioni di perdita che garantiscono:

• fattori di correzioni della serie positivi

• fattori di correzione della serie inclusi all'interno di un range stabilito


Education

M. D’Alo’, L. Di Biagio, S. Falorsi, A. Fasulo, F. Solari - Strategie di Benchmark per Stimatori per Piccole Aree EBLUP Unit Level con Effetti Casuali Spazio-Temporali