Upload
oneoonine
View
221
Download
1
Embed Size (px)
DESCRIPTION
jk
Citation preview
167Edizioni Erickson - Trento Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007 (pp. 167-199)
Test per lassessment della depressione nel contesto italiano: unanalisi criticaMichela Balsamo e Aristide SagginoDipartimento di Scienze Biomediche,Universit degli Studi G. dAnnunzio di Chieti-Pescara
RiassuntoLa depressione rappresenta la malattia mentale pi diffusa al mondo. Si calcola, infatti, che il 10,4% dei pazienti che afferisce ai setting di salute mentale sia affetto da depressione (World Health Orga-nization, 1998; 1999). Le misure self-report di depressione sono strumenti particolarmente importanti nella diagnosi e nella distinzione tra diversi livelli di depressione e sono ampiamente usate nella ricerca clinica per la valutazione dellef cacia dei farmaci antidepressivi e della psicoterapia. In questo articolo presentiamo una rassegna critica delle pi importanti misure di autovalutazione della depres-sione disponibili nel nostro Paese, sottolineando per ognuna di esse i punti di forza e di debolezza sotto il pro lo psicometrico. Lo scopo quello di aiutare a far chiarezza nella complessit delle misure esistenti di depressione, al ne di evitare confusioni nella pratica clinica e nella ricerca rispetto a quale scala usare e per quale scopo. In particolare, lo studio approfondisce le propriet psicometri-che di sei scale self-report di depressione: Beck Depression Inventory-II (BDI-II; Beck, Steer e Brown, 1996), Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977), Zung Self-Rating Depression Scale (ZSDS; Zung, 1965), Clinical Depression Questionnaire (CDQ; Krug e Laughlin, 1976), Questionario D della batteria Cognitive Behavioural Assessment 2.0 (CBA 2.0; Sanavio, Bertolotti, Mi-chielin, Vidotto e Zotti, 1997; Sanavio, 2002) e scala D del Minnesota Multiphasic Personality Inventory (MMPI; Hathaway e McKinley, 1940; 1942; 1989).
Parole chiave: depressione, diagnosi, assessment, questionari, propriet psicometriche.
Summary
Depression assessment questionnaires in the Italian context: a critical analysis
Depression represents the most pervasive mental illness worldwide. In fact, depression accounts for 10,4% of all patients seen in mental healthcare settings (World Health Organization, 1998, 1999). Self-report measures of depression are particularly important tools in the diagnosis of and discrimination between different levels of depression, and are widely used in clinical research to assess the ef cacy
Teoria
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
168
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
INTRODUZIONE
La depressione rappresenta la malattia mentale pi diffusa al mondo. Secondo le pi re-centi stime dellOrganizzazione Mondiale della Sanit, il 10,4% dei pazienti che afferiscono ai setting di salute mentale in tutto il mondo ne sono affetti (World Health Organization, 1998; 1999). La situazione sembra destinata a peggiorare, poich si prevede che per lanno 2020 la depressione clinica risulter seconda solo alla malattia cardiaca cronica per il suo peso sulla salute internazionale, peso identi cato dallesame delle cause di morte, dalla disabilit, dal-lincapacit a lavorare e dalle risorse mediche impiegate (World Health Organization, 1998; Blackburn e Moorhead, 2002). In Italia, i disturbi depressivi sono tra i disturbi mentali pi comuni, con un tasso di prevalenza a 12 mesi del 13,5% (De Girolamo et al., 2005). Per una disamina teorica pi approfondita, si rimanda a Saggino (2005).
Storicamente la depressione stata uno dei primi disturbi psichiatrici identi cati come unit distinta (Krug e Laughlin, 1976). La diagnosi di depressione non sempre facile, a meno che il paziente non presenti lintera costellazione dei sintomi depressivi. Il pi delle volte, invece, il paziente presenta una depressione mascherata, soprattutto nei casi in cui lamenta solo malesseri sici. Alcuni sintomi sici ed emotivi riferiti dai pazienti depressi sono identici a quelli dellansia: una delle lamentele pi comuni dei depressi, infatti, ri-guarda i disturbi del sonno, che sono massicciamente presenti anche nei sintomi prodotti dallansia. Con pazienti di questo tipo facile sbagliare diagnosi e intervenire con farmaci o altre terapie che a nulla giovano o che possono addirittura aggravare la sintomatologia, come succede nel 75% dei casi. Poich i possibili esiti della depressione possono essere molto gravi comportando un notevole deterioramento del funzionamento psicosociale, sino ad arrivare al suicidio nel 15% dei casi (Goldston, Reboussin e Daniel, 2006) , importante fare una diagnosi differenziale af nch si possano intraprendere appropriati trattamenti psicoterapeutici e/o farmacologici.
Dunque, il problema di una diagnosi precisa molto importante per il medico e per lo psichiatra: la scelta del farmaco pi ef cace o ladozione di altri metodi di trattamento richie-
of antidepressant drugs and psychotherapy. In this paper, we present a critical review of the most im-portant self-report measures of depression currently available in Italy, while emphasizing the points of strength and points of weakness of each measure from the psychometric point of view. The aim is to help clarify the complexities of the existing depression measures in order to avoid confusion in clinical practice and in research work in terms of which scale is to be used and for what purpose. To this end, this study investigated the psychometric properties of six self-report depression scales: Beck Depres-sion Inventory-II (BDI-II; Beck, Steer & Brown, 1996), Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977), Zung Self-Rating Depression Scale (ZSDS; Zung, 1965), Clinical Depression Questionnaire (CDQ; Krug & Laughlin, 1976), Cognitive Behavioural Assessment 2.0, Depression Que-stionnaire (CBA 2.0; Sanavio, Bertolotti, Michielin, Vidotto & Zotti, 1997; Sanavio, 2002) and Minneso-ta Multiphasic Personality Inventory, scale D (MMPI - Hathaway & McKinley, 1940; 1942; 1989).
Keywords: depression, diagnosis, assessment, questionnaires, psychometric properties.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
169
de, infatti, unaccurata diagnosi differenziale. Daltra parte, la crescente so sticazione dei criteri scienti ci impiegati nella ricerca obbliga alluso di strumenti di misura dei fenomeni sempre pi accurati. necessario, allora, che sia i ricercatori sia i clinici conoscano a fondo vantaggi e limiti degli strumenti che hanno a disposizione per la diagnosi e la discriminazione tra diversi livelli di gravit della depressione. In assenza di strumenti di valutazione attendibili e validi, sarebbe estremamente dif cile valutare accuratamente i sintomi e la severit della depressione, de nire gli obiettivi del trattamento o valutarne lef cacia (Katz, Shaw, Vallis e Kaiser, 1995). Una delle pi diffuse e utili modalit per la valutazione dei sintomi depressivi rappresentata dal ricorso agli inventari di autovalutazione.
Il presente lavoro offre una rassegna dei vari strumenti self-report disponibili nel con-testo italiano per la valutazione della depressione negli adulti e fornisce raccomandazioni pratiche per i clinici, alla luce dellanalisi delle loro propriet psicometriche e dei punti di forza e di debolezza di ciascuno.
In letteratura sono state identi cate circa 25 misure self-report della severit della depressione. Di queste, 17 sono questionari speci camente sviluppati per misurare la severit dei sintomi depressivi nelle popolazioni adulte, mentre 8 sono stati creati per limpiego con popolazioni speciali, ad esempio, depressione nella schizofrenia, depres-sione nei bambini, depressione nei setting di pronto soccorso (Nezu, Ronan, Meadows e McClure, 2000). Nezu e colleghi (2000) hanno classi cato ogni misura disponibile di depressione in termini di utilit clinica e di ricerca. stata assegnata una valutazione di elevato agli strumenti frequentemente usati nella ricerca o nella pratica clinica e un valore di limitato a quelli che hanno un impiego ristretto nei setting clinici o che sono proibitivi in termini di costi o di tempo richiesti o che, relativamente allutilit di ricerca, presentano dati empirici insuf cienti.
La tabella 1 illustra le caratteristiche formali degli strumenti di autovalutazione della depressione per adulti che hanno unelevata utilit clinica e di ricerca secondo la classi -cazione di Nezu et al. (2000), di cui disponibile ladattamento italiano.
Dei 6 questionari, i primi quattro costituiscono misure speci che di depressione, mentre gli ultimi due fanno parte di batterie pi ampie, volte a individuare le diverse aree della patologia psichica.
Proveremo a tracciare un pro lo psicometrico analitico per ciascuna scala. Nelle con-clusioni, tenteremo di fornire un quadro globale della complessit e dei limiti dellautova-lutazione della depressione e presenteremo la nostra proposta di costruzione di una nuova scala self-report di misura della depressione.
SCALE DI AUTOVALUTAZIONE DELLA DEPRESSIONE
Beck Depression Inventory-II (BDI-II)
Il Beck Depression Inventory-II (BDI-II; Beck, Steer e Brown, 1996) lo strumento di misura della presenza e della severit della depressione pi utilizzato al mondo, sia nella popolazione normale che nei pazienti psichiatrici (Steer, Clark, Beck e Ranieri, 1998),
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
170
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Tabe
lla 1
C
arat
teris
tiche
for
mal
i del
le s
cale
sel
f-rep
ort
di d
epre
ssio
ne p
i d
iffu
se in
Ital
ia
Sca
laTi
po
di it
em
N di
item
Form
ulaz
ione
de
gli i
tem
(p
osit
ivo/
nega
tivo
)
Form
ato
di r
ispo
sta
Ran
ge
dei t
empi
di
som
min
istr
azio
ne
Rife
rim
enti
bi
blio
gra
ci
Bec
k D
epre
ssio
n In
vent
ory-
II (B
DI-I
I)Af
ferm
azio
ni21
Item
ipsa
tivi
Sca
la c
on 4
ris
post
ese
cond
o gr
adi d
i in
tens
it c
resc
enti
5-1
0
Bec
k, S
teer
e
Bro
wn
(19
96
)
Cen
ter
for
Epid
emio
logi
cal
Stu
dies
Dep
ress
ion
Sca
le (C
ES-D
)
Affe
rmaz
ioni
20
16+
4 -
Sca
la L
iker
t a
4
pass
i5-1
0
Rad
loff
(1
97
7)
Zung
Sel
f-Rat
ing
Dep
ress
ion
Sca
le
(ZS
DS
)Af
ferm
azio
ni20
10+
10 -
Sca
la L
iker
t a
4
pass
i5
Zung
(1
96
5)
Clin
ical
Dep
ress
ion
Que
stio
nnai
re d
ellI
PAT
(CD
Q)
Affe
rmaz
ioni
40
20+
20 -
Sca
la c
on 3
ris
post
ese
cond
o gr
adi d
i in
tens
it c
resc
enti
10-2
0
Kru
g e
Laug
hlin
(1
97
6)
Que
stio
nario
di
Dep
ress
ione
del
C
ogni
tive
Beh
avio
ural
As
sess
men
t 2.0
(C
BA)
Affe
rmaz
ioni
24
22+
2 -
S/
No
10
San
avio
, B
erto
lott
i, M
ichi
elin
, Vi
dott
o e
Zott
i (1
99
7)
Sca
la D
del
Min
neso
ta
Mul
tipha
sic
Pers
onal
ity
Inve
ntor
y-2 (M
MPI
-2)
Affe
rmaz
ioni
57
24+
33 -
Vero
/Fal
so12
Hat
haw
ay
e M
cKin
ley
(19
89
)
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
171
tanto da essere inserito nella classi ca dei top 10 dei test psicologici pi frequentemente usati (Camara, Nathan e Puente, 2000). Esso rappresenta un aggiornamento dellinventario originale, il Beck Depression Inventory (BDI; Beck, Ward et al., 1961) e della sua parzia-le revisione (BDI-IA; Beck, Rush, Shaw e Emery, 1979), sviluppati a partire dagli anni Sessanta con lo scopo di misurare le manifestazioni comportamentali della depressione, senza ri ettere alcuna teoria riguardante leziologia o i processi psicologici sottostanti (Sanavio e Sica, 1999). Sebbene il Beck Depression Inventory mostrasse caratteristiche psicometriche adeguate in termini di attendibilit test-retest, consistenza interna e validit di costrutto (vedi Beck, Steer e Garbin, 1988), la sua validit di contenuto apparsa via via pi dubbia con il susseguirsi delle varie edizioni del Manuale Diagnostico e Statistico dei Disturbi Mentali (DSM) e delle conseguenti modi che apportate nei criteri che de -niscono i disturbi depressivi.
Dunque, il Beck Depression Inventory-II stato adattato ai criteri diagnostici dellEpi-sodio Depressivo Maggiore (EDM) della quarta versione riveduta del DSM (DSM-IV-TR; APA, 2000) e, coerentemente con questi, il frame temporale di riferimento della sinto-matologia descritta stato esteso da 1 a 2 settimane (Beck, Steer, Ball e Ranieri, 1996). Bench la nuova versione della scala faccia riferimento a un sistema di classi cazione categoriale, qual quello alla base del DSM, il modello cognitivo della depressione segue sostanzialmente un approccio dimensionale, considerando la depressione come collocabile lungo un continuum di gravit alle cui estremit si trovano, da una parte, i sintomi affettivi pi lievi e non clinici e, dallaltra, i disturbi affettivi clinici pi gravi (Beck, 1991; Clark, Beck e Alford, 1999).
Propriet psicometriche e norme
Le propriet psicometriche della scala nella seconda edizione sono riassunte nella tabella 2, sia per la versione originale che per quella italiana, recentemente pubblicata ad opera di Ghisi, Flebus, Montano, Sanavio e Sica (2006).
Le norme della versione originale del Beck Depression Inventory-II si basano su un campione di 120 studenti universitari e di 500 pazienti psichiatrici ambulatoriali, tratti da 4 istituti clinici statunitensi, di cui il 53% con diagnosi di disturbi dellumore, il 18% con disturbi dansia, il 16% con disturbi delladattamento e il 14% con vari altri tipi di disturbi. Le norme della versione italiana sono basate su un campione di taratura italiano, composto da 723 studenti universitari, 354 adulti tratti dalla popolazione generale e un campione clinico, composto da 135 soggetti con disturbi depressivi come problema principale e un gruppo di controllo di 135 soggetti tratti dalla popolazione generale, selezionati in maniera randomizzata dal campione precedente (Ghisi et al., 2006).
Attendibilit
Sia nella versione originale che nella versione italiana, gli indici di coerenza interna e di attendibilit test-retest sono ottimi, aggirandosi intorno a 0,92. Nella versione italiana, sono altres pi che soddisfacenti, andando da 0,76 a 0,87 (tabella 2).
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
172
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Tabe
lla 2
C
arat
teris
tiche
psi
com
etric
he d
elle
sca
le s
elf-r
epor
t di
dep
ress
ione
pi
dif
fuse
in It
alia
Scale self-report di depressione
Coe
renz
a in
tern
a(_
di
Cro
nbac
h)
Att
endi
bilit
te
st-ret
est
Valid
it
fatt
oria
le
Valid
it
conv
erge
nte
Valid
it
disc
rim
inan
te
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
BD
I-II
0,9
2
0,9
3
0,8
0
0,8
7t
0,8
7
0,9
3
a 7
gi
orni
0,7
6
ad 1
m
ese
Str
uttu
ra
bifa
ttor
iale
:
1. fa
ttor
e co
gniti
vo-
affe
ttiv
o
2. fa
ttor
e so
mat
ico
Str
uttu
ra
bifa
ttor
iale
:
1. fa
ttor
e so
mat
ico-
affe
ttiv
o
2. fa
ttor
e co
gniti
vo
Str
uttu
ra
bifa
ttor
iale
:
1. fa
ttor
e co
gniti
vo-
affe
ttiv
o
2. fa
ttor
e so
mat
ico
Str
uttu
ra
bifa
ttor
iale
:t
1. fa
ttor
e so
mat
ico-
affe
ttiv
o
2. fa
ttor
e co
gniti
vo
0,8
4
con
BD
I;
0,7
1
con
HR
SD
0,7
7
con
QD
0,6
0t
con
CES
-D
0,7
0t
con
QD
0,7
3
con
QD
0,6
0
con
BAI
0,4
7
con
HAR
S-R
0,6
6
con
STA
I
0,6
0t
con
BAI
0,5
7
con
BAI
0,5
5
con
STA
I
(con
tinua
)
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
173
Scale self-report di depressione
Coe
renz
a in
tern
a(_
di
Cro
nbac
h)
Att
endi
bilit
te
st-ret
est
Valid
it
fatt
oria
le
Valid
it
conv
erge
nte
Valid
it
disc
rim
inan
te
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
CES
-D
0,9
0
0,8
5t
n.r.
0,5
7t
in
med
ia
da 2
a
8 s
et-
timan
e
0,4
8t
a 3
m
esi
0,5
4t
a 6
m
esi
0,3
2t
ad 1
an
no
n.r.
Str
uttu
ra
quad
rifat
toria
le:t
1. di
sfor
ia
2. be
ness
ere
3. si
ntom
i som
a-tic
i e d
i ral
lent
a-m
ento
4. di
f co
lt in
ter-
pers
onal
i
n.r.
0,5
1t
e 0,7
0
con
scal
a di
de
pres
-si
one
di
Lubi
n
0,8
3
con
SC
L-90
0,6
1 e
0,6
5t
con
HR
SD
0,4
7 c
on
scal
a D
del
M
MPI
0,2
6t
e 0,2
1
con
una
scal
a di
Ag-
gres
si-
vit
0,1
9t
e 0,2
4
con
una
scal
a di
Fun
-zi
ona-
men
to
Soc
iale
n.r.
(con
tinua
)
(con
tinua
)
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
174
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Scale self-report di depressione
Coe
renz
a in
tern
a(_
di
Cr o
nbac
h)
Att
endi
bilit
te
st-ret
est
Valid
it
fatt
oria
le
Valid
it
conv
erge
nte
Valid
it
disc
rim
inan
te
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
ZSD
S
0,8
2
0,7
5
n.r.
n.r.
Str
uttu
ra
trifa
ttor
iale
:
1. si
ntom
i co
gniti
vi
2. si
ntom
i af
fett
ivi
3. si
ntom
i so
mat
ici
Str
uttu
ra
trifa
ttor
iale
:t
1. s
into
mat
olog
ia
posi
tiva
2. s
into
mat
olog
ia
nega
tiva
3. s
into
mat
olog
ia
som
atic
a
0,7
3t
con
BD
I
0,9
0t
con
CES
-D
0,4
1t
con
HR
SD
0,6
1t
con
GD
S
0,7
7t c
on
CD
Q
0,5
7t c
on
scal
a D
del
M
MPI
-2
0,6
2t c
on
scal
a D
EP
del M
MPI
-2
0,6
0 c
on
HR
SD
0,5
4 c
on
WD
RS
0,7
4 c
on
BD
I
88%
di s
en-
sibi
lit
0,7
0t
con
ASQ
0,6
1t
con
sca-
la A
NX
(Ans
ie-
t)
del
MM
PI-2
(con
tinua
)
(con
tinua
)
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
175
Scale self-report di depressione
Coe
renz
a in
tern
a(_
di
Cr o
nbac
h)
Att
endi
bilit
te
st-ret
est
Valid
it
fatt
oria
le
Valid
it
conv
erge
nte
Valid
it
disc
rim
inan
te
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
CD
Q
0,9
3
0,9
1
0,8
5t
0,4
6
0,9
3t in
m
edia
a
dist
anza
di
un
gior
-no
n.r.
Str
uttu
ra
mon
ofat
toria
let
Str
uttu
ra
bifa
ttor
iale
n.r.
0,3
1 c
on la
sca
la D
de
l MM
PI
0,5
8
con
la s
cala
Ipoc
ondr
ia
0,7
5
con
la s
cala
D
epre
ssio
ne s
uici
da
0,3
6
con
la s
cala
D
epre
ssio
ne a
nsio
sa
0,6
3
con
la s
cala
Bas
sa
ener
gia
0,7
0
con
la s
cala
Col
pa
e ris
entim
ento
0,2
6
con
la s
cala
D
epre
ssio
ne t
edio
sa d
el C
AQ
n.r.
0,3
4 c
on
la s
cala
Pd
del M
MPI
48 c
on
la s
cala
Pt
del M
MPI
0,3
2 c
on
la s
cala
Sc
del M
MPI
0,5
1 c
on
la s
cala
Si
del M
MPI
0,7
1
con
ASQ
QD
del
C
BA-
2.0
0,8
2t
0,8
8t
a 7
gio
rni,
0,7
2t
a 3
0 g
iorn
i
Str
uttu
ra
mon
ofat
toria
let
0,5
6
con
il B
DI
1 f
also
pos
itivo
e
3 f
alsi
neg
ativ
i
(con
tinua
)
(con
tinua
)
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
176
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Sca
la
D d
elM
MPI
-2
0,5
9t
per
i m
asch
i
0,6
4t
per
le
fem
-m
ine
0,6
1t
per
i m
asch
i
0,7
0t
per
le
fem
-m
ine
0,7
5t
a 7
gio
rni
per
i ma-
schi
0,7
7t
a 7
gi
orni
per
le
fem
-m
ine
n.r.
Str
uttu
ra
trifa
tto-
rialet
nei
m
asch
i
stru
ttur
a bi
fatt
oria
-let
nel
le
fem
min
e
Str
uttu
ra
bifa
tto-
rialet
nei
m
asch
i
stru
ttur
a bi
fatt
oria
-let
nel
le
fem
min
e
n.r.
n.r.
n.r.
n.r.
Leg
end
a
AS
Q =
Anx
iety
Sca
le Q
uest
ionn
aire
del
lIns
titut
e fo
r P
erso
nalit
y an
d A
bilit
y Te
stin
g (I
PA
T);
B
AI
= B
eck
Anx
iety
Inv
ento
ry;
BD
I =
Bec
k D
epre
ssio
n In
vent
ory;
CA
Q =
Clin
ical
Ana
lysi
s Q
uest
ionn
aire
; C
DQ
= C
linic
al D
epre
ssio
n Q
uest
ionn
aire
del
lIP
AT;
CE
S-D
= C
ente
r fo
r E
pide
mio
logi
cal
Stu
dies
Dep
ress
ion
Sca
le;
GD
S =
Ger
iatr
ic D
epre
ssio
n S
cale
; H
AR
S-R
=
Rev
ised
Ham
ilton
Anx
iety
Rat
ing
Sca
le;
HR
SD
= H
amilt
on R
atin
g S
cale
of
Dep
ress
ion;
M
MP
I =
Min
neso
ta M
ultip
hasi
c P
erso
nalit
y In
vent
ory;
MM
PI-
2 =
Min
neso
ta M
ultip
hasi
c P
erso
nalit
y In
vent
ory-
2; Q
D =
Que
stio
nario
di
Dep
ress
ione
del
Cog
nitiv
e B
ehav
iour
al
Ass
essm
ent-
CB
A-
2.0;
SC
L-9
0 =
Sym
ptom
Che
ck L
ist-
90-R
evis
ed;
STA
I =
Sta
te-T
rait
Anx
iety
In
vent
ory;
W
DR
S
=
Wec
hsle
r D
epre
ssio
n R
atin
g S
cale
; Z
SD
S
=
Sel
f-R
atin
g D
epre
ssio
n S
cale
di Z
ung;
n.r
.= d
ato
non
rinve
nuto
nel
la le
ttera
tura
di r
iferim
ento
Scale self-report di depressione
Coe
renz
a in
tern
a(_
di C
ronb
ach)
Att
endi
bilit
te
st-ret
est
Valid
it
fatt
oria
le
Valid
it
conv
erge
nte
Valid
it
disc
rim
inan
te
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
Versione originale
Versione italiana
(con
tinua
)
Tip
olo
gia
di c
amp
ion
e su
cu
i s
tato
cal
cola
to
il d
ato
rip
ort
ato
:
= c
ampi
one
clin
ico
t
= c
ampi
one
trat
to d
alla
pop
olaz
ione
gen
eral
e
= c
ampi
one
di s
tude
nti u
nive
rsita
ri
I da
ti rip
orta
ti so
no t
ratti
dag
li st
udi p
i r
appr
esen
tativ
i per
ogn
i sca
la.
In p
artic
olar
e, p
er le
ver
sion
i orig
inal
i, da
Bec
k, S
teer
e B
row
n (1
996)
e
da S
teer
, Bal
l, R
anie
ri e
Bec
k (1
999)
per
il B
DI-
II; d
a R
adlo
ff (1
977)
per
la C
ES
-D; d
a de
Jon
ghe
e B
anek
e (1
989)
e S
akam
oto,
Kijm
a, T
omod
a e
Kam
bara
(19
98)
per
la Z
SD
S;
da K
rug
e La
ughl
in (
1976
) pe
r il
CD
Q,
da B
erto
lotti
, Z
otti,
Mic
hiel
in,
Vid
otto
& S
anav
io (
1990
) e
da
San
avio
(2
002)
per
il Q
D d
el C
BA
2.0
, da
Hat
haw
ay e
McK
inle
y (1
989)
per
il M
MP
I-2.
Per
le v
ersi
oni i
talia
ne, d
a G
hisi
, Fle
bus,
Mon
tano
, San
avio
e S
ica
(200
6) p
er il
BD
I-II;
da
Pie
rfed
eric
i et a
l. (1
982)
e d
a F
ava
(198
3) p
er la
CE
S-D
; da
Far
avel
li, A
lban
esi e
Pol
i (19
86)
e In
nam
orat
i, Le
lli, A
iello
, Di
Lore
nzo
del C
asal
e, R
usso
e F
erra
ri (2
006)
per
la Z
SD
S; d
a C
iof ,
Bal
sam
o e
Sag
gino
(in
cor
so d
i sta
mpa
) pe
r il
CD
Q e
da
Siri
gatti
e P
anch
eri
(199
5) p
er il
MM
PI-
2.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
177
Validit
Per la versione originale del Beck Depression Inventory sono state rinvenute diverse soluzioni fattoriali, che spaziavano in un range da 3 a 7 fattori, a seconda della procedura di estrazione di analisi fattoriale impiegata e della patologia del campione esaminato (Weckowicz, Muir e Cropley, 1967; Beck e Lester, 1973; Golin e Hartz, 1979; Louks, Hayne e Smith, 1989; Whisman, Perez e Ramel, 2000). Tuttavia, molteplici analisi fat-toriali confermatorie (Clark, Cavanaugh e Gibbons, 1983; Tanaka e Huba, 1984; Steer, Ball, Ranieri e Beck, 1999; Storch, Roberti e Roth, 2004) suggerivano lesistenza di una generale sindrome sottostante di secondo ordine di depressione, composta da tre fattori di primo ordine altamente intercorrelati: sintomi cognitivo-emotivi, sintomi comportamentali e sintomi somatici (Beck e Steer, 1987). Il Beck Depression Inventory-II sembrerebbe, invece, avere una struttura fattoriale pi forte, in cui emergono due fattori principali, altamente correlati: sintomi cognitivi e sintomi somatico-affettivi nel campione clinico; sintomi cognitivo-affettivi e somatici nel campione di studenti universitari, come illustrato nella tabella 2 (Beck, Steer e Brown, 1996).
Nel contesto italiano, questi risultati sono stati confermati da diverse analisi fatto-riali confermative. Nello studio di Montano e Flebus (2006), il modello a due fattori (cognitivo-affettivo e somatico), altamente correlati (0,80), risultato avere buoni indici di t [Comparative Fit Index (CFI) = 0,915, Root Mean Square Error of Approximation (RMSEA) = 0,068; r2 = 251,57, gl = 89] in un campione italiano di 574 adulti sani. Nel campione di taratura italiano, il modello a due fattori risulta quello che risponde meglio alla struttura fattoriale del Beck Depression Inventory-II sia tra gli studenti universitari (CFI = 0,92, RMSEA = 0,055; rapporto r2/gl = 3,08), sia nel campione di adulti provenienti dalla popolazione generale (CFI = 0,90, RMSEA = 0,085; rapporto r2/gl = 3,5), sia nel campione clinico (CFI = 0,95, RMSEA = 0,062; rapporto r2/gl = 1,52). Generalmente il fattore somatico-affettivo raccoglie le manifestazioni somatiche e affettive della depressione, quali perdita di interessi, perdita di energia, agitazione, pianto, modi cazioni del sonno e dellappetito, perdita di piacere, dif colt di con-centrazione, irritabilit, affaticamento; il fattore cognitivo riguarda le manifestazioni cognitive della depressione, quali pessimismo, senso di colpa, autocritica, mancanza di autostima, mancanza di valore, indecisione, pensieri o desideri di suicidio, fallimenti passati, sentimenti punitivi.
La differenziazione di fattori allinterno del Beck Depression Inventory-II potrebbe rivelarsi utile per lidenti cazione di diversi tipi di depressione (endogena versus reattiva) e per la valutazione della severit (intensit e cronicit), della prognosi e delle risposte al trattamento dei soggetti depressi: i soggetti con punteggi pi elevati nella dimensione cognitivo-affettiva, con una sintomatologia siologica lieve o nulla, potrebbero bene ciare maggiormente del trattamento cognitivo-comportamentale e rispondere meno bene agli in-terventi farmacologici (Endler, Rutheford e Denisoff, 1999). Alla luce di queste suggestive implicazioni, non risulta chiara la scelta degli autori di riferirsi unicamente a un punteggio totale per linterpretazione dei risultati, ignorando la potenziale multidimensionalit di questa misura (Farmer, 2001).
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
178
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Utilit clinica e di ricerca
Pur costituendo attualmente lo standard di riferimento di ogni scala self-report per la misura della depressione, il Beck Depression Inventory-II presenta alcuni limiti, sia dal punto di vista clinico che psicometrico.
1. Dal punto di vista clinico, la diagnosi di Episodio Depressivo Maggiore risulta molto pi complessa di quanto non sembri a prima vista con lausilio del Beck Depression Inventory (Sanavio e Sica, 1999). Il pericolo di falsi positivi (circa il 18%) ha condot-to gli autori del test a rivolgere precise raccomandazioni ai somministratori circa la necessit di una corretta somministrazione dello strumento (Kendall, Hollon, Beck, Hammen e Ingram, 1987). Va, inoltre, considerato che il sintomo perdita di peso, incluso nel IV criterio del DSM-IV-TR, non rappresentato nellinventario.
2. Dal punto di vista psicometrico, Gibbons, Clark, VonAmmon Cavanaugh e Davis (1985) osservano che gli item del Beck Depression Inventory consistono di un gruppo di affermazioni graduate, o opzioni, che ri ettono gradi diversi di gravit del dominio sintomatologico misurato da quellitem. Infatti, per ogni item vi sono 4 opzioni, cui sono stati assegnati dei pesi su una base intuitiva e aprioristica, con un range che va da 0 a 3. Lo scoring del Beck Depression Inventory secondo questa modalit assume che: a) gli item siano egualmente ef caci nel misurare la depressione e b) gli intervalli tra le opzioni siano psicologicamente identici. N gli item n le opzioni di risposta sono ponderati in base a quanto gli item siano ef caci o discriminativi rispetto alle differenze nella gravit della depressione e le risposte alle opzioni sono usate senza considerare se le differenze tra le opzioni ri ettono una sottostante scala a intervalli o ordinale. Se gli item e le opzioni sono ugualmente ef caci e se i pesi assegnati alle opzioni sono appropriati discutibile e dovrebbe comunque essere veri cato empiri-camente (Gibbons et al., 1985). Contrariamente al gran numero di studi che indagano le propriet psicometriche del BDI, non ci sono ricerche che esaminino esplicitamente lappropriatezza delle ponderazioni assegnate alle opzioni di risposta.
3. Scarsa capacit discriminativa tra depressione e ansia, com dimostrato dalle correla-zioni di 0,71 con la sottoscala di Ansia della Symptom Check List-90-Revised (SCL-90; Steer, Ball, Ranieri e Beck, 1997), di 0,60 con il Beck Anxiety Inventory (BAI; Beck e Steer, 1990) e di 0,47 con lHamilton Rating Scale for Depression (HDRS; Hamilton, 1960).
4. Mancanza di controllo del response set della desiderabilit sociale. Come fa osser-vare Arbisi (2001) nella recensione critica al Beck Depression Inventory-II nel The Fourteenth Mental Measurements Yearbook: Quelli tra noi impegnati nella pratica clinica si trovano spesso di fronte a pazienti che alterano la loro presentazione per promuovere una personale agenda che pu non essere condivisa dal clinico. Il manuale menziona indirettamente questo problema con una modalit piuttosto ambivalente ed evitante (p. 2). Si impone cautela, dunque, qualora si usi tale strumento con persone che potrebbero desiderare di nascondere le proprie intenzioni suicide o, di contro, sovrastimare la loro depressione (Conoley, 1978). Nella valutazione delle risposte, si deve tenere, altres, conto della tendenza, tipica di alcuni pazienti con depressione
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
179
severa, a dicotomizzare ogni cosa in maniera estremamente positiva o negativa. Si tratterebbe, infatti, di un importante sintomo cognitivo di depressione piuttosto che di uno stile di risposta (Beck, Steer e Brown, 1996).
Center for Epidemiological Studies Depression Scale (CES-D)
La Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977) una breve scala di valutazione self-report, sviluppata dal Center for Epidemiological Studies del National Institute of Mental Health (NIMH) a partire da un pool di item di questionari per la depressione validati intorno agli anni Settanta, tra cui il Beck Depression Inventory, la Zung Self-Rating Depression Scale (ZSDS; Zung, 1965) e la scala D del Minnesota Multiphasic Personality Inventory (MMPI; Hathaway e McKinley, 1940), che furono sot-toposti ad analisi fattoriali atte a identi care le componenti maggiori della sintomatologia depressiva (umore depresso, hopelessness, ovvero senso di disperazione, helplessness, ovvero senso di impotenza, sentimenti di colpa e di inutilit), con lo speci co scopo di studiare la distribuzione della depressione nella popolazione generale.
Propriet psicometriche e norme
Le propriet psicometriche della forma originale appaiono adeguate e riconfermate nel tempo (Radloff, 1977; Knight, Williams e Olaman, 1997), come illustrato nella tabella 2.
Le norme si basano sui seguenti campioni (Radloff, 1977): 2514 adulti bianchi nor-mali, 1060 adulti bianchi normali, 1422 adulti bianchi normali e 70 pazienti psichiatrici bianchi adulti.
Attendibilit
Per lattendibilit, Radloff (1977) ha riportato indici di consistenza interna piuttosto alti e correlazioni test-retest modeste.
Validit
La validit convergente accettabile, dato che sono riportate correlazioni elevate con altri indici di sintomatologia depressiva, quali il Beck Depression Inventory e la Zung Self-Rating Depression Scale (Radloff, 1977). La validit di costrutto appare solo in parte supportata dalla struttura fattoriale emergente. Sebbene la Center for Epidemiological Studies Depression Scale sia stata costruita per porre lenfasi essenzialmente sullumore depresso (Radloff, 1977) e sia da sempre considerata e utilizzata come test monodimensio-nale, con un unico punteggio totale (Gotlib e Hammen, 2002), nelle analisi fattoriali delle componenti principali emergono generalmente 4 fattori, che spiegano mediamente il 48% della varianza: 1) umore depresso; 2) benessere; 3) sintomi somatici e di rallentamento; 4) sintomi interpersonali (Radloff, 1977). Il fattore benessere sembrerebbe legato alla formu-lazione in positivo di quattro item della scala, inseriti allo scopo di rompere uneventuale tendenza a rispondere in modo unidirezionale (acquiescence response set).
La scala risulta, inoltre, avere una buona sensibilit (che la capacit di identi care correttamente individui con disturbo depressivo), ma la sua speci cit (ovvero, la sua
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
180
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
capacit di identi care correttamente individui senza il disturbo) e il suo potere predit-tivo positivo (ossia, il numero di individui identi cati dal test come depressi che sono diagnosticati come tali) sono altamente insoddisfacenti, pur considerando che, in quanto strumento di screening, il suo scopo principale dovrebbe essere quello di massimizzare la sensibilit (Dozois e Dobson, 2002).
Utilit clinica e di ricerca
Particolarmente utile nelle valutazioni epidemiologiche e nei procedimenti di screening, ha doti di brevit, semplicit e moderata intrusivit, che la rendono adatta allimpiego nella ricerca e nello screening nella popolazione generale anziana, in campioni istituzionalizzati o con disabilit, essendo stata anche adattata per luso nelle interviste computerizzate o telefoniche.
Nel complesso, i limiti della Center for Epidemiological Studies Depression Scale sono diversi e riassumibili come segue.
1. Tendenza alla sovrastima della depressione e, conseguentemente, alla produzione di un largo numero di falsi positivi. Per la sua scarsa capacit discriminativa, met degli studenti esaminati nelle varie ricerche viene classi cata come depressa (Robert, Lewinsohn e Seeley, 1991). Analogamente, Fechner-Bates, Coyne e Schwenk (1994) hanno trovato che il 72% dei soggetti con elevati punteggi al test non incontrava i criteri diagnostici di depressione con la Structured Clinical Interview for DSM-III-R (SCID; Spitzer, Williams, Gibbon e First, 1990). Ci risiede probabilmente nel fatto che il punteggio di cut off standard, che discrimina fra presenza/assenza di depressio-ne, individuato in 16 punti, risulta eccessivamente basso, perci sarebbe preferibile sostituirlo con un punteggio di allarme clinico di 23 punti (Pierfederici et al., 1982; Fechner-Bates et al., 1994; Santor e Coyne, 1997). Proprio per questa ragione, secondo Roberts e Vernon (1983) il test andrebbe usato con cautela anche nelle fasi preliminari di screening.
2. Limitato potere discriminativo tra depressione e ansia. Elevate correlazioni con misure di psicopatologia generale e, in particolare, di ansia, conducono a una tipica tenden-za dello strumento a segnalare un numero eccessivo di casi che, pur presentando un interesse psicopatologico, non soffrono di depressione maggiore. I sintomi esplorati dalla CES-D potrebbero, in effetti, far parte di altre sindromi o di unaspeci ca de-moralizzazione, per cui sarebbe irrealistico attendersi diagnosi differenziali da questo strumento (Myers e Weissman, 1980).
3. Scarsa validit di contenuto, attribuibile alla copertura solo parziale dei criteri diagnostici del DSM per lEpisodio Depressivo Maggiore. Gli item della Center for Epidemiological Studies Depression Scale coincidono poco con i criteri dellEpiso-dio Depressivo Maggiore dellattuale versione del DSM (DSM-IV-TR; APA, 2000). Mancano item che valutino lideazione suicidaria, i pensieri di morte, la colpa, lagi-tazione e la perdita di interessi (Zimmerman, 1983) e sono inclusi item che non cor-rispondono ai criteri diagnostici, che possono essere meglio visti come sintomi di sindromi non depressive. La mancanza di item corrispondenti ai criteri diagnostici
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
181
contribuisce alla riduzione della sensibilit dello strumento, mentre linclusione di item non corrispondenti ai criteri diagnostici riduce inevitabilmente la sua speci cit per la depressione clinica.
La validit di contenuto compromessa, altres, dalla mancata corrispondenza delle istruzioni e del formato di risposta ai criteri diagnostici per lEpisodio Depressivo Maggiore previsti dal DSM-IV-TR, che chiede di riferire la frequenza con cui stato esperito il sintomo descritto nellultima settimana, anzich nelle ultime due settimane. Ci contribuisce a ridurre ulteriormente la speci cit della scala.
4. Presenza di bias di genere in almeno due item (Stommel, Given, Given, Kalaian, Schulz e McCorkle, 1993).
5. Assenza di un manuale vero e proprio delladattamento italiano, che pone problemi per un suo corretto impiego.
La traduzione stata curata da Pierfederici, Fava, Munari, Rossi, Baldaro, Pasquali Evangelisti, Grandi, Bernardi e Zecchino (1982), supportata dalle back-translation di cinque italo-americani residenti in Italia. Nel campione italiano di validazione la CES-D discrimina signi cativamente, e meglio di altri strumenti, i pazienti depressi dai soggetti di controllo, sebbene sui punteggi medi in uiscano signi cativamente let (pi anziani sono i soggetti pi alto il punteggio) e il sesso (le donne hanno punteggi medi pi alti).
Dunque, lontano dallessere un test di ausilio diagnostico o una misura dei cambia-menti della gravit dei sintomi depressivi nel tempo, come osservano Sanavio e Sica (1999), la CES-D pu essere considerata al massimo solo un grossolano indicatore di depressione nella popolazione generale, come fanno notare Myers e Weissman (1980).
Zung Self-Rating Depression Scale (ZSDS)
Considerata il prototipo delle scale di autovalutazione per la sua semplicit, la Zung Self-Rating Depression Scale (ZSDS; Zung, 1965) stata messa a punto per ottenere una rapida valutazione quantitativa dei sintomi psicologici (10 item), affettivi (2 item) e somatici (8 item) nei soggetti depressi. Rispetto al Beck Depression Inventory presenta uno spettro sintomatologico pi ampio, dando molto peso anche allansia e ai sintomi accessori.
Gli item sono stati ricavati sottoponendo ad analisi fattoriale un insieme di sintomi raccolti dalla letteratura e integrati da interviste con pazienti. La met di essi formulata e codi cata allinverso, per il controllo delleffetto acquiescenza.
Un punteggio di cut off di 50 conduce a una corretta classi cazione diagnostica nell88% dei casi (sensibilit = 88%, speci cit = 88%) (Basco, Krebaum e Rush, 1997).
Propriet psicometriche e norme
Sorprendentemente, nonostante la sua lunga storia di impiego nella clinica e nella ri-cerca, esistono pochi dati relativi alle caratteristiche psicometriche di questo strumento.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
182
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Le norme del test furono inizialmente sviluppate su un campione di 56 pazienti psichia-trici ricoverati con una prima diagnosi di depressione: di questi, 31 furono trattati come disturbi depressivi e 25 ricevettero diagnosi diverse in una successiva valutazione. Tuttavia, importanti informazioni aggiuntive sono state fornite nello studio condotto da Gabrys e Peters (1985) su un campione di 587 pazienti, di cui 369 depressi e 218 non depressi, di et compresa tra i 12 e i 69 anni.
Attendibilit
La consistenza interna sembra adeguata, con un coefficiente split/half che varia da 0,79 a 0,94 e un _ di Cronbach di 0,82 nello studio pi ampio (Sakamoto, Kijma, Tomoda e Kambara, 1998), condotto su 2187 studenti universitari, riportato in tabella 2. Generalmente, essa oscilla tra 0,71 e 0,88 in altri studi (Knight, Waal-Manning e Spears, 1983; Gabrys e Peters, 1985; de Jonghe e Baneke, 1989).
Validit
Lesame della validit convergente mostra correlazioni da moderate a elevate con altri strumenti di depressione, come illustrato nella tabella 2 (Carroll, Fielding e Blashki, 1973; Faravelli, Albanesi e Poli, 1986; Plutchik e van Praag, 1987). Di contro, la validit discri-minante risulta molto pi sospetta: sebbene la Zung Self-Rating Depression Scale appaia distinguere tra depressi e soggetti normali, sia in psichiatria che in medicina generale (Gabrys e Peters, 1985; Thurber, Snow e Honts, 2002), essa meno capace di distinguere tra depressione e ansia (Di Marco et al., 2006) o tra diversi livelli di gravit del disturbo depressivo (Rabkin e Klein, 1987). In uno studio su un campione italiano di 140 soggetti normali (Innamorati et al., 2006), sono riportati, infatti, indici di correlazione di 0,70 con la scala per lansia dellInstitute for Personality and Ability Testing (IPAT), de nita pi speci camente Anxiety Scale Questionnaire (ASQ; Krug, Scheier e Cattell, 1976), e di 0,61 con la scala di contenuto ANX del MMPI-2 (Hathaway e McKinley, 1989), com possibile notare nella tabella 2.
La struttura fattoriale della scala stata oggetto di indagine in diverse culture, da quella olandese a quella giapponese, e ha portato allidenti cazione di un numero ampio di fattori, da uno a sette. Ad esempio, Sakamoto, Kijma, Tomoda e Kambara, (1998), in un campione di 2187 studenti universitari giapponesi, hanno trovato tre fattori che hanno interpretato come sintomi cognitivi, sintomi affettivi e sintomi somatici. Tale struttura stata supportata da una analisi fattoriale confermativa (Goodness of Fit Index, GFI = 0,92). Anche Kivelae e Pahkala (1987) hanno trovato tre fattori, che hanno, tuttavia, classi cato come Umore depresso, Perdita di autostima e Irritabilit e agitazione.
Utilit clinica e di ricerca
Gli studi condotti su questa scala inducono a ritenere che la Zung Self-Rating Depression Scale, a dispetto della sua popolarit nei paesi anglosassoni, non pu essere utilizzata come strumento per la misura della gravit della depressione o dei suoi cambiamenti nel corso del trattamento (Gotlib e Cane, 1989; Basco, Krebaum e Rush, 1997; Dozois e Dobson, 2002). Possiamo identi care i limiti della scala in quelli che seguono.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
183
1. Copertura parziale dei criteri del DSM-IV-TR per lEpisodio Depressivo Maggiore: sono inclusi solo 5 dei 9 criteri, mentre sono coperti da un solo item e, quindi, inadegua-tamente sondati i rimanenti 4 (anedonia, disturbi del sonno, sentimenti di inadeguatezza o di colpa eccessivi, idee e tentativi di suicidio).
2. Mancanza di univocit dei dati sulla validit (Mayer, 1977; Ponterotto, Pace e Kavan, 1989) e, quindi, una dubbia validit di costrutto. Schotte, Maes, Cluydts e Cosyns (1996) hanno contestato dal punto di vista empirico lassunto secondo cui gli item formulati in positivo e in negativo ri ettano lo stesso costrutto. In un campione di 338 depressi, infatti, gli stessi autori trovarono che il punteggio ricodi cato della Zung Self-Rating Depression Scale gon ava la media dei punteggi agli item. Inoltre, la maggior parte degli item formulati in positivo e in negativo presentava saturazioni salienti su diversi fattori. Sebbene questi risultati non siano stati trovati solo in questa scala, essi gettano dubbi sulla sua validit di costrutto come misura di sintomi depres-sivi. La struttura fattoriale sembrerebbe, infatti, identi care, almeno in parte, le polarit degli item del test piuttosto che valutare le componenti cognitive o psicomotorie della depressione (Dozois e Dobson, 2002).
3. Limitata capacit discriminativa tra i vari livelli di depressione.4. Scarsa validit discriminante (Dobson, 1985; Tanaka-Matsumi e Kaneoka, 1986;
Innamorati et al., 2006). Una possibilit di impiego di questa scala quale strumento di screening ne preve-
de luso in associazione con uno strumento psicometricamente pi raf nato, come il Beck Depression Inventory-II. Sebbene siano riportate alte correlazioni tra le due scale (Plutchik e van Praag, 1987), esse sembrerebbero fornire informazioni complementari: il Beck Depression Inventory-II si focalizza sullintensit dei sintomi depressivi, la Zung Self-Rating Depression Scale enfatizza la loro frequenza. Tuttavia, alcuni autori italiani (Innamorati et al., 2006) escluderebbero anche questa ipotesi, prevedendone il ritorno nelloblio senza rimpianti (Sanavio, 2006).
Clinical Depression Questionnaire (CDQ)
Il Clinical Depression Questionnaire (CDQ; Krug e Laughlin, 1976), altrimenti de nito IPAT Depression scale, conserva unimportanza essenzialmente storica, dato che trova il suo progenitore (Krug e Laughlin, 1976) in un test importante, quale il Clinical Analysis Questionnaire (CAQ; Delhees e Cattell, 1975), a sua volta costituito da una forma abbre-viata del Questionario dei 16 Fattori della Personalit (16 PF; Cattell, Eber e Tatsuoka, 1970) e da 12 scale per la valutazione di tratti patologici, di cui 7 rispecchiano altrettanti fattori di depressione, correlati tra loro, e 5 corrispondono a fattori clinici scoperti da Cattell e Bolton (1969).
Attraverso unaccurata fusione di due strategie di costruzione dei test (lanalisi fattoriale e il metodo empirico dei gruppi contrapposti), furono selezionati 36 item, che dimostrarono uneccellente validit per la misura del fattore puro della depressione. Tuttavia, dato che nel corso della selezione degli item si and formando un sotto-raggruppamento di item
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
184
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
connessi allansia, e data la correlazione di circa 0,80 con lASQ (Krug, Scheier e Cattell, 1976), in linea con lesperienza clinica che da sempre confermava la stretta connessione tra i sintomi dellansia e della depressione, fu inserito un fattore di correzione, costituito da quattro item moderatori che presentavano correlazioni trascurabili con la depressione ed elevate con lansia, riducendo cos la correlazione tra il CDQ e lASQ e migliorando il potere discriminativo del CDQ.
La decisione di includere o no questi quattro item nel punteggio totale della depressione come fattore di correzione lasciata a chi fa uso del test: nel manuale del test, infatti, sono indicate le norme per entrambe le possibilit.
Propriet psicometriche e norme
Le norme sono basate su poco pi di 2000 casi, reclutati da oltre 60 localit diverse degli USA e del Canada. Il punteggio del soggetto viene confrontato con quello di un adulto normale di 30 anni di et circa. Sono state, inoltre, fornite norme per sei gruppi speciali (458 studenti universitari, 211 carcerati, 728 casi clinici la cui diagnosi principale non la depressione, 195 alcolizzati, 69 tossicomani) (Krug e Laughlin, 1976).
Attendibilit
Lattendibilit della scala, calcolata sui gruppi clinici di cui sopra, inclusi i 67 depressi, e su 632 adulti di controllo, alta, con stime di coerenza interna di circa .90 in media (Krug e Laughlin, 1976).
Validit
La validit del test stata esaminata sotto diversi aspetti. emersa una correlazione di circa 0,88 tra il punteggio del test e un fattore puro di depressione, in un campione di 1904 casi, composto da persone normali e da soggetti clinici. Lindagine sul potere discriminativo del test, ossia su come il test identi ca la differenza tra soggetti normali e soggetti depressi, ha chiarito che un punteggio sten di 8, 9 o 10 al test si veri ca allincirca da 4 a 30 volte pi spesso tra i depressi e tra i casi clinici piuttosto che tra i soggetti normali (Krug e Laughlin, 1976).
Utilit clinica e di ricerca
Sebbene il test abbia avuto unindubbia importanza storica, attualmente esso non pos-siede pi una validit pratica rispetto al criterio diagnostico, dato che successivamente i criteri per la diagnosi di depressione sono stati in parte modi cati, soprattutto con la pubblicazione delle pi recenti edizioni del Manuale Diagnostico e Statistico dei Disturbi Mentali. Ulteriori limiti del questionari sono i seguenti.
1. Il formato di risposta molto discutibile perch introduce esso stesso una fonte di va-riabilit non controllabile; 5 item richiedono una risposta corrispondente a: a) quasi sempre, b) qualche volta (o talvolta), c) quasi mai; 20 item richiedono una rispo-sta corrispondente a: a) vero, b) incerto, c) falso; un item richiede una risposta del tipo: a) s, b) forse, c) no.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
185
2. La validit di criterio dovrebbe essere sottoposta a ulteriori indagini, dato che, come riportato nella tabella 2, emerge una correlazione di entit modesta tra il CDQ e la scala D del Minnesota Multiphasic Personality Inventory (r = 0,31, n.s.), comunque pi bassa di quella ottenuta con altre scale del MMPI, quali Deviazione Psicopatica, Psicastenia, Schizofrenia e Introversione Sociale (Krug e Laughlin, 1976).
3. In Italia presente ladattamento a cura di Novaga e Pedon (1979), ma il campione di standardizzazione, che assomma a oltre 2000 casi, , tuttavia, statunitense e in parte canadese. Tuttavia, in uno studio recente (Ciof , Balsamo e Saggino, in corso di stam-pa), la scala stata sottoposta a un campione italiano di 240 studenti universitari, in cui stata valutata ladeguatezza di una versione con un formato di risposta a cinque alternative in luogo di tre.
SCALE INSERITE IN BATTERIE PSICODIAGNOSTICHE
Tracceremo ora un pro lo psicometrico delle scale self-report di depressione dispo-nibili in versione italiana, che fanno parte di batterie pi ampie, destinate a misurare la psicopatologia ad ampio spettro: il Questionario D della batteria Cognitive Behavioural Assessment 2.0 (CBA 2.0; Sanavio et al., 1997; Sanavio, 2002) e la scala D del MMPI (Hathaway e McKinley, 1940; 1942; 1989). Lutilizzo di una batteria ha evidenti vantaggi ai ni diagnostici.
Questionario D del Cognitive Behavioural Assessment 2.0
Il Questionario D stato costruito appositamente per essere inserito nella batteria Cognitive Behavioural Assessment 2.0 (Bertolotti et al., 1985; Sanavio, 2002), che un insieme di strumenti autodescrittivi utile per ottenere un primo screening su un ampio ventaglio di aree psicologiche disfunzionali (ansia, disturbi psico siologici, tratti di per-sonalit, ossessioni e compulsioni, sintomi depressivi) e per veri care lef cacia del-lintervento cognitivo-comportamentale. La batteria nata allinterno di un modello di assessment concepito come processo clinico-psicologico, integrato sia orizzontalmente (multidimensionale) sia verticalmente (organizzato gerarchicamente per approfondimenti successivi) (Mucciarelli, Chattat e Celani, 2002).
Il questionario, che costituisce la scheda 8 della batteria, misura manifestazioni disfo-riche e depressive di rilievo sub-clinico, di frequente associate con altri disturbi (Sanavio et al., 1997), attraverso 21 item, ispirati prevalentemente alle scale di Beck (Beck et al., 1961; Beck, Rush, Shaw ed Emery, 1979) e di Zung (1965), da cui sono stati sistemati-camente esclusi i contenuti psicosomatici, data la presenza di un apposito questionario nella stessa batteria.
Ogni item costituito da una serie di descrizioni che fanno riferimento a diversi aspetti del soggetto, disposti in ordine crescente di dif colt, e da un formato di risposta dicoto-mico (s/no). Bassi punteggi indicano lassenza di manifestazioni depressive; alti punteggi indicano, invece, lesistenza di una condizione disforica non necessariamente depressiva.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
186
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
Uno stato depressivo, inoltre, potrebbe essere secondario a numerosi altri disturbi sia di carattere medico che psicologico. Ci pu essere chiarito attraverso luso del colloquio e delle scale secondarie, tra cui il Beck Depression Inventore (Sanavio e Sica, 1999; Sanavio, 2002).
Propriet psicometriche e norme
Il Cognitive Behavioural Assessment 2.0 dispone di un campione normativo, aggior-nato nel 1992, che comprende pi di 2300 soggetti, divisi per sesso e per tre fasce det. Per la popolazione ultrasettantenne sono presentate norme separate che fanno riferimento a uno studio epidemiologico condotto su 583 anziani normali, divisi per sesso e cinque classi det (Della Sala e Zotti, 1994; Sanavio e Vidotto, 1996). Sono, inoltre, disponibili norme, divise per sesso e fasce det, relative a pi di 6000 pazienti ricoverati per trat-tamento riabilitativo nellarea cardiologica, pneumologica, neurologica/ siatrica, della tossicodipendenza, delle distonie e malattie professionali (Bertolotti, Michielin, Sanavio e Zotti, 1994).
Attendibilit
stata, successivamente, indagata la consistenza interna, risultata pari a 0,82, in un gruppo di riferimento formato da 1722 soggetti (87,6% maschi), di et compresa tra i 16 e gli 80 anni, appartenenti alla popolazione normale di tutto il territorio nazionale. Per la misura dellindice di fedelt test-retest, sono state effettuate due rilevazioni a 7 (0,88) e 30 giorni (0,72), su due gruppi di soggetti rispettivamente di 124 e 76 unit (Sanavio, 2002).
Validit
Il questionario stato sottoposto a una validazione preliminare su piccoli campioni, in base alla quale si caratterizza come una misura monofattoriale omogenea (_ = 0,86) e stabile (r = 0,88, a distanza di sette giorni, r = 0,72 a un mese), sensibile a variazioni di et (i punteggi medi tendono ad aumentare con let, in modo congruo con quanto noto dalla letteratura psicologica) e di genere (le donne hanno punteggi medi pi elevati) (Sanavio e Sica, 1999).
Per valutare la validit di costrutto dello strumento, i punteggi del Questionario D sono stati confrontati con quelli della versione italiana del Beck Depression Inventory in 46 pazienti psichiatrici depressi.
La correlazione tra i due strumenti risultata pari a 0,56, ovvero abbastanza forte da considerare il costrutto valido, e abbastanza bassa da permettere di concludere che lo stru-mento misura taluni aspetti che il Beck Depression Inventory non considera. Lesame della validit discriminante ha portato a rinvenire un falso positivo e tre falsi negativi, usando un cut off di 15 in un campione di 46 pazienti psichiatrici depressi (Bertolotti et al.,1990).
Utilit clinica e di ricerca
Lobiettivo che ha mosso il gruppo CBA verso la costruzione di una nuova scala di depressione nato dallesame dei limiti delle scale precedenti, individuati nelleccessiva
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
187
lunghezza, nella modesta utilit clinica e validit discriminante, nellinadeguata validazione sulla popolazione italiana, nella limitata utilit con popolazioni con depressione subclinica, nelle scarse traduzioni o nelluso limitato in Italia.
Il questionario D del CBA 2.0 effettivamente supera questi limiti, offrendo diversi altri vantaggi: il campione normativo italiano molto ampio, le norme speci che risultano un utile elemento di riferimento a chi applica la batteria in ambito ospedaliero, lo scoring computerizzato consente un notevole risparmio di tempo e risorse.
Il limite principale di questa scala in ambito clinico che il suo uso rientra allinterno della batteria completa, che richiede tempi di somministrazione piuttosto lunghi. Tuttavia, non infrequente luso, in ambito clinico, di una versione autonoma della scheda 8, che, unita alla scheda 2 (corrispondente allo State-Trait Anxiety Inventory per la misura del-lansia), nota con il nome di Scale A-D (per lo studio di validazione si veda Vedana et al., 2001).
Nei setting di ricerca lo strumento fornisce utili linee guida per un sistematico processo decisionale diagnostico, che ne incrementa sia la validit diagnostica che lattendibilit (Nezu et al., 2000).
Scala D del Minnesota Multiphasic Personality Inventory (MMPI)
La scala D corrisponde alla scala 2 del Minnesota Multiphasic Personality Inventory, sia nella prima edizione (MMPI-I; Hathaway e McKinley, 1940; 1942), sia nella seconda (MMPI-2; Hathaway e McKinley, 1989; Pancheri e Sirigatti, 1995) e non dovrebbe mai essere somministrata al di fuori dellintera batteria.
La procedura di costruzione della batteria consiste nel metodo orientato al criterio, in base al quale si scelgono gli item che discriminano uno o pi gruppi criterio (individuati clinicamente attraverso luso di categorie psichiatriche correnti) da quelli di controllo. Dunque, la logica per la scelta degli item non di tipo teorico, n intuitivo, bens prag-matico (Kline, 1993). La scelta degli item per costruire la scala D fu operata sulla base della loro capacit di discriminare tra pazienti psichiatrici con diagnosi di depressione, pazienti psichiatrici non depressi e due gruppi di soggetti normali. Nel MMPI-2, 3 item sono stati eliminati, cosicch la scala risulta composta da 57 item, che si riferiscono a disturbi dellumore, del pensiero, a sintomi psico sici, nonch ad aspetti di personalit di base riguardanti eccessivo senso del dovere, standard personali elevati e intrapunitivit. Nellinsieme, dei 9 criteri diagnostici del DSM-IV-TR, quello che riguarda idee o tentativi di suicidio non contemplato da nessun item e quello che si riferisce a variazioni nel peso corporeo e nellappetito de nito da un solo item.
Propriet psicometriche e norme
Il campione impiegato per la standardizzazione del Minnesota Multiphasic Personality Inventory-2 pi ampio e ben distribuito rispetto a quello originario, includendo 1138 maschi e 1562 femmine, divisi per area geogra ca, razza ed et. La taratura italiana si avvalsa di un campione di 1375 soggetti, di cui 403 maschi e 972 femmine, di et media
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
188
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
pari a 27 anni, con scolarit media pari a 12 anni. I punteggi grezzi sono stati trasformati in punti T, con media = 50 e DS = 10. In Italia, la versione computerizzata del Minnesota Multiphasic Personality Inventory-2, de nita MMPI-2 Panda, stata tarata su un campione di 2686 soggetti normali, di cui 1336 maschi e 1350 femmine, residenti in varie regioni italiane (De Fidio e Pancheri, 2007).
Attendibilit
Si tratta di una misura alquanto stabile (attendibilit test-retest 0,75 a distanza di una settimana). Secondo Anastasi (2002), invece, la scala valuta un comportamento cos variabile nel tempo da far apparire fuori luogo qualsiasi discorso sulla sua attendibilit (p. 656).
Validit
Le critiche alla validit riguardano vari aspetti e portano alla conclusione che la scala sia un dubbio indicatore di depressione (Ancona et al., 1985; Boncori, 1993). Per quel che riguarda il contenuto degli item, stato evidenziato sia il fatto che item di altre scale del MMPI sono indicatori altrettanto buoni di depressione (Calonghi e Espinosa, 1965), sia la loro eterogeneit allinterno della scala. Proprio sulla base di questa critica stata costruita la scala di contenuto depressione e apatia, composta di 28 item, di cui solo 10 presi dalla scala D. Secondo altri autori, questa scala misura non tanto uno stato patologico, quanto fattori di personalit (Mayer, 1977), il che potrebbe essere in rapporto con la sua modesta sensibilit agli effetti dei trattamenti farmacologici (McNair, 1974).
Recentemente, il problema della sensibilit e del potere predittivo della scala stato connesso alla sua mancanza di unidimensionalit. In uno studio recente (Chang, 1996), stata esaminata la struttura dimensionale sottostante della scala D del MMPI-2 sia con il modello di Rasch dicotomico (Rasch, 1960-1980) sia con lanalisi fattoriale in un campione di 2600 soggetti normali (dai 18 agli 84 anni). Sono emerse 2 sottoscale dal contenuto omogeneo, de nite depressione mentale e depressione sica. Tali metodologie di Rasch hanno fornito cos una base per una migliore comprensione della struttura sottostante.
Utilit clinica e di ricerca
In accordo con Nezu et al. (2000), riteniamo che sia lutilit clinica che di ricerca della scala siano limitate. Nella pratica clinica, il tempo richiesto per la somministrazione del-lintera batteria (composta da 567 item) e per linterpretazione di gran lunga superiore se raffrontato ai potenziali vantaggi offerti dallapplicazione della batteria stessa (Nezu et al., 2000).
Boncori (1993) suggerisce di interpretare i punteggi della scala, ponendoli in relazione con quelli di altre scale, magari ricorrendo a codici a 2 o 3 punte, che si sono rilevati ab-bastanza stabili. Nella ricerca il ricorso a questa scala generalmente subordinato alluso dellintera batteria, il cui metodo di costruzione presenta evidenti limiti strutturali, secondo Kline (1993). Infatti, la scelta dei gruppi criterio risente dellinattendibilit dovuta alla diagnosi psichiatrica, nonch allo scarso accordo rispetto a quali categorie andrebbero usate; la mancanza di signi cato psicologico delle scale cos costruite limita inoltre la
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
189
generalizzabilit dei risultati. Alla luce di queste obiezioni psicometriche, secondo Kline sarebbe stato meglio costruire un questionario fattorializzato completamente nuovo (1993, p. 499).
Pertanto, le elevazioni della scala D non sono facilmente interpretabili dato che la scala non ri ette un costrutto unidimensionale (Chang, 1996).
CONCLUSIONI
Sia i ricercatori sia i clinici dovrebbero conoscere bene le propriet psicometriche e lo sviluppo degli inventari self-report per la misura della depressione, in modo da essere consapevoli di quali aspetti possono non essere attendibilmente e validamente indagati attraverso lo speci co strumento di assessment usato (Endler, Macrodimistris e Kocovski, 2000).
Pi precisamente, dato che strumenti diversi misurano aspetti diversi della depressione (cognitivi, affettivi e siologici, ecc.), importante conoscere quali aspetti della depres-sione capace di identi care una scala e compensare appropriatamente gli aspetti che non sono stati indagati con luso di altri inventari di autovalutazione o con le domande di unintervista diagnostica.
Lautovalutazione della depressione presenta in s indubbi vantaggi, che vanno dalla velocit alla facilit di somministrazione, particolarmente importanti nella psicoterapia cognitivo-comportamentale, che include un periodico automonitoraggio (Nezu et al., 2000). Tuttavia, essa porta con s anche una serie di limiti, che tenteremo di sintetizzare qui di seguito.
1. La distribuzione dei punteggi totali delle scale self-report ha evidenziato che quasi tutte hanno una distribuzione unimodale. Tuttavia, mentre le scale di eterovalutazione mostrano unasimmetria verso sinistra, le scale di autovalutazione, eccetto il Beck Depression Inventory, sono sbilanciate verso destra (Faravelli, Albanesi e Poli, 1986). La ragione di ci pu risiedere in due ordini di fattori: a) il paziente tende mediamente a fornire una valutazione cognitiva del suo stato emotivo e della sua condizione come pi grave rispetto alla valutazione obiettiva effettuata da un osservatore esterno, in quanto ha come unico riferimento le proprie precedenti esperienze interne, a differenza dello psichiatra che lo valuta in relazione ad altri casi con cui venuto a contatto; b) la depressione una condizione che porta il paziente al peggiore pessimismo, in cian-done le capacit critiche, per cui il proprio stato attuale vissuto generalmente come la condizione peggiore possibile. Non a caso, quando il paziente non costretto da ancoraggi precisi, tende a posizionarsi nella fascia di gravit estrema (Conti, Ruggeri e Faravelli, 1999).
2. Inadeguatezza dei criteri e del metodo di scoring: opportuno che una scala self-report preveda criteri di scoring ben de niti; in questo senso, il Beck Depression Inventory si rivelato superiore alle altre scale di autovalutazione, risultando lunica fra le scale di questo tipo a correlare abbastanza bene con le misure di valutazione del clini-co (Faravelli, Albanesi e Poli, 1986). Inoltre, il metodo tradizionale di scoring delle
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
190
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
scale di autovalutazione della depressione prevede luso del punteggio grezzo totale (dato dalla somma algebrica dei punteggi ai singoli item) come indice di gravit della depressione. Questo metodo risulta incongruo, in quanto il punteggio assunto come diagnostico deriva anche da sintomi presenti a livelli di frequenza o di gravit tali che non sarebbero stati presi in considerazione da unintervista diagnostica, che prende in considerazione per la diagnosi solo sintomi che vanno da un certo livello di gravit in poi (Zimmerman, 1983). In questo senso, il punteggio totale esprimerebbe pi la per-vasivit del quadro clinico che non la sua gravit. Inoltre, questo metodo pu rivelarsi fallace poich si basa su una serie di assunzioni che potrebbero essere false (Gibbons, Clark, Von Ammon Cavanaugh e Davis, 1985): a) attribuendo lo stesso peso a ogni item, si assume che ogni item o sintomo su una scala rappresenti un uguale livello di gravit psichiatrica, laddove ci si veri ca raramente. Alcuni sintomi sono presenti solo nei pazienti pi gravemente depressi, mentre altri si trovano sia in pazienti con bassi livelli di depressione che in quelli con alti livelli di depressione; b) si assume che ogni sintomo sulla scala sia ugualmente correlato con la dimensione clinica di interesse. In realt, alcuni sintomi possono discriminare bene tra individui depressi e non, mentre altri possono essere correlati a un fenomeno differente, come una malattia sica; c) il confronto dei punteggi totali tra popolazioni diverse (ad esempio, i punteggi del Beck Depression Inventory in pazienti con disturbi sici e mentali) assume che i singoli item abbiano caratteristiche identiche nei diversi campioni. Un sintomo che discrimina atten-dibilmente livelli alti e bassi di depressione nei pazienti psichiatrici pu non essere un reale discriminante di livelli alti e bassi di depressione in pazienti con disturbi sici.
Dunque, dal punto di vista teorico, luso dei punteggi totali sotteso da una logica molto carente, non dissimile da quella che muove un geografo a valutare una determinata area geogra ca sommando il numero degli abitanti, la lunghezza dei umi e laltezza delle montagne (Conti, Ruggeri e Faravelli, 1999). Da un punto di vista pratico, una diminu-zione dei sintomi accessori, che pu ottenersi per un insieme di fattori del tutto aspeci ci, si ri ette in una diminuzione del punteggio totale, dando lillusione di un miglioramento clinico anche quando i sintomi nucleari rimangono inalterati (Conti, 2002).
Daltra parte, occorre considerare che nella prassi ladditivit dei punteggi porta a risultati meno astrusi di quanto non sia lecito attendersi in base alle considerazioni teoriche. Il pi delle volte, infatti, limpressione clinica sostanzialmente concorde con il punteggio globale di una scala di valutazione, probabilmente perch anche i nostri comuni atti di giudizio sono in buona parte additivi (Poli e Faravelli, 1981).
Quindi, se appare improponibile luso del punteggio totale di una rating-scale come termometro psichico per caratterizzare un paziente, possibile che tale punteggio possa avere una certa validit nel caratterizzare un gruppo. Ad esempio, il dato che in una certa ricerca il campione presenta una media X e una DS Y a una data scala, probabilmente contiene pi informazioni per il lettore che abbia pratica di quella scala che il sapere che i pazienti erano moderatamente gravi (Poli e Faravelli, 1981).
3. Scarsa validit di contenuto, se si usa come criterio la diagnosi di Episodio Depressivo Maggiore del DSM-IV-TR. In effetti, come sostengono Clark, Beck e Alford (1999),
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
191
se davvero esiste un insieme di sintomi unanimamente considerati caratteristici della depressione sia dagli psicologi che dagli psichiatri, questo il gruppo dei sintomi che caratterizza lepisodio depressivo maggiore (p. 2).
4. Mancanza di omogeneit nei contenuti delle varie scale, che, ri ettendo le diverse teorie degli autori che le hanno costruite, misurano aspetti diversi dello stesso costrutto. Questo dato emerge da molteplici fonti: a) losservazione del peso relativo assegnato alle singole componenti del quadro depressivo nelle diverse scale di valutazione evidenzia unestrema difformit tra esse, come emerge nello studio di Faravelli, Albanesi e Poli (1986), in cui vengono confrontate sei scale di valutazione della depressione, di cui quattro autocompi-late. Ad esempio, i sintomi nucleari della depressione, nel loro insieme, pesano fra il 40 e il 50% nellHamilton Rating Scale for Depression, circa il 70% nella Zung Self-Rating Depression Scale e oltre il 70% nel Beck Depression Inventory; b) la bassa concordan-za tra i punteggi totali delle diverse scale evidenzia ancora di pi questo fenomeno. I coef cienti rinvenibili in letteratura variano tra 0,14 e 0,77: pur presumendo di misurare la stessa entit, nel migliore dei casi due scale di depressione avrebbero solo il 59% della varianza comune (Conti, Ruggeri e Faravelli, 1999); c) lanalisi fattoriale, tecnica statistica multivariata che permette di individuare le dimensioni comuni a un insieme di variabili, applicata allo studio della struttura interna delle singole scale self-report, ha evidenziato differenze considerevoli tra i vari strumenti, ad ulteriore dimostrazione che concezioni diverse della depressione stanno alla base delle differenti scale. Questo limite renderebbe luso di una scala di depressione in luogo di unaltra tuttaltro che irrilevante, con la possibilit di ottenere risultati diversi e limpossibilit di generalizzare i risultati da uno studio allaltro (Endler et al., 2000).
5. Mancanza di controllo del response set della desiderabilit sociale. Una controversia importante riguardante luso degli inventari di autovalutazione consiste nella loro fal-si cabilit e nel rapporto con la desiderabilit sociale (Conoley, 1978; Arbisi, 2001; Wood, Garb, Lilienfeld e Nezworski, 2002). La tipica facilit di somministrazione li espone, infatti, a uno stile deliberato di risposta e alla distorsione dei risultati. Gi Davis (citato in Beck, Steer e Garbin, 1988) riferiva che i pazienti dei reparti di sa-lute mentale sono in grado di descriversi come depressi o non depressi a seconda del setting di valutazione. La cautela , dunque, imperativa nelluso di tali strumenti con persone che potrebbero desiderare di nascondere le proprie intenzioni suicide o, di contro, sovrastimare la loro depressione (Conoley, 1978). Per giunta, come dimostra Schwartz (1999), nellinteressante lavoro Self-reports: how the questions shape the answers, le differenze pi piccole nel formato del questionario, incluso lordine degli item, potrebbero in uenzare sostanzialmente non solo i livelli medi di risposta agli item, ma anche le intercorrelazioni tra gli item.
6. Inapplicabilit in popolazioni di depressi gravi: in una ricerca di Faravelli, Albanesi e Poli (1986), 24 dei 100 pazienti con diagnosi di Episodio Depressivo Maggiore secondo i criteri del DSM-III (APA, 1980), cui sono state somministrate sei scale self-report di depressione, non sono stati in grado di completare autonomamente i questionari per dif colt di comprensione e/o per mancanza di collaborazione. Dunque, se la praticit
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
192
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 2007
duso delle scale self-report maggiore in certi casi (ad esempio, screening di massa, casi ambulatoriali), essa si riduce drasticamente rispetto alle scale di eterovalutazione nel caso di pazienti gravi in degenza ospedaliera.
7. Scarsa validit discriminante rispetto allansia. Come riportato nella review di Dobson (1985), gli indici di correlazione tra i diversi strumenti per la misurazione della depres-sione e dellansia sono elevati, aggirandosi intorno a 0,61. Ci potrebbe essere attribuito al fatto che le scale di depressione misurano un fattore depressivo generale di ordine pi elevato e diversi fattori speci ci di ordine inferiore, alcuni dei quali condividono parte della loro variabilit con la sintomatologia ansiosa.
8. Problematiche relative alla standardizzazione e alla validazione di strumenti tradotti da una lingua allaltra (Fava, 1983; Behling e Law, 2000). Ladattamento di una scala, che ha per oggetto di misura una dimensione soggettiva e complessa della patologia psichica come la depressione, presuppone: a) la risoluzione di problemi metodologici di ordine semantico, relativi alle dif colt di traduzione, che rendono necessario procedere ad accurate back-translations, per veri care se stato realmente colto il signi cato originale del costrutto misurato dallo strumento nei suoi aspetti pi sottili; b) la neces-sit di effettuare studi di standardizzazione e validazione, con le dovute modi che da effettuare per rendere la scala compatibile con la realt socio-culturale con cui si va a confrontare, date le note differenze transculturali nella misura della depressione (ad esempio, Crittenden et al., 1992; Zung, 1972).
Tra gli strumenti attualmente pi diffusi nel nostro Paese non vi nessuna misura di depressione singola (ovvero non inserita in questionari pi ampi) nata nel contesto italiano che abbia raggiunto un ampio impiego nella ricerca e/o nella clinica. Inoltre, se si eccettuano quelle incluse in batterie pi ampie, nessuna di quelle tradotte da altre lingue presenta un manuale vero e proprio delladattamento italiano.
Proprio per colmare questa lacuna, attualmente siamo impegnati in un progetto di ricerca che prevede la costruzione di un nuovo inventario self-report di depressione, che tenter di superare i limiti psicometrici di quelli gi esistenti, e che verr adattato e standardizzato sulla popolazione italiana (Balsamo, 2006).
Lobiettivo generale di questo lavoro sar quello di costruire uno strumento di misu-razione dellentit della depressione negli adulti che garantisca al clinico facilit e velocit duso e che sia, al tempo stesso, raf nato dal punto di vista psicometrico, cio il pi possibile valido e attendibile.
A partire dai limiti summenzionati delle scale gi esistenti, stiamo mirando a costruire uno strumento che si dovrebbe con gurare come nuovo essenzialmente per tre caratte-ristiche peculiari: a) copertura dellintero spettro sintomatologico previsto dal DSM-IV-TR per la diagnosi di depressione maggiore e della relativa durata della sintomatologia; b) analisi degli item attraverso un modello di Item Response Theory; c) controllo del response set della desiderabilit sociale.
La presentazione dei risultati preliminari di questo progetto, attualmente in corso, esula dagli scopi del presente lavoro e, pertanto, sar auspicabilmente fornita in un prossimo articolo.
Edizioni Erickson Copia concessa allautore. Ogni riproduzione o distribuzione vietata
M. Balsamo e A. Saggino Test per lassessment della depressione nel contesto italiano: unanalisi critica
193
American Psychiatric Association (2000). Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition, Text Revision. Washington, DC: Author. Tr. it. DSM IV-TR; Manuale Diagnostico e Statistico dei Disturbi Mentali. Milano: Masson, 2001.
Anastasi, A. (2002). I test psicologici. Milano: Franco Angeli.Ancona, M., Torre, E., Jaretti Sodano, A., De Lorenzo, C. e Matta, F. (1985). LInventario della
Depressione di Beck nella ricerca in psicosomatica. Minerva Psichiatrica, 26, 41-45.Antony, M.M., & Barlow, D.H. (2002). Handbook of assessment and treatment planning
for psychological disorders. New York: the Guilford Press.Arbisi, P. (2001). Review of the Beck Depression Inventory-II. In B.S. Plake & J.C. Impara
(Eds.), The fourtheen mental measurements yearbook (pp. 452-468). Lincoln, NE: Buros Institute of Mental Measurements.
Balsamo, M. (2006). Costruzione di un nuovo strumento self-report di depressione. Tesi di Dottorato, Universit G. dAnnunzio di Chieti-Pescara, a.a. 2006-07.
Basco, M.R., Krebaum, S.R., & Rush, A.J. (1997). Outcome measures of depression. In H.H. Strupp, L.M. Horowitz e M.J. Lambert (Eds.), Measurement patient changes in mood, anxiety, and personality disorders: toward a core battery (pp. 191-245). Wash-ington, DC: American Psychological Association.
Beck, A.T. (1991). Cognitive therapy: a 30-year retrospective. American Psychologist, 46, 368-375.
Beck, A.T., Ward, C.H., Mendelson, M., Mock, J., & Erbaugh, J. (1961). An inventory for measuring depression. Archives of General Psychiatry, 4, 561-579.
Beck, A.T.