TEORIA E METODO 1 · 2019. 11. 19. · 11 vita, trascurando così a piè pari la complessità semantica del concetto. Viene così a rompersi la struttura “a diamante” pro-pria

TEORIA E METODO

1

Direttore:Maurizio Bonolis (Università “Sapienza” di Roma)Enzo Campelli (Università “Sapienza” di Roma)

Comitato Scientifico:Stella Agnoli (Università “Sapienza” di Roma)Sandro Bernardini (Università “Sapienza” di Roma)Antonio Fasanella (Università “Sapienza” di Roma)Giuseppe Giampaglia (Università “Federico II” di Napoli )Carmelo Lombardo (Università “Sapienza” di Roma)Mauro Palumbo (Università di Genova)Roberto Vignera (Università di Catania)

Stefano Nobile

LA CHIUSURA DEL CERCHIOLa costruzione degli indici

nella ricerca sociale

BONANNO EDITORE

Proprietà artistiche e letterarie riservateCopyright © 2008 - Gruppo Editoriale s.r.l.

ACIREALE - ROMA

www.bonannoeditore.com - [email protected]

In memoria di Chiara

(1967-2006)

7

INDICE

Introduzione pag. 9

CAPITOLO ILA SINTESI DEI DATI COME PROBLEMA METODOLOGICO ,, 23

I.1. L’euristica della sintesi dei dati ,, 23I.2. Le distorsioni nella sintesi dei dati ,, 25

CAPITOLO IIGLI INDICI TIPOLOGICI ,, 41

II.1. Premessa ,, 41II.2. La riduzione di uno spazio di attributi ,, 42II.3. L’impiego dei giudici nella classificazione ,, 59

CAPITOLO IIIGLI INDICI MATEMATICI ,, 69

III.1. Gli indici additivi ,, 69III.2. Gli indici logaritmici ,, 84III.3. Gli indici fattoriali ,, 96

CAPITOLO IVPROBLEMI APERTI ,, 103

Bibliografia ,, 115

9

INTRODUZIONE

Il cosiddetto “paradigma lazarsfeldiano”, per quanto discusso(Cfr. Cannavò, 1983), è entrato ormai da decenni nella “casset-ta degli attrezzi” dei sociologi. Esso riassume, in termini di ope-razioni, le fasi determinanti della costruzione del dato empirico,vera pietra angolare del più complesso edificio della ricercasociale. L’individuazione e la definizione dei concetti inerenti alproblema d’indagine, la rappresentazione “figurata” degli stessi,la rilevazione delle loro “componenti” o “dimensioni”, l’indivi-duazione degli indicatori idonei a rappresentare tali dimensionie infine la ricomposizione delle variabili ottenute dall’operativiz-zazione degli indicatori in misure sintetiche (indici) sono i quat-tro momenti attraverso i quali deve snodarsi, stando appunto aidettami del modello di Lazarsfeld, una corretta e attenta tradu-zione empirica dei concetti impiegati nella ricerca (quanto menoin occasione dell’impiego di tecniche “hard”).

A dispetto della loro importanza, tuttavia, i quattro momen-ti del paradigma lazarfeldiano non hanno goduto tutti dellamedesima attenzione, né hanno richiamato un dibattito di pariforza. Mentre infatti la fase di concettualizzazione e quella dell’in-dividuazione degli indicatori, ossia tutta quella riconducibile alladinamica del passaggio dal concetto agli indicatori, è stata ogget-to di un dibattito serrato, che non ha mancato di produrre signi-ficativi contributi anche in Italia (Cfr. Cartocci, 1984; Ricolfi,1992; Lombardo, 1994 e 1995; Marradi, 1994; Cannavò, 1995 e1999), la fase della sintesi dei dati è stata invece circoscritta a

10

pochi, rarefatti interventi, collocati più sul versante della confu-tazione delle aporie della proposta lazarsfeldiana (Cannavò,1983; Fasanella, 1999) che non su quello dell’approfondimentodelle implicazioni metodologiche che detta fase può comporta-re. In qualche caso, le escursioni nel territorio delle tecniche dicostruzione degli indici hanno riguardato specifiche procedure,come per esempio quella dell’analisi in componenti principali(Di Franco e Marradi, 2003).

Questo squilibrio nell’attenzione posta sulle diverse fasi delmodello di Lazarsfeld da una parte ha delle ripercussioni sullaricerca e dall’altra delle spiegazioni possibili.

Rispetto alle ripercussioni sulla ricerca, va subito fatta luce suun effetto paradossale: quello di non chiudere il cerchio del pro-cesso di operativizzazione. Non è raro imbattersi in indaginiempiriche nelle quali, a fronte di un complesso ed elaborato per-corso di concettualizzazione e di individuazione degli indicatori,non corrisponde una altrettanto accurata procedura di costru-zione degli indici. In alcuni casi, i più frequenti dei quali si ritro-vano nelle tesi di laurea ma che non è raro rintracciarne anche inlavori blasonati, il processo di operativizzazione viene letteral-mente spezzato: la traduzione del concetto in una sintesi sulpiano empirico viene tralasciata. Incapace di condurre a terminel’orazione, al ricercatore (o allo studente) non resta che affidarsia una sorta di sineddoche operativa: la parte (la singola variabile,quella che sembra più idonea a indicare il concetto di partenza)viene usata per il tutto (cioè per l’indice finale), con conseguen-te sacrificio di tutte quelle altre variabili frutto del processo dioperativizzazione. Può accadere cioè che le successive fasi dianalisi dei dati, dalle semplici distribuzioni di frequenza all’ana-lisi bivariata fino a quella multivariata, anziché utilizzare la varia-bile indice che dovrebbe rappresentare la “traduzione” del con-cetto sul piano empirico, vengano assegnate a singole variabili,alle quali è demandato il compito di rappresentare il concetto intoto. Per fare un esempio, è come se – volendo lavorare sul con-cetto di qualità della vita urbana – si utilizzasse il numero diposti letto per ogni 1000 abitanti, trascegliendo questo tra i mol-tissimi indicatori che possono definire il concetto di qualità della

11

vita, trascurando così a piè pari la complessità semantica delconcetto. Viene così a rompersi la struttura “a diamante” pro-pria del processo di operativizzazione riportata in figura 1:

Figura 1 – La struttura “a diamante” del processo di operativizzazione

dal concetto (C) si passa alle dimensioni (D) e da queste agliindicatori (i11, i12, …, inn) che vengono a loro volta trasformati invariabili (v11, v12, …, vnn). Ed è a questo punto che il processo –che dovrebbe passare per la costruzione di supervariabili (SV)1

e da queste all’indice finale, rischia di spezzarsi. Le conseguenzesono esiziali: se da una parte l’arrestare il processo di operativiz-zazione alla sola (o alle sole) variabili che sembrano meglio rap-presentare il concetto di partenza comporta un inutile dispendiodi energie, dall’altra ciò determina una rappresentazione moncadel concetto stesso, con ovvie conseguenze sul piano dell’inter-pretazione dei risultati.

Sul versante teorico, come si accennava, il disinteresse neiconfronti delle tecniche di costruzione degli indici può esserericondotto a più d’una ragione. La ragione forse più rilevante sta

1 Questo passaggio intermedio in realtà dipende – come vedremo meglio inseguito – dalla tecnica di costruzione degli indici utilizzata.

12

nel fatto – come avverte Marradi (2007, p. 182) – che la costru-zione di un indice “è il passo più difficile dell’intera ricerca socia-le che segue l’approccio standard”. Come vedremo in seguito, laprocedura per la costruzione di un indice può anche essere sta-bilita per via del tutto astratta ma può imboccare strade affattodiverse a seconda della natura delle variabili che contribuisconoa definire l’indice. La difficoltà insita in questo percorso e l’as-senza di una procedura univoca può certamente avere contribu-to a disincentivare il perfezionamento delle diverse procedure dicostruzione degli indici nella ricerca empirica. Non solo: comevedremo in seguito con alcuni esempi, lo sforzo di cercare una“via maestra” a tutti i costi ha in alcuni casi, nell’ambito dellaricerca empirica, prodotto delle autentiche aberrazioni con ine-vitabili ricadute sulla qualità del dato.

Una seconda ragione può essere individuata nel fatto che laformazione disciplinare dei sociologi, vicina ad una solida tradi-zione filosofica, può avere facilitato i tentativi di incursione diquesti ultimi sui terreni dell’epistemologia e della gnoseologia,terreni propri di problemi del genere “giunto concetto → indi-catore”. A corollario di ciò – come segnala Fideli (2001, p.124)– l’attenzione di metodologi ed epistemologi “si è concentratasul livello degli asserti e delle loro relazioni piuttosto che su quel-lo dei concetti e degli strumenti concettuali più complessi (clas-sificazioni, tipologie, tassonomie)”, ovverosia sulle operazioni disintesi dei dati.

Una terza ragione va ricercata nella relativa consistenza – cheva lentamente colmandosi da circa un trentennio – dall’arsenalealgebrico-matematico dei sociologi. Già nel lontano 1972Capecchi si esprimeva a tale proposito in modo lapidario: “nellamaggior parte delle ricerche empiriche […] si può osservare […]una scarsissima propensione alla sintesi dei dati in base a model-li matematici” (Capecchi, 1972, p. 62). Una certa riottosità neiconfronti della matematica ha dunque sovente fatto sorvolare lacomunità sociologica sulle implicazioni euristiche delle opera-zioni di sintesi dei dati, ossia – come si diceva – di quella trascu-rata fase del paradigma di Lazarsfeld. Da ciò deriva che proba-bilmente proprio il tipo di operazioni logico-matematiche che

13

presiedono alla fase di sintesi dei dati (classificazioni, tipologie,indici, tassi) potrebbe avere legittimato una maggiore disinvoltu-ra nell’accettazione acritica della realizzazione di questo passag-gio cruciale della ricerca. In altri termini, parafrasando un luogocomune, de mathematica non disputandum est e quindi le operazioniatte a sintetizzare i dati della ricerca sono state dirottate su unautomatismo meccanico e talvolta acritico che non di rado hamesso e mette a repentaglio quanto di buono viene realizzatodurante le altre fasi della ricerca empirica.

Osservando la manualistica esistente, infatti, non si fatica arilevare una certa superficialità sull’argomento, anche di marcastatunitense2, ossia in un contesto tradizionalmente più sensibi-le di quello europeo alle questioni di natura tecnica. Ciò stupiscetanto più quanto più si pensa che proprio dall’altra partedell’Atlantico si sono prodotti i più vistosi balzi in avanti sul ter-reno della costruzione del dato empirico su base matematica.

Uno sguardo alle ricerche empiriche non produce effetti piùconfortanti: al gruppo di ricercatori, che con caparbietà siavventurano sugli incerti sentieri del calcolo, mettendo allaprova tecniche complesse e di non sempre facile lettura e pas-sando per un’attenta valutazione delle operazioni di sintesi chead esse presiedono, fa da contraltare una vasta schiera diimprovvisati alchimisti che credono di arrivare alla base aureadella conoscenza empirica passando per un’applicazione manie-rata ed elementare delle tecniche di sintesi dei dati.

La conseguenza di questo secondo tipo di comportamento èche l’assoluta permeabilità a critiche di natura statistico-metodo-logica di ricerche così realizzate erode e sgretola quella dignitàprofessionale che la sociologia faticosamente si è andata guada-gnando, fornendo al tempo stesso nuova linfa ai detrattori dellescienze sociali, che proprio nella vulnerabilità dei risultati trova-no uno dei fianchi più deboli sui quali ‘lavorare’ i sociologi,

2 In questa direzione, negli Stati Uniti si è sempre manifestata una particolarepredisposizione alla formalizzazione della sociologia, imputabile probabilmente auno spirito maggiormente pragmatico degli americani, in contrapposizione a unatradizione europea più legata alla tradizione filosofica e per questo orientata alladiscussione di altri temi.

14

dimenticando che le stesse difficoltà sono insite in tutte le“scienze dei sistemi” (Cannavò, 1999, p.13).

Accanto alle tre ragioni appena esposte, ce n’è un’altra che hapresumibilmente contribuito a concedere scarsa attenzione aquest’ambito di riflessione: la vieta querelle tra qualità e quantità.Il riconosciuto pedigree teoretico di autori come Mead, Blumer,Garfinkel, Schutz, Goffman e altri ancora, tutti riconducibili avario titolo ad alcune posizioni metodologiche della sociologiacomprendente di Max Weber, ha in qualche modo messo in sog-gezione l’operato di chi – in presenza dei continui ammonimen-ti contro la quantofrenia dissennata che da quella sponda dellasociologia pervenivano frequentemente – avrebbe forse intrapre-so la strada della conciliazione tra qualità e quantità. L’imbarazzoe lo smarrimento suscitati dalla crociata vigorosamente sostenu-ta dai paladini della cosiddetta ‘sociologia qualitativa’ ha prodot-to un vero e proprio evitamento delle problematiche riconduci-bili al nesso inscindibile tra qualità e quantità, problematiche cheproprio nel problema del ‘qualificare quantificando’ (e viceversa)trovano uno dei loro punti di maggiore interesse.

Non entreremo nel merito di un dibattito che anche in Italiaha avuto un’eco ragguardevole (basterebbe pensare ai contribu-ti di Marradi, 1980 e 1996; Cassano, 1983; Statera, 1984; DalLago, 1987; Ferrarotti, 1989; Campelli, 1996; Cannavò, 1989;Ferrarotti, 1989; Leonardi, 1991; Agnoli, 1994; Cipriani eBolasco, 1995; Cipolla e De Lillo, 1996; Capecchi, 1996; Cavalli,1996; Delli Zotti, 1996; Agodi, 1996 e 1999; Ricolfi, 1997;Chiesi, 2002; Corbetta, 2003). Gli esempi di come la quantitàpossa “trasformarsi” in qualità – e viceversa – sono virtualmen-te infiniti: se pensiamo alle qualità cromatiche come lunghezze(= misurazione = quantità) d’onda, ne abbiamo soltanto uno deipossibili assaggi. Come mostra lucidamente Leonardi (1991,p.19), il rapporto tra qualità e quantità “o è di complementarie-tà, nel senso che denota punti di vista analitici convergenti in unapprezzamento che resta semanticamente unitario; ovvero è un rap-porto di sinonimie fra espressioni linguistiche equivalenti in rela-zione al significato del denotatum” (corsivo nel testo).

Facendo sostanzialmente leva su ragioni di ordine ideologico,

15

la demonizzazione della quantificazione e della misurazionenelle scienze sociali è così andata a detrimento di un possibileapprofondimento dei problemi in questione, allontanando daquesti problemi quella fetta di sociologi che – vuoi per apparte-nenza alla nouvelle vague antimetodologica (Statera, 1984), vuoiper timore degli ostracismi della comunità scientifica – hannobandito dal loro campo di interessi le questioni legate ai proble-mi della misurazione nelle scienze sociali.

Per tutte queste ragioni, è opportuno (ri)vitalizzare il dibatti-to sull’operazione di sintesi dei dati, facendo comunque tesorodell’indicazione dello stesso Lazarsfeld, secondo il quale “lascienza sociale deve rimanere, più che una procedura sistemati-ca, meccanica, un’arte” (Lazarsfeld, 252). Perciò, nelle pagineche seguono si cercherà di dare conto delle diverse sfaccettaturedelle operazioni di sintesi dei dati, analizzandone le implicazionimetodologiche, quelle euristiche, le difficoltà procedurali e lepossibili soluzioni a problemi di natura idiografica. Naturalmente,verrà tenuto conto del fatto che, come avverte Statera (1990, p.109), “il processo di articolazione dei concetti in dimensioni e diqueste in indicatori e indici riveste comunque un carattere diarbitrarietà” e che pertanto non esiste una sola via, unica ed inde-fettibile, che porti ad una corretta costruzione degli indici (comedegli indicatori o delle dimensioni concettuali, del resto) ma checertamente è possibile seguire degli accorgimenti e delle strate-gie che limitano la dispersione d’informazione che talvolta costi-tuisce l’alto prezzo da pagare nell’applicazione di tecniche ecces-sivamente corrive.

Questo scritto si prefigge quindi il compito di fornire al ricer-catore, allo studente che voglia approfondire le proprie conoscen-ze tecniche di ricerca empirica o anche al semplice curioso di scien-ze sociali che si voglia avventurare sul sentiero della ricerca empi-rica, alcune indicazioni relative a quali strategie possono essereadottate a seconda delle circostanze. Rimangono invece sulle quin-te di questo lavoro le implicazioni di ordine gnoseologico ed epi-stemologico, relative al senso e all’opportunità di ‘fabbricare indi-ci’, alla fondatezza del paradigma lazarsfeldiano, ai problemi di vali-dità e di attendibilità degli indicatori e a quelli della costruzione del

16

dato, tutte questioni che il lettore potrà comunque approfondirecon altre letture (Kuder e Richardson, 1937; Cronbach, 1943 e1947; Zetterberg, 1954; Boudon e Lazarsfeld, 1958; Marradi, 1976,1988, 1990 e 1992; Carmines e Zeller, 1980; Pawson, 1980;Cannavò, 1983; Ammassari, 1984; Kirk e Miller, 1986; Ricolfi,1992; Tomaselli, 1993; Lombardo, 1994; Nobile, 1997; Vardanega,1997 e Marradi, 2007).

Come accade per altri concetti di ordine metodologico, anchequello di indice soffre di una certa dose di ambiguità. Rimettendosiproprio alle indicazioni di Lazarsfeld, l’indice è l’esito della defini-zione operativa di un concetto. Ne deriva che, a ragione, potremoparlare di indici tanto quando questi provengono da un solo indi-catore, quanto nei casi in cui essi derivano da una molteplicità diindicatori. In entrambi i casi, stando ancora al lessico lazarsfeldia-no, parleremo dunque di indici. Il concetto di indice simbolizzaallora il caso più generale di trasformazione – mediante operazio-ne – di un concetto e può derivare da uno o più indicatori. Sicché,se facciamo riferimento a “concetti semplici rappresentati da unasola proprietà/indicatore la variabile/indicatore e la variabile/indi-ce coincidono” (Agnoli, 1994, p.164), mentre quando mettiamoinsieme l’informazione derivante da più indicatori, otterremo unasorta di super-variabile che richiama concettualmente ciò cheLazarsfeld e Barton (1951, p.253) chiamano “giudizio complessivo”.Tutto ciò si riverbera in maniera differente sulla matrice dei dati:nel caso in cui un indice derivi da un unico indicatore, opportuna-mente operativizzato in variabile, la matrice dei dati non presente-rà alcuna aggiunta. Viceversa, quando l’indice deriva dalla “fusio-ne” di più indicatori, allora troveremo nella matrice dei dati un vet-tore colonna che riporterà, per ciascuna unità, il relativo punteg-gio-indice, stimando appunto il “giudizio complessivo” che si èvenuto a formare dalla sintesi di più indicatori.

È di questo “giudizio complessivo” che ci occuperemo in que-ste pagine, ossia di quali strategie possano attuarsi per realizzare lasintesi in indici di più indicatori.

La questione potrebbe essere affrontata da diversi punti divista (Galtung, 1967): quello che qui si è scelto fa riferimento altipo di variabili che determinano l’indice. In ossequio a questa

17

opzione, il presente lavoro fa sostanzialmente riferimento a dueambiti: quello degli indici ottenibili da variabili categoriali (per iquali si parla di indici costruiti per via analitica; cfr. Meraviglia,2004, p. 130 o di indici tipologici; cfr. Marradi, 2007, p. 812) e quel-lo degli indici ottenibili da variabili cardinali e/o quasi-cardinali(per i quali si parla invece di indici costruiti per via matematica o,in modo un po’ più sbrigativo, di indici sommatori).

Prima di arrivare a questi due ambiti – che rappresentano evi-dentemente il cuore di questo lavoro – verranno affrontate alcu-ne questioni di ordine generale relative al problema della misu-razione nelle scienze sociali e ai pericoli che in queste si annida-no qualora si ricorra a un uso poco accorto degli strumenti dellastatistica. Lo sforzo che si compirà è quello di offrire una letturacritica e, nei limiti del possibile, articolata di come gli indicatori pos-sano combinarsi in indici. Pertanto questo lavoro discuterà soltan-to marginalmente gli aspetti che si collocano a corollario del proble-ma della costruzione degli indici (come per esempio il problemadell’intercambiabilità degli indici, affrontato da Lazarsfeld) le que-stioni che hanno a che vedere con la costruzione degli indici in rife-rimento a un solo indicatore/variabile, nonché agli indici statisticiormai consolidati nella letteratura (indici di composizione, coesi-stenza e derivazione; indici ottenuti dalle scale di atteggiamento).

Per completezza va ricordato che “la preoccupazione di predi-sporre indici sintetici deriva da un atteggiamento che sembra privi-legiare il globalismo sulla precisione, atteggiamento tipico dellescienze non ancora mature. Le scienze mature, infatti, hanno parti-colare difficoltà a sintetizzare e preferiscono fornire un set multidi-mensionale di parametri da valutare” (Cannavò, 1999, p.138) e per-tanto la sintesi del dato non è un diktat metodologico da perseguirea qualsiasi costo, ma soltanto un’opzione che, una volta intrapresa,può aiutare a semplificare la lettura della complessità sociale conl’impegno, da parte del ricercatore, di disperdere la minor quantitàpossibile di informazione senza contraffare la realtà.

Le strade perseguibili sono più d’una. Quella indicata dallamanualistica metodologica – peraltro ben poco incline a conce-dere spazi sufficienti all’argomento – fa leva sulla distinzione traprocedure tipologiche e procedure matematiche. Con le prime

18

intendiamo un processo di riduzione del set di variabili di natu-ra categoriale guidato dall’esperienza del ricercatore e dalla suevalutazioni sugli indicatori utilizzati per costruire l’indice: alricercatore (o ai ricercatori) spetta in questo caso in compito dianalizzare cella per cella la combinazione delle diverse modalitàche contribuiscono a determinare l’indice, mediante una prassiche privilegia la dimensione semantica.

Tra le seconde rientrano tutte le tecniche che, a vario titolo,fanno riferimento all’opportunità di sintetizzare i dati attraversoprocedure matematiche: in questo caso la dimensione semanticasi attenua, lasciando maggiore spazio a quella sintattica.

Come si è anticipato, la distinzione tra tecniche analitiche etecniche matematiche riproduce sostanzialmente quella tra indi-ci ottenibili da variabili categoriali e indici ottenibili da variabilicardinali. È a questa distinzione che si farà riferimento nell’orga-nizzazione delle pagine che seguono, ma rispetto a cui è neces-saria una precisazione.

Quando parliamo di indici ottenibili da variabili categoriali, ciriferiamo a quella procedura che richiede la riduzione del cosiddet-to spazio di attributi. Questa procedura, che vedremo dettagliata-mente in seguito, aiuta a sintetizzare le variabili con categorie ordi-nate anche se talvolta viene usata per categorie non ordinate, attra-verso un’assegnazione arbitraria dei “ranghi” delle diverse categorie.

A fianco di queste tecniche ci sono poi, come abbiamo detto,quelle che fanno riferimento alle variabili cardinali o quasi-cardi-nali. A questo punto è assolutamente necessaria una distinzione:quando parliamo di indici sintetici con riferimento a questo tipodi variabili, ci riferiamo a uno spettro di occorrenze che annove-ra operazioni estremamente semplici, come la costruzione di untasso, e altre decisamente complicate. È perciò opportuno chia-rire in via preliminare che tra il genere di indici ottenibili davariabili cardinali e quasi-cardinali rientrano le seguenti specie:

- Tecniche di combinazione, che si riferiscono alla semplice relazionetra due valori. Si tratta di variabili cardinali derivate3 come tassi,

3 Come suggerisce Marradi (2007, p. 612), “il rapporto tra due variabili cardi-nali (che possono essere entrambi naturali, entrambe metriche, o una metrica e

19

rapporti, quozienti e di tutti quegli indici sintetici acquisiti neglistandard procedurali della statistica. Tra questi vanno ricordatii rapporti di composizione, di densità, di derivazione, di coesi-stenza, incrementali, di durata e di ripetizione. Appartengono aquesta specie anche gli indici di valutazione, ottenibili dalla com-parazione dello stato presentato da un i-esimo soggetto altempo t0 e al tempo t1 di una rilevazione.In molti casi gli indici derivanti dalle tecniche di combinazioneriguardano una sintesi di doppio livello sulla matrice dei dati:sono cioè misure di sintesi (per esempio, la media di un certocarattere di una popolazione statistica) poste a confronto traloro che non rendono possibile l’attribuzione di un valore a cia-scun caso nella matrice dei dati.Come per le tecniche di scaling (Perrone, 1977; Pavsic e Pitrone,2003), le tecniche di combinazione possono richiedere un ridi-rezionamento degli indicatori utilizzati. Ciò dipende dal fattoche uno stesso fenomeno può essere rilevato sia attraverso indi-catori che lo rilevano positivamente che negativamente. È ilcaso del concetto di qualità della vita (Vergati, 1995; Mingo,2007) utilizzato nelle indagini de Il Sole24 ore. Nel analisi condot-te dal quotidiano troviamo infatti sia indicatori come “numerodi furti in casa ogni 1000 abitanti” e “chilometri quadrati di super-ficie verde per ettaro urbano”: per poterli conciliare in un unicoindice è necessario normalizzarne i valori per rendere confron-tabili gli indicatori.Complessivamente si tratta di procedure assai semplici ecomunque acquisite negli standard procedurali delle qualipertanto non discuteremo, se non marginalmente, in questepagine.

- Tecniche di scaling, che derivano i punteggi dalle scale di atteggia-mento (Likert, Thurstone, ecc.), secondo procedure consolidatee derivate dalla psicometria. In questo caso, alla matrice dei

una naturale) produce un’altra variabile cardinale che non si può definire né natu-rale (poiché non si basa conteggio) né metrica (perché non è prodotta da unamisurazione)”. Perciò a questo tipo di variabili deve essere attribuita una catego-ria a parte: quella, appunto, di variabile cardinale derivata.

20

dati viene aggiunta una colonna nella quale viene attribuito ilpunteggio a ciascun caso. Le procedure per assegnare unvalore sintetico a ciascuno dei casi della matrice sono indica-ti dagli stessi studiosi che hanno messo a punto le diversescale di atteggiamento. Si tratta pertanto di procedure conso-lidate e note, per le quali si rimanda direttamente alla lettera-tura esistente (tra gli altri, per la letteratura in lingua italiana,si segnalano Perrone, 1977; Giampaglia, 1990; Pavsic ePitrone, 2003).

- Tecniche sociometriche, che cioè fanno riferimento alla sociome-tria. Si tratta di una specie che condivide aspetti tanto delletecniche di combinazione che di quelle legate alle scale diatteggiamento. Delle prime conservano la capacità di offriremisure di sintesi con semplici combinazioni di valori. Alleseconde sono accomunate dalla standardizzazione delle pro-cedure e dalla capacità di produrre valori-indici per i singolicasi. Tuttavia, la sociometria è una branca della metodologiacaratterizzata da peculiari obiettivi gnoseologici (Moreno,1953; Mattioli, 1991; Anzera, 1999; Reffieuna, 2003) e di con-seguenza le procedure di sintesi dei dati acquisite in que-st’ambito non possono travalicare uno specifico campo d’ap-plicazione.

- Tecniche additive, basate sulla semplice somma dei valori asse-gnati alle variabili che vanno a comporre un indice; questetecniche sono applicabili in maniera sufficientemente appro-priata laddove si faccia riferimento al conteggio; se ne abusanelle occasioni in cui si vuole passare alla misurazione o, peg-gio, quando si opera con variabili non cardinali4.

- Tecniche fattoriali, che sono più sofisticate delle precedenti e chesi basano sull’uso, appunto, dell’analisi fattoriale, valida pertan-to solo per variabili cardinali e quasi-cardinali e capace di sinte-tizzare un cospicuo set di variabili in pochi “fattori”, al prezzodi una perdita di informazione che varia da situazione a situa-

4 Per una discussione critica, si veda il paragrafo dedicato agli indici per somma.

21

zione. Anche su queste tecniche, la cui applicazione richiedecomunque un’attenta analisi semantica dei risultati da parte delricercatore, esiste una letteratura considerevole (Thorndike,1936; Harman, 1967; Marradi, 1976; Rizzi, 1985; Di Franco eMarradi, 2003).

- Infine esiste una sorta di classe residuale che include quelle tec-niche che fanno ricorso ad algoritmi di natura matematica mache non sono riconducibili a nessuna delle classi precedenti o,nel migliore dei casi, sono delle varianti di esse. È soprattuttosu quest’ultima classe che verrà focalizzata un’attenzione mira-ta a riflessioni, proposte e suggerimenti. Le chiameremo tecnicheidiomatiche.

Lo scopo di queste pagine è allora quello di colmare – perquanto possibile – i vuoti lasciati dalla manualistica esistente, pas-sando in rassegna le molte tecniche di sintesi dei dati che – attra-verso l’esperienza – chi scrive si è trovato progressivamente a col-laudare, modificare quando non addirittura a inventare. Si cerche-rà pertanto di mostrare le diverse alternative – in un’ottica preva-lentemente critica – e di guidare il lettore all’applicazione di tecni-che che travalichino la letteratura pressappochista che, come già èstato detto, viene talvolta presentata negli appositi manuali.

Nel primo capitolo viene pertanto dato conto delle insidie insi-te nell’uso approssimativo, scorretto o volutamente distorto dellastatistica, lasciando ampio spazio a una discussione critica su comeevitare le trappole di una sintesi approssimativa e scorretta dei dati.

I restanti due capitoli si distinguono in base alle variabili trat-tate: il secondo affronta gli indici provenienti da variabili catego-riali, noti come indici tipologici o analitici.

Il terzo capitolo, infine, affronta il caso degli indici matematici, perlo più riconducibili a variabili cardinali e quasi-cardinali. A una discus-sione critica della procedure si accompagna, in esso come nei duecapitoli precedenti, una serie di proposte alternative e innovative.

Molte delle riflessioni proposte in queste pagine sono l’esito nonsoltanto di anni di ricerca empirica, ma anche o forse soprattuttodelle domande e degli stimoli ricevuti dai miei studenti. È grazie

22

alle loro intuizioni e alla loro curiosità che il testo è cresciuto neltempo. Ed è a loro che va il mio primo ringraziamento.

A Leonardo Cannavò voglio esprimere la riconoscenza che sideve a un Maestro: la lucidità e la pertinenza delle sue osserva-zioni sul mio lavoro è solo l’ulteriore motivo per ringraziarlo.Questo volume probabilmente non ci sarebbe stato se anni fanon avessi avuto l’occasione di tenere, grazie a lui, il primo semi-nario all’università su questo argomento.

Devo molto anche a Enzo Campelli, non solo per la consuetapregnanza dei suoi suggerimenti, ma anche per avermi ricondot-to entro il perimetro di una prosa più consona al linguaggio acca-demico. Scrivendo anche di cose molto distanti dalla metodologiasociologica, ogni tanto tendo a dimenticarlo. A lui e a MaurizioBonolis, codirettore della collana, va tutta la mia gratitudine.

Il preziosissimo lavoro svolto in diverse occasioni al fianco diFulvio Beato si è tradotto in un’opportunità formativa ma anche inun processo creativo. Gli sono davvero obbligato per avermilasciato le briglie sciolte, permettendomi di mettere a punto tecni-che nuove. Per questo lo ringrazio.

Il mio amico Arik Agnesini mi ha dato una mano per un com-plicato grafico di questo volume: gliene sono davvero riconoscente.

Ad Anna Ancora, infine, va il mio ultimo grazie: lei ne conoscebenissimo le ragioni, che qui sarebbero troppo lunghe da elencare.

41

CAPITOLO IIGLI INDICI TIPOLOGICI

II.1. PREMESSA

Prima di addentrarci sulle diverse soluzioni alle quali si può attin-gere per costruire un indice, fornendo così una “misura” sinteticadi più variabili, è necessario qualche chiarimento preliminare.

Innanzitutto, dobbiamo distinguere gli esiti di operazioni che,sotto il profilo tecnico, appaiono del tutto simili ma che vannodistinte sotto quello lessicale e definitorio. A rigore, infatti, è lecitoparlare di indici in senso statistico soltanto se facciamo riferimen-to a variabili di natura metrica. All’opposto, sarebbe più correttoparlare di tipologie con riferimento all’esito di un’operazione disintesi condotta su due o più variabili a categorie non ordinate,mentre più ambiguo è il caso della combinazione di variabili a cate-gorie ordinate. Naturalmente, esistono anche i casi ibridi, comequello della combinazione tra una variabile a categorie ordinate eduna a categorie non ordinate (esempio tipico in questo senso è l’in-dice di status formato dalla professione e dal titolo di studio6).

Nulla esclude che si possano formare degli “indici” dallacombinazione tra variabili dei quattro tipi (a categorie non ordi-nate, a categorie ordinate, quasi-cardinali e cardinali).

Una esemplificazione di come la qualità possa trasformarsi inquantità attraverso un indice si trova in J.R.Commons (1908),che viene riportato da Lazarsfeld (1951, p.254). Commonsmostra come si possa realizzare quella che chiama “classificazio-ne”, riferendosi a come si possono giudicare i cavalli.

“Si dà ora un valore di 29 punti all’aspetto generale del cavalloda tiro; questi punti sono così suddivisi: ‘peso’ 5 punti, ‘forma’ 4

6 In casi come quello appena riportato si parla di “tipologia”. Essa è l’esito diun’operazione di classificazione basata almeno su due criteri (Marradi, 1990b).

42

punti, ‘qualità’ 6 punti, ‘azione’ 10 punti e ‘temperamento’ 3 punti.‘Capo e collo’ valgono 8 punti, divisi in ‘testa’, ‘fronte’, ‘occhi’,‘orecchi’, ‘muso’, ‘mascella inferiore’ e ‘collo’, ciascuno con unpunto o due. L’estimatore esamina il cavallo, osservando accura-tamente tutti i punti specificati e in relazione a ciascuno segna ilsuo giudizio, cioè nota in che misura il cavallo davanti a lui è difet-toso rispetto a quel particolare punto”. Lazarsfeld fa notare chesebbene il lettore poco pratico di cavalli da tiro avrebbe delle dif-ficoltà a esprimere giudizi corretti al riguardo, chi invece si inten-de di cavalli da tiro applica queste regole pervenendo ad uno scar-to che, tra un estimatore ed un altro, “non supera in genere uno odue punti” (Lazarsfeld, p.255). Le implicazioni dell’esempio lazar-sfeldiano sono assai vaste. Esso ha infatti risvolti sia tecnici cheteorici. Dal punto di vista tecnico, è evidente che l’operazione diponderazione dei diversi indicatori della “qualità del cavallo datiro” è in sé arbitraria, anche se Lazarsfeld manifesta una fiduciaquasi positivistica nel compimento di un’operazione del genere.Dal punto di vista teorico pare invece evidente la ricaduta del pro-blema sul piano dell’attendibilità. Come interpretare la fluttuazio-ne dei punteggi?, avrebbe forse dovuto domandarsi Lazarsfeld. Èevidente che le ricadute del problema sul piano dell’attendibilitàriguardano, più a monte, il problema della scelta degli indicatori,anche se – come vedremo – sorge un problema addizionale diattendibilità anche nella costruzione degli indici.

Pertanto, va ancora una volta ribadito che lo scopo di questepagine è proprio quello di proporre delle strategie di soluzione alproblema della costruzione degli indici che rendano quest’opera-zione più standardizzata possibile.

II.2. LA RIDUZIONE DI UNO SPAZIO D’ATTRIBUTI

La procedura di uso più comune e una di quelle all’apparenza piùsemplici da realizzare dal punto di vista tecnico (ma in realtà irta diinsidie) è quella della riduzione dello spazio di attributi. Si parla dispazio di attributi quando in una matrice valori per valori si vanno

43

a incrociare tutte le proprietà di due o più variabili, generando cosìuna tipologia (ed è per questo che si parla di indici tipologici). Se peresempio volessimo combinare due proprietà come quella diessere genitori con quella di essere o meno cattolici, avremmouno spazio di attributi a quattro celle, derivate dalla combinazio-ne delle due variabili dicotomiche, come in Tabella 8.

Tabella 8 – Un esempio di spazio di attributi

L’aspetto precipuo di uno spazio di attributi è dunque quellodi combinare le caratteristiche di un certo numero di unità di ana-lisi (persone, oggetti, dati ecologici, eccetera) in una tipologia.

Nella pratica, esso è già un’operazione di sintesi compiuta suuna matrice del tipo casi per variabili, come illustrato in Tabella 9.

Tabella 9 – Esempio di matrice casi per variabili

L’operazione di costruzione degli indici mediante la riduzione diuno spazio di attributi ha ovviamente senso quando esistono i pre-supposti logici per l’aggregazione delle variabili. Tali presuppostivanno cercati nella cornice teorica all’interno della quale si inscrive ilprogetto di analisi del ricercatore (Grasso, 2002). L’accorpamentodelle variabili illustrate in Tabella 8 potrebbe avere un senso qualorauno degli obiettivi fosse rappresentato dal tentativo di costruire unindice di secolarizzazione, mentre potrebbe non averlo in altri casi.

Nell’affrontare il tema della riduzione dello spazio d’attribu-ti, Lazarsfeld (1951, p.268) suggerisce la possibilità di ricorrere

Sono cattolici Non sono cattoliciHanno figli

Non hanno figli

Individuo Ha figli È cattolico È italiano È laureato LavoraA Sì Sì No Sì No

B No Sì No No Sì

C Sì No Sì No NoD No No Sì Sì Sì

44

ad “almeno tre generi di riduzione: a) funzionale; b) arbitrarianumerica e c) pragmatica.a. In una riduzione funzionale – chiarisce Lazarsfeld – deve esi-

stere un rapporto effettivo tra due degli attributi, in modo taleche il numero delle combinazioni è ridotto. Per esempio, se inegri non possono ottenere un titolo accademico, o se le ragaz-ze altre sono sempre giudicate più belle, praticamente certecombinazioni di attributi non si verificheranno e così il sistemadi combinazioni sarà ridotto”. Si tratta, a ben vedere, di unariduzione dello spazio di attributi alla quale praticamente ilricercatore non mette mano.

b. “Il caso di una riduzione arbitraria numerica trova un esempioprincipe negli indici”, chiarisce ancora Lazarsfeld. “Per esem-pio, analizzando le condizioni d’alloggio si segue spesso questoprocedimento: si scelgono come indicativi diversi elementi, peresempio le tubature, il riscaldamento centrale e l’impianto fri-gorifero e a ciascuno viene assegnato un certo punteggio. Unacasa con riscaldamento centrale e impianto frigorifero masenza acqua corrente potrebbe equivalere a una casa dotata diacqua corrente ma senza le altre due caratteristiche e perciòentrambi i casi riceverebbero eguali valori d’indice […].

c. Nella riduzione pragmatica certi gruppi di combinazioni ven-gono concentrati in una classe in vista degli scopi della ricer-ca”. L’esemplificazione di Lazarsfeld in questo caso rimandaad “uno studio sulle attività cui dei giovani si dedicavano neltempo libero. Si pose l’interrogativo: i ragazzi la cui situazio-ne domestica è meno piacevole se ne stanno a casa loro piùfacilmente dei ragazzi più benestanti, nei quali dovrebbeessere maggiore la tendenza a frequentare le organizzazionicomunitarie formative? Due erano i dati in base ai qualidistinguere un milieu domestico piacevole o meno: se ilpadre lavorava o era disoccupato e se esisteva o meno unambiente di soggiorno nella casa. Si stabilì di considerare pia-cevole la situazione di coloro il cui padre aveva un lavoro e lacasa disponeva di un soggiorno […]. Qui, tramite riduzionepragmatica, tre delle quattro combinazioni possibili costitui-vano una classe contrapposta alla quarta combinazione, la

45

quale formava da sola l’altra classe”.Tolto il caso a, è chiaro che Lazarsfeld è pienamente cosciente

del carattere di arbitrarietà delle operazioni compiute in occasionedella riduzione dello spazio di attributi, al punto da battezzare unadelle tre prassi “riduzione arbitraria numerica”.

Il lavoro di sistematizzazione compiuto da Lazarsfeld suggerisceimplicitamente l’esistenza di due procedimenti principali (dalmomento che la riduzione “funzionale” è, per così dire, “automati-ca”): uno basato sui punteggi e uno basato sulle combinazioni logi-che. Non si tratta di due procedure mutuamente esclusive perchémentre è possibile compiere la seconda anche per variabili chepotrebbero essere trattate con la prima, non è possibile il contrario.

Un esempio canonico di riduzione di uno spazio di attributi èl’indice di status socio-professionale, diffusissimo nelle survey7. Tra inumerosissimi esempi rinvenibili in ambito manualistico, ne forni-sce uno Statera (1982, p.99), che per ridurre lo spazio di attributiinterseca il titolo di studio con la professione, come in Tabella 10.

Tabella 10 – Elaborazione di un indice di status socio-professionale per costruzione/riduzione di uno spazio di attributi (riadattamentoda Statera, 1982, p.99)

7 Va notato che la vis quantofrenica che sembra armare il braccio di alcuni ricer-catori a tutti i costi sia rinvenibile persino in applicazioni che sembrerebbero richie-dere comunque un procedimento tipologico. Un esempio è dato da una proposta diMeier e Bell (1970), che propongono di costruire un indice di status sommando (!) il

46

Le 16 combinazioni iniziali, due delle quali vengono escluseper ‘riduzione funzionale’ (per dirla in termini lazarsfeldiani), sitrasformano in cinque ‘tipi’. Le categorie così ottenute, come sivede nella Tabella 10, non derivano tutte dallo stesso numero dicombinazioni: l’assegnazione dei codici con puro valore stipulati-vo 1 (basso status socio-professionale, in alto a sinistra nella tabel-la) e 5 (alto status socio-professionale) derivano da una sola com-binazione; i codici 2 e 4 derivano da 3 combinazioni, mentre ilcodice 3 da 6 combinazioni. È opportuno che questa operazionenon venga compiuta tenendo conto esclusivamente dei presup-posti teorici che spingono il ricercatore a raffigurare una situa-zione secondo cui soltanto alcune combinazioni possono avere,per esempio, alto status socio-professionale e altre no. Può infat-ti accadere che il campione abbia caratteristiche tali per cui l’ap-plicazione di un criterio di assegnazione dei punteggi di questogenere non discriminerebbe e la variabile finirebbe col diventa-re una costante. Tornando all’esempio di Commons sui cavallida tiro, è come se ad una fiera venissero passati in rassegna tutticavalli con qualità eccellenti. Deve pur essere possibile distin-guere uno migliore da uno peggiore. In questo caso, il criterio diselezione deve essere spostato verso l’alto.

Analogamente, se la ricerca dovesse riguardare un contestodel quale si conoscono, almeno approssimativamente, alcunecaratteristiche ed è noto che una certa variabile, pur rilevante,non varierebbe in quello stesso contesto, diventa allora necessa-rio “tagliare” il livello del criterio di assegnazione dei punteggi.Può essere questo il caso, per fare degli esempi, sia di una ricer-ca condotta in una zona urbana particolarmente omogenea dalpunto di vista socio-professionale, sia di quelle ricerche che rile-vano degli atteggiamenti nei quali è insita una componente di‘desiderabilità sociale’, come la questione dell’ambiente o delpregiudizio etnico.

In queste occasioni è opportuno accertarsi della distribuzio-ne dei dati provenienti dalle variabili con le quali si vuole costrui-re l’indice in matrice e quindi procedere alla riduzione, sempre

reddito, l’occupazione (preventivamente ripartita in categorie ordinate) e il nume-ro di anni di istruzione.

47

per via analitica, dello spazio d’attributi. Se si partisse dai pre-supposti teorici insiti in Tabella 10, il ricercatore potrebbe, acausa dell’anomala distribuzione del campione, ritrovarsi nellasituazione della Tabella 11. Al gruppo con status socio-profes-sionale più basso corrisponderebbe infatti una quota di 44 unitàcomplessive (il 4,4% del campione), mentre al gruppo più altone spetterebbe una di sole 16 unità (l’1,6% del campione), afronte delle tre classi restanti che si ripartirebbero una media di31,3 punti percentuali ciascuna.

Tabella 11 – Distribuzione dei casi per la costruzione di un indice di statussocio-professionale per costruzione/riduzione di uno spaziodi attributi

La distribuzione proveniente dai 1000 casi della Tabella 11sarebbe dunque gravemente sbilanciata, con una sovrarappresen-tazione della classe media e una sottorappresentazione delle dueclasse estreme. In questo caso, per bilanciare meglio la distribuzio-ne, si potrebbe allora assegnare alla seconda cella in alto a sinistradella matrice (Negoziante, artigiano, agricoltore, operaio +Licenza media inferiore) lo stesso punteggio della prima e, analo-gamente, all’ultima casella a destra in basso si potrebbe aggregarequella alla sua sinistra.

Quello appena illustrato è solo uno dei problemi che il ricer-catore può trovarsi ad affrontare nei casi – peraltro frequenti –

Licenza elementareo meno

Licenza mediainferiore

Diploma mediasuperiore

Laurea

Negoziante, artigiano,agricoltore, operaio

44 174 30 7

Impiegato nondirettivo, sottufficiale,insegnante elementare

2 58 328 40

Ufficiale, funzionariodirettivo, professore discuola media

- - 111 33

Professionista, docenteuniversitario, dirigente,imprenditore

3 71 83 16

48

in cui ricorra alla riduzione dello spazio di attributi. Vi sono peròalmeno altri due ordini di problemi, dei quali si cercherà di darebrevemente conto. Uno riguarda l’asimmetria della matricegenerata dall’incrocio di due variabili (la matrice è di forma ‘ret-tangolare’ e non ‘quadrata’); il secondo riguarda invece la costru-zione di uno spazio di attributi per così dire “a stadi”, ricavatocioè dall’unione di più di due variabili.

Per quanto riguarda il primo problema, quello della simme-tria/asimmetria8 dello spazio di attributi generato dall’incrocio tradue variabili, la difficoltà principale risiede nell’attribuzione di“valori” stipulativi all’interno delle singole celle. Prendiamo comeesempio la costruzione di un indice di interesse per la politicaottenuto da due indicatori: l’avere espresso o meno il voto inoccasione delle ultime consultazioni elettorali (che ha evidente-mente attributi dicotomici: una persona o è andata a votare onon è andata) e la frequenza con cui si intavolano discorsi dinatura politica con i propri amici, secondo una scala che va daun massimo di occasioni (sempre) ad un minimo (mai), passan-do per i punti intermedi (spesso, qualche volta).

Lo spazio di attributi che ne deriverebbe avrebbe le sembian-ze riportate in Tabella 12.

Tabella 12 – Costruzione di un indice di interesse per la politica medianteriduzione di uno spazio di attributi (tabella asimmetrica)

Non ha votato Ha votatoMai

Qualche volta

Spesso

Sempre

Frequenza con cuil’intervistato parladi politica con isuoi amici

Espressione di voto in occasionedelle ultime consultazioni elettorali

8 Per simmetria/asimmetria dobbiamo ovviamente intendere la forma assuntadalla matrice: è simmetrica quando questa è quadrata (il numero delle modalità delledue variabili che costituiscono la matrice è lo stesso); viceversa, è asimmetrica quan-do ha forma rettangolare (il numero delle modalità delle due variabili è diverso).

49

Si pone innanzitutto un problema: quante classi costruire? E,in seconda battuta, come costruirle? Supponiamo, per semplicità,di volere soltanto dimezzare il numero complessivo di combina-zioni, che in Tabella 12 sono evidentemente 8 (4 righe moltipli-cate per 2 colonne).

Dal momento che le modalità di entrambe le variabili sonomonotoniche (nel senso che non compaiono squilibri che pola-rizzano le variabili stesse verso una delle due estremità e che ladistanza tra una modalità e l’altra può essere assunta come equi-valente e progressiva), questo ci impone di assegnare lo stessonumero di classi alle modalità che costituiranno l’indice che stia-mo cercando di ottenere. Se questo è possibile portando a duele modalità dell’indice costruito, sarebbe già più complicato seavessimo deciso di portarlo a 3, dal momento che 8 non è divi-sibile per 3, pur partendo dagli stessi presupposti logici. Marisolviamo i problemi con ordine.

Innanzitutto stabiliamo, sempre stipulativamente, di attribui-re ‘1’ alla modalità ‘basso interesse per la politica’ e ‘2’ alla moda-lità ‘alto interesse per la politica’. Chiaramente, chi non ha vota-to in occasione delle ultime consultazioni elettorali e non parlamai di politica con gli amici mostra un basso interesse, mentre,al contrario, chi ha votato e parla sempre di politica con gli amicimostra certamente un alto interesse per la politica. Ma qualipunteggi attribuire alle 6 celle restanti?

A questo punto, il ricercatore ha l’obbligo di procedere conprudenza. Una prima considerazione potrebbe essere quellasecondo la quale chi, pur essendo andato a votare, non ha alcu-na occasione di parlare di politica. Il suo esercizio di voto acqui-sterebbe dunque i connotati di una mera prassi ritualista.Pertanto, gli si potrebbe assegnare codice ‘1’. Specularmente, chiparla sempre di politica ma non è andato a votare in occasionedelle ultime consultazioni elettorali, potrebbe essere comunqueconsiderato come una persona con uno spiccato interesse per lapolitica che, per cause contingenti o per una scelta peculiare, hamancato l’appuntamento con le ultime elezioni.

A questo secondo caso assegneremo codice ‘2’. Va aggiuntoche se decidessimo diversamente, finiremo per il trattare soltan-

50

to una delle due variabili al fine della costruzione dell’indice,come dovrebbe emergere chiaramente dalla spiegazione fornitanelle prossime righe. Rimangono a questo punto le quattro celleintermedie. Giocoforza, chi non ha votato e parla solo qualchevolta di politica mostra anche uno scarso interesse verso di essa(codice ‘1’); viceversa, chi ha votato e ne parla spesso mostra unbuon livello di interesse (codice ‘2’). A questo punto, rimango-no soltanto due celle da riempire. Se decidessimo di attribuirecodice ‘1’ alla combinazione ‘ha votato’ e ‘parla qualche volta dipolitica’ e codice ‘2’ ha ‘non ha votato’ e ‘parla spesso di politi-ca’, ci troveremmo nella situazione presentata in Tabella 13.

Tabella 13 – Attribuzione dei punteggi dicotomici per la costruzione di un indice di interesse per la politica mediante riduzione di uno spazio di attributi (la variabile di colonna è ininfluente)

Cos’è che non va nella Tabella 13? Evidentemente, il fattoche la variabile di colonna (con modalità ha votato/non ha vota-to) non avrebbe in pratica alcun peso al fine della costruzionedell’indice, dal momento che l’indice stesso risulterebbe costrui-to soltanto in funzione della seconda variabile, quella di riga.

Pertanto, si renderà necessario attribuire codice ‘2’ alla com-binazione ‘ha votato’ + ‘parla qualche volta di politica’ e codice‘1’ a quella ‘non ha votato’ + ‘parla spesso di politica’, comerisulta dalla Tabella 14.

Dovrebbe risultare evidente la forzatura che l’impiego di unasimile tecnica produce nella sintesi dei dati: tra chi ha votato,non si fa differenza tra chi parla ‘qualche volta’ e chi ‘sempre’ dipolitica. La via migliore per uscire dall’impasse è quella di pre-scindere eventualmente dall’equiripartizione delle celle (4 per

Non ha votato Ha votatoMai 1 1Qualche volta 1 1Spesso 2 2Sempre 2 2



51

ciascuna delle due variabili) per privilegiare un criterio puramen-te semantico, da perseguire per via analitica (ossia analizzando lecombinazioni cella per cella, ed è per questo che questi indicivengono anche chiamati analitici, oltre che tipologici).

Tabella 14 – Attribuzione dei punteggi dicotomici per la costruzione di un indice di interesse per la politica mediante riduzione di uno spazio di attributi (assegnazione ottimale)

Un problema ulteriore, al quale si accennava, è quello del-l’equa ripartizione delle classi: come distribuire 8 celle in 3 clas-si? In questo caso, siamo costretti ad assegnare 3 celle a duemodalità e 2 sole celle alla modalità restante. Secondo logica, ledue modalità estreme (basso interesse e alto interesse per la poli-tica) dovrebbero inglobare 3 celle ciascuna, mentre le restanti 2celle andrebbero assegnate alla modalità centrale (interessemedio per la politica). Avvalendoci delle stesse argomentazioniillustrate rispetto alla costruzione di un indice dicotomico, l’uni-ca soluzione possibile risulta quella riportata in Tabella 15.

Tabella 15 – Attribuzione dei punteggi per la costruzione di un indice di interesse per la politica mediante riduzione di uno spazio di attributi (assegnazione ottimale)







52

Quanto detto finora è puramente indicativo e deve fare iconti con la distribuzione statistica dei dati: si può così decideredi ‘allargare’ il range di celle da assegnare ad una modalità, restrin-gendone un’altra, a condizione ovviamente che l’operazionecontinui ad avere un senso sotto il profilo logico e semantico.Rispetto alla Tabella 15, per esempio, avrebbe senz’altro sensoattribuire codice ‘2’ alla combinazione ‘ha votato’ + ‘parla qual-che volta di politica’ (il che denota un interesse medio per lapolitica), mentre sarebbe difficilmente argomentabile un pun-teggio ‘2’ alla combinazione ‘ha votato’ + ‘parla spesso di poli-tica’, ovviamente in relazione al numero di classi a disposizione(nell’esempio, 3). Esiste anche una questione complementare aquella appena presentata della matrice asimmetrica, ossia quella dicome si debba trattare una matrice simmetrica (quadratica). Èabbastanza evidentemente che in questo secondo caso le opera-zioni sono facilitate, in linea di massima, dall’avere a disposizioneil medesimo numero di modalità sulle variabili che vanno a com-porre l’indice. Bisogna tuttavia porre attenzione a due insidie:innanzitutto, non è affatto detto che le due variabili debbanoavere ‘pesi’ uguali nella costruzione dell’indice. In altri termini, laparte indicante di una delle due potrebbe essere maggiore di quel-la dell’altra e, viceversa, la parte estranea della seconda sarebbemaggiore di quella della prima9. In secondo luogo, si presentereb-bero comunque i problemi ai quali si è fatto cenno in precedenzacon riferimento alle matrici asimmetriche: problemi di ripartizio-ne del numero di celle secondo il numero di classi che si voglionoformare e problemi di riequilibratura della distribuzione così otte-nuta in ragione della distribuzione statistica dei dati. L’indicazioneche si può dare tendenzialmente è questa: disponendo di matriciquadrate (caso frequente soprattutto quando si lavora su scale oquando si lavora con variabili artificiali, ottenute cioè da un primopassaggio di costruzione di un indice complesso, come si vedrà piùavanti), è opportuno che il ricercatore punti a formare un numero diclassi pari a quello del numero di modalità di ciascuna delle duevariabili impiegate. È raccomandabile cercare di limitare il numero di

9 Per un approfondimento sul significato metodologico di parte indicante eparte estranea di un concetto, si veda Marradi, 1980, p. 36.

53

classi, indicativamente fino a cinque classi (modalità), superate lequali si ricava un esubero di modalità che va a detrimento dell’eco-nomia che si vorrebbe ottenere sulla sintesi dei dati.

Il caso ideale si presenta infatti in questo modo:1. le due variabili hanno lo stesso numero di modalità, non

superiore a 5;2. le due variabili hanno lo stesso peso teorico sulla costruzio-

ne del concetto;3. le due variabili devono essere di livello ordinale;4. il numero di classi che si vuole ottenere è uguale al numero

di modalità presentato dalle due variabili.Se queste quattro condizioni sono presenti, lo spazio di attribu-ti dovrebbe presentare la soluzione tipica riportata in Tabella 16.

Tabella 16 – Un caso “ideale” di attribuzione dei punteggi nella riduzione diuno spazio di attributi da una matrice quadrata.Bilanciamento delle variabili e conservazione della simmetria

Tabella 17 – Un caso “ideale” di attribuzione dei punteggi nella riduzionedi uno spazio di attributi da una matrice quadrata.Sbilanciamento delle variabili e perdita della simmetria

Come si può facilmente osservare, anche un caso “ideale”richiede delle manipolazioni. La Tabella 16, infatti, pur presentando

1a modalità 2a modalità 3a modalità 4a modalità 5a modalità1a modalità 1 1 1 2 3

2a modalità 1 2 2 3 4




Variabile B

Var

iabi

leA

1a modalità 2a modalità 3a modalità 4a modalità 5a modalità1a modalità 1 1 2 2 3





Var

iabi

leA

Variabile B

54

tutti e quattro i criteri sopra indicati, richiede comunque una for-zatura: dovendo assegnare 5 caselle a ciascuna delle cinquemodalità finali, il ricercatore è infatti costretto a operare dellescelte. Avrà due alternative disponibili: quella di ridurre lo spa-zio di attributi in maniera perfettamente simmetrica e quella difar pesare una variabile più di un’altra in almeno due casi (sim-metrici tra loro: Tabella 17). Partiamo da questa considerazione:la diagonale ascendente, bisettrice della matrice, assumerà tutti ivalori centrali della nuova variabile-indice (3). Le prime duemodalità più basse di entrambe le variabili e le due più alte assu-meranno rispettivamente il punteggio più basso (1) e più alto (5).Così facendo, si sono potute assegnare soltanto 4 celle su 5. E laquinta? È proprio a questo punto che il ricercatore deve decide-re se la variabile A deve essere più o meno determinante dellavariabile B nell’assegnazione dei punteggi ovvero se, per conser-vare la perfetta simmetria nella riduzione dello spazio di attribu-ti, debba forzare le combinazioni attribuendo alla stessa classetanto la combinazione tra un valore mediano (3) e un valoreestremo (5) quanto tra due valori estremi (5). Con la prima scel-ta viene a perdersi la condizione di perfetta simmetria internaalla distribuzione dei valori nella riduzione dello spazio di attri-buti, ma l’assegnazione dei valori stessi appare semanticamentepiù appropriata. Nel secondo caso si guadagna con la simmetriadell’assegnazione dei valori ciò che si perde nell’attribuzione disignificato alle combinazioni tra modalità delle variabili.

Domandiamoci a questo punto: le cose cambiano mutando ilnumero di modalità? Guardando la Tabella 18, ci si accorge chela situazione è la stessa di quella presentata in Tabella 16.

Tabella 18 – Un caso ‘ideale’ di attribuzione dei punteggi nella riduzione di uno spazio di attributi da una matrice quadrata (4 classi finali)

1a modalità 2a modalità 3a modalità 4a modalità1a modalità 1 1 2 2

2a modalità 1 1 3 3



Variabile 1

Var

iabi

le2

55

Il vero ‘caso ideale’, da perseguire evidentemente quanto menoin occasione della creazione di variabili ‘artificiali’ o di transito (quel-le cioè che, per via analitica, conducono alla formazione di un soloindice finale) e qualora non si accampino eccessive pretese di anali-ticità del dato, è quello presentato in Tabella 19.

Tabella 19 – Un caso ‘ideale’ di attribuzione dei punteggi nella riduzione di uno spazio di attributi da una matrice quadrata (3 classi finali).Il ‘vero’ caso ideale

In questo caso, infatti, il ricercatore non deve compiere alcunascelta: le 9 celle iniziali vanno ripartite in 3 modalità: una volta distri-buito il valore mediano sulla diagonale ascendente, il gioco è fatto.

Riassumendo, il suggerimento che si può fornire è dunquequello di adottare una ripartizione a tre classi non soltanto quan-do sono presenti tutte e quattro le condizioni indicate sopra, maanche quando:1. non si hanno pretese di eccessiva analiticità (ossia si ritiene

sufficiente un ridotto numero di classi nell’indice creato);2. le variabili con le quali si sta costruendo l’indice sono ‘artifi-

ciali’, ossia derivate dal passaggio in itinere verso la costru-zione di una variabile-indice complessa.

Le righe che seguono illustreranno proprio quest’ultimo passag-gio. I casi che sono stati menzionati fino a questo punto, infatti, sonoriferiti alla costruzione di un indice a partire soltanto da due variabi-li, presumibilmente derivanti direttamente dall’operazione di raccol-ta del dato. Nella ricerca sociale, tuttavia, è assai più frequente il casoper cui un indice debba essere costruito a partire da più variabili, ilche obbliga l’analista dei dati a una serie di operazioni composte.

Quando si procede alla costruzione di un indice complessomediante riduzione di uno spazio di attributi, la combinazione

1a modalità 2a modalità 3a modalità1a modalità 1 1 2

2a modalità 1 2 3

3a modalità 2 3 3

Variabile 1

Var

iabi

le2

56

delle variabili in sotto-indici impatta su due problemi:1. Quale criterio bisogna seguire per scegliere le coppie da assembla-

re a mano a mano che si procede verso la costruzione dell’indice?2. Come ci si deve comportare davanti a un numero dispari di

variabili, tale per cui non è possibile procedere per riduzionedello spazio di attributi a coppie10?La risposta alla prima domanda è che l’accoppiamento deve

seguire un criterio di prossimità semantica, allo scopo di mantene-re equilibrati i sotto-indici. Ciò significa in un certo senso ripercor-rere il percorso di operativizzazione a ritroso: se il concetto erastato scomposto in dimensioni e a ciascuna di queste era stato rife-rito un certo numero di indicatori, si suppone che gli indicatori,trasformati in variabili, debbano essere restituiti alle dimensionioriginarie. Se le dimensioni, supponiamo, sono 2 e gli indicatori perciascuna di esse sono ancora 2, allora le coppie, prima della com-binazione finale, dovranno essere formate ritornando al criterio diprossimità semantica implicito nel processo di operativizzazione.Rispetto al problema del numero di variabili dispari, è preferibilelasciare fuori quella che proviene dall’indicatore che ha meno pros-simità semantica con gli altri. Questo criterio permette di equilibra-re meglio le variabili congiunte al primo passaggio.

Un criterio alternativo è quello di aggregare, ad un primo sta-dio, le variabili con lo stesso numero di modalità, in modo da ope-rare su uno spazio di attributi a matrice quadratica. Questo crite-rio ha il vantaggio di facilitare l’assegnazione dei punteggi all’in-terno dello spazio di attributi. Sono criteri di massima, che nonpossono essere sottratti al principio già espresso secondo il qualenon esistono vincoli irremovibili soprattutto laddove il ricercato-re deve tenere simultaneamente conto di molte valutazioni con-temporaneamente. Non sono però neppure principi del tutto tra-scurabili, tanto più se si pensa che è tutt’altro che infrequente cheil ricercatore si trovi a dovere costruire un indice per riduzione dispazio di attributi partendo da una moltitudine di variabili, per cui

10 La questione si pone in questi termini: immaginiamo di avere le variabili A,B e C. Qual è il primo passo da compiere? Costruire un indice con A e B e poi unsecondo indice finale aggiungendo C? O partire da A e C (o da B e C) e poiaggiungere B (o A)?

57

il problema della formazione delle coppie mirate alla costruzionedegli indici parziali diventa tutt’altro che trascurabile11.

Un ultimo problema da tenere in considerazione nella riduzio-ne dello spazio di attributi è di ordine procedurale. Un errore nelquale, per eccesso di disinvoltura, incappa spesso chi passa dalpiano analitico (quello in cui vengono definite le classi in base allacombinazione delle modalità delle variabili combinate tra loro) aquello procedurale (quali istruzioni vanno date al calcolatore per-ché possa trasformare le combinazioni tra variabili in una variabi-le indice) è quello di trattare implicitamente le modalità comequasi-cardinali. Anziché impartire al calcolatore istruzioni di ordi-ne logico-combinatorio (del tipo se la variabile A vale x e la varia-bile B vale y, allora la variabile Z – che è la variabile indice – dovràvalere k12), alcuni ricercatori preferiscono imboccare la via piùsbrigativa del calcolo (che nella sintassi dei programmi informati-ci è del tipo: ad A si somma B per ottenere Z13). Così facendo, siproduce una situazione assurda: la distribuzione prodotta sull’in-dice tenderà ad assumere una forma forzatamente campanulate,privilegiando i valori centrali di scala.

Prendiamo come esempio due variabili, A e B, e immaginiamoche ciascuna di esse abbia 5 modalità. Procedendo attraverso l’as-segnazione di punteggi per via analitica (come nell’esempio a sini-stra della Tabella 20), le modalità della variabile-indice avrebberotutte lo stesso numero di celle assegnate. Nell’esempio a destra,invece, avremmo il valore 2 e il 10 che stanno in una sola cella, il 3e il 9 che stanno in due celle, il 4 e l’8 che stanno in tre celle, il 5 eil 7 che stanno in quattro celle, il 6 che sta in cinque celle. A que-sto punto si procede – erroneamente! – così: siccome si deve arri-vare a 5 modalità e se ne hanno 10, ogni coppia di modalità vieneaggregata (1+2; 3+4, eccetera). In questo modo i casi che assumo-no i valori centrali della variabile-indice tendono a essere a priori di

11 Per una variante di questa procedura, si vedano Pawson (1989) e Fideli (2001).12 In termini di sintassi in SPSS, la precedura è del tipo:if (variabileA=1 and variabileB=5) variabile_indice=4.con la stessa stringa ripetuta per ciascuna delle combinazioni.13 In termini di sintassi in SPSS, la precedura è del tipo:Compute variabile_indice=variabileA + variabileB.

58

più di quelli che si collocano sulle code della distribuzione14.

Tabella 20 – Confronto tra gli esiti di due procedure per impartire ordinidi calcolo al pc

L’effetto che viene inopinatamente prodotto in questo modoè quello di una compressione della distribuzione. Per analogia,possiamo immaginare che la distribuzione sia rappresentata daun’asta di metallo flessibile, dritta. Tutti i casi hanno la stessaprobabilità di ricadere in un punto qualsiasi della distribuzione.La procedura erronea illustrata comporta una compressione del-l’asta, tale per cui si produce un innalzamento verso l’alto com-primendola ai lati.

Una procedura che vorrebbe ovviare a queste difficoltà è quel-la che, prima di effettuare il calcolo (con il comando compute inSPSS, per esempio), richiede una ricodifica dei valori delle duevariabili ricorrendo ai numeri primi (nel nostro caso: 1, 2, 3, 5, 7per la prima variabile; 11, 13, 17, 19, 23 per la seconda). In questocaso il miglioramento è esiguo, visto che, per esempio, somman-do le due variabili possiamo ottenere 20 da 17+3, da 19+1 e da13+7, con i problemi, seppure attenuati, di cui si è appena parla-to. La procedura, oltre che infruttuosa e distorcente, è anche far-raginosa: richiede prima una ricodifica dei codici delle variabilida combinare in indice, quindi la procedura di calcolo e infineuna seconda ricodifica per i punteggi finali.

A 1 2 3 4 5 A 1 2 3 4 51 1 1 2 2 3 1 2 3 4 5 6

2 1 1 2 3 4 2 3 4 5 6 7

3 1 2 3 4 5 3 4 5 6 7 8

4 2 3 4 5 5 4 5 6 7 8 9

5 3 4 4 5 5 5 6 7 8 9 10

BB

14 È quanto accade con il lancio di due dadi: mentre ciascuno dei due ha singo-larmente la stessa probabilità che esca una delle sei facce, la probabilità che esca unnumero compreso tra 2 e 12, cioè tra minimo e massimo, non è la stessa: mentreinfatti la probabilità che esca un 2 è pari a 1/36, quella che esca un 7 è pari a 6/36.

59

II.3. L’IMPIEGO DEI GIUDICI NELLA CLASSIFICAZIONE

Attraverso la riduzione dello spazio di attributi abbiamo vistocome sia possibile, in alcune circostanze, passare dal livello catego-riale non ordinato a quello ordinato. È il caso osservato in prece-denza della riduzione dello spazio di attributi che utilizza la profes-sione (variabile a categorie non ordinate) per costruire un indice distatus socioeconomico a categorie ordinate. Come è noto, il pas-saggio dal livello più basso (categorie non ordinate) a quello piùalto (le cosiddette scale di rapporti della discussa tipologia diStevens15: ma sarebbe meglio parlare di scale cardinali dotate dizero assoluto) implica anche la possibilità di un più ampio spettrodi tecniche statistiche. Cioè a dire che il livello cardinale permetteun numero maggiore di operazioni rispetto a quello categoriale.

Ciò premesso, vediamo come sia possibile utilizzare un’altratecnica di costruzione degli indici a partire da variabili a catego-rie non ordinate che possono essere addirittura portate a livellocardinale senza troppi artifici. Si tratta della tecnica che ricorreall’utilizzo dei cosiddetti giudici, secondo un’impostazione che sirifà alle indicazione di Thurstone per la costruzione di una scaladi atteggiamento. Ne vedremo due diverse applicazioni: in que-sto paragrafo tratteremo quella che possiamo considerare comeun’alternativa alla riduzione dello spazio di attributi. Nel capito-lo successivo ne verrà illustrata una che è una variante degli indi-ci per somma.

Uno degli aspetti più problematici della riduzione dello spaziodi attributi è l’alto carattere di discrezionalità che ricade sulle spal-le del ricercatore. Non è un mistero per chiunque abbia pratica diricerca empirica il fatto che lo scienziato sociale, nell’isolamento

15 La manualistica metodologica non è affatto coerente rispetto alla nomencla-tura relativa alla natura (e, di conseguenza, alle operazioni possibili) delle variabili.Stevens (1946), uno dei padri della psicometria, adotto una nomenclatura cherimase per anni nel lessico delle scienze sociali e della statistica. Questa nomencla-tura prevedeva la distinzione tra “scale” nominali, ordinali, intervallari e di rappor-ti. La distinzione sopravvive ancora in qualche manuale (per esempio Ballatori,1986) ma è ormai superata dall’ampia riflessione che le preferisce quella tra varia-bili a categorie ordinate e non ordinate, e variabili cardinali (con o senza lo zeroassoluto; cfr. Ricolfi, 1985; Marradi, 1980 e 1981).

60

della stanza nella quale lavora, debba prendere – a dati ormai rac-colti – alcune decisioni che successivamente si mostreranno cru-ciali per l’esito della ricerca. Tra le molte che è costretto a prende-re, queste decisioni riguardano, nel caso di nostro interesse, i cri-teri di assegnazione dei ‘pesi’ da attribuire a variabili con catego-rie non ordinate. In questa direzione, il caso forse più emblemati-co e alla portata di tutti, quello che prima o poi ci capiterà senz’al-tro di mettere in pratica o al quale abbiamo assistito o assistere-mo, è quello dell’attribuzione dei punteggi che contribuiscono aformare un indice di status socioeconomico. L’indice di status èun indice solitamente a composizione mista: ad esso contribuisco-no infatti tanto variabili a categorie ordinate (il titolo di studio, peresempio) quanto variabili a categorie non ordinate, quali peresempio la professione e persino (lo vedremo in seguito) il sesso.

Se nel caso delle variabili a categorie ordinate la questionesembra essere di poco conto, nel caso di quelle a categorie nonordinate le implicazioni tecniche, metodologiche nonché l’inte-ro bagaglio di competenze pregresse alle quali il ricercatore fariferimento per utilizzarle al fine di costruire un indice hanno unpeso nient’affatto trascurabile. Dobbiamo infatti ricordare che ilfine al quale è normalmente indirizzata la costruzione di un indi-ce di status è quello dell’ordinamento delle unità di analisi (quan-do queste, per esempio, sono persone) lungo un continuum.Esistono naturalmente delle eccezioni a questo scopo euristicodi prassi comune nella ricerca sociologica, ma si tratta – comenel caso della mappatura dei campi sociali compiuta da PierreBourdieu – di casi che fanno della categorizzazione dei soggetti– in base, per esempio, ai gusti o allo stile di vita – lo scopounico della ricerca.

Il ricercatore che invece voglia costruire un indice di status sitrova, come si accennava all’inizio del paragrafo, a dover fare rife-rimento soprattutto sulle proprie competenze pregresse.Supponiamo che il compito del ricercatore sia quello di costruireun indice di status di un campione di studenti universitari, indiceche in un secondo tempo metterà a confronto con la media otte-nuta agli esami per convalidare l’ipotesi secondo la quale a uno sta-tus più elevato si accompagna normalmente una migliore riuscita

61

negli studi (Cfr. Alì, 1988; De Francesco, 1989; Dei, 1996).Qual è la procedura che adotterà normalmente il ricercatore?

È presto detto. Nella parcellizzazione del lavoro di ricerca, nondi rado accade che l’operazione di analisi dei dati – considerataa torto da alcuni lo sfrido della ricerca sociale, uno dei momen-ti meno nobili di essa, alla pari con la fase di raccolta dei dati –venga demandata a uno statistico o a un sociologo con compe-tenze specifiche in quest’ambito. In perfetta buona fede, il ricer-catore che si è assunto questa responsabilità inizierà dunque aoperare le proprie congetture.

Stando all’esempio sopra citato, inizierà con il ritenere che lostatus del padre incide complessivamente di più di quello dellamadre sullo status complessivo dei figli (con implicazioni all’ap-parenza parossistiche, tali per cui una variabile a categorie nonordinabili come il genere viene ordinata). In secondo luogo,comincerà a raggruppare le professioni esercitate da entrambi igenitori in categorie più ampie: alle professioni più remunerati-ve e di maggiore prestigio, per esempio, verrà accordato un pun-teggio di status maggiore rispetto ad altre più umili e meno red-ditizie. Il lettore si starà domandando cosa ci sarà mai da obiet-tare rispetto ad una prassi di ricerca condotta in questo modo.Effettivamente, nulla: la prassi è pressoché paradigmatica e,risorse alla mano, quasi indefettibile. Il problema è che una partecospicua dell’esito della ricerca, come si accennava, dipendedalle decisioni operate da questo singolo ricercatore alle presecon l’analisi dei dati. Non è così raro, poi, che il ricercatore stes-so non abbia preso parte alle precedenti fasi di concettualizza-zione e raccolta dei dati, talché gli viene affidato di peso un com-pito accompagnato magari soltanto da precisazioni sommarie.

Come si può ovviare a questo inconveniente?Una soluzione che sembra senz’altro utile è quella di allargare

il numero degli analisti – senza per questo dovere affidare acostoro compiti specifici che magari non potrebbero o saprebbe-ro affrontare – utilizzandoli come giudici. Detto altrimenti, baste-rebbe coinvolgere, per esempio, coloro che hanno preso partealle fasi precedenti della ricerca nella valutazione dei punteggi daattribuire nella costruzione di un indice di status di questo tipo.

62

Si tratta, in altre parole, di allargare il campo di applicazione diuna tecnica che ha già dei saldi riferimenti metodologici: baste-rebbe ricordare quello richiamato da Goode e Hatt (1952,pp.368-369) sulla valutazione della validità di contenuto o quel-lo, citato in precedenza, della procedura di costruzione dellascala Thurstone.

Il ricorso ai giudici sarebbe sufficiente a garantire una maggio-re controllabilità nella fase di analisi dei dati? La risposta è checertamente un passo del genere consentirebbe una maggiore‘obiettività’ ma sarebbe ancora meglio integrare questa soluzio-ne con altre. In questa direzione, viene per esempio in aiuto lascomposizione di un concetto come quello di professione lavo-rativa nelle dimensioni attraverso le quali ci formiamo un’ideadel valore delle diverse professioni. Una strada, seguendoWeber, potrebbe essere quella di valutare distintamente duecomponenti del concetto di professione lavorativa: quello diprestigio e quello di potere economico.

Nella già citata ricerca sulla valutazione della didattica presso icorsi di laurea di Sociologia e Scienze della Comunicazionedell’Università ‘La Sapienza’ di Roma, il gruppo di ricerca ha pro-ceduto proprio seguendo questa strategia di analisi. Dopo ladiscussione collegiale delle dimensioni individuabili nel concettodi professione, con riferimento tanto a quelle riferibili a ciò chePierre Bourdieu (1979) chiama il ‘capitale culturale’ implicito nelleprofessioni stesse, quanto a quelle legate all’aspetto economico,psicologico, eccetera.

Sono state individuate quattro dimensioni: la responsabilità, lacompetenza richiesta, il grado di autonomia decisionale e la considerazionesociale. I 6 membri dell’équipe di ricerca che hanno partecipato aquesta fase della costruzione del dato empirico, calandosi nelruolo di ‘giudici’ (Cfr. Goode e Hatt, 1952, p.393), hanno attribui-to un punteggio progressivo a ciascuna delle quattro dimensioni,in maniera da evitare l’inflazione dei punteggi dovuta all’uso checiascuno dei giudici ne avrebbe potuto fare (qualcuno avrebbepotuto attribuire quattro punteggi ‘leggeri’ mentre qualcun altroavrebbe potuto ricorrere soltanto a quelli ‘pesanti’: in questomodo, i due giudici avrebbero offerto contributi molto diversi). Al

63

termine di questa operazione, ciascuna dimensione avrebbe‘pesato’ sulla costruzione finale dell’indice in ragione del valoremediano attribuitole dai giudici (Tabella 21).

Tabella 21 – Attribuzione dei punteggi alle quattro dimensionidelle professioni

Il passo successivo (Tabella 22) consisteva nell’attribuire unpunteggio – in una scala da 1 (minimo) a 7 (massimo) – a cia-scuna delle quattro dimensioni di tutte le combinazioni tra pro-fessioni, titolo di studio e condizione occupazionale rintracciatedurante la raccolta dei dati. In questo modo, si è ottenuta lamediana ricavata dai valori espressi da tutti i giudici.

Tabella 22 – Attribuzione dei punteggi alla “considerazione sociale” di alcune professioni

A B C D E F MedianaResponsabilità 3 3 3 3 2 4 3,0

Autonomia decisionale 2 4 4 4 3 2 3,5

Competenza 1 2 2 2 1 1 1,5

Considerazione sociale 4 1 1 1 4 3 2.0

Giudici

Dim

ensi

oni

A B C D E F

Commerciante, media superiore, dipend. 4 3 2 2 1 3 2,5Commesso, media sup., dipendente 1 1 3 1 1 2 1,0

Consulente, laureato, autonomo 5 7 6 5 4 6 5,5

Cuoco, basso titolo studio, dipendente 3 4 2 3 3 3 3,0

Dipendente privato, basso titolo, dip. 2 2 2 3 2 2 2,0

Dipendente pubblico, media sup., dipend. 3 3 3 3 2 4 3,0Direttore di banca, laureato, dipendente 6 7 6 6 5 7 6,0Dirigente d'azienda, media sup., 6 7 5 5 5 5 5,0Dirigente pubblico, basso titolo, dipend. 4 6 4 4 5 5 4,5Disegnatrice, media sup., dipendente 4 4 4 3 4 4 4,0

Mediana

Prof

essi

oni

Giudici

64

L’ultimo passo (Tabella 23) consisteva nell’attribuire un pun-teggio per ciascuna professione pari alla somma dei prodotti trail peso che essa aveva su ciascuna delle quattro dimensioni per ilvalore mediano acquisito rispetto a ciascuna di esse, come nel-l’esempio riportato nella tabella 23. In questo modo, è stato pos-sibile garantire una maggiore obiettività nell’attribuzione dei pesia ciascuna professione.

Tabella 23 – Calcolo del punteggio finale del “capitale culturale” generatoda scolarizzazione e professione di 4 soggetti

Il ricorso ai giudici per la costruzione di un indice a catego-rie ordinate partendo da variabili a categorie non ordinate hal’indubbio vantaggio di snellire procedure altrimenti laboriose.In questo senso, un contributo significativo e a tutt’oggi in qual-che misura “paradigmatico” di tecnica di sintesi su dati di que-sta natura viene fornito da una brillante ricerca che De Lillo eSchizzerotto pubblicarono nel 1985 col titolo La valutazione socia-le delle professioni16.

Dopo avere posto una distinzione sul piano teorico tra indi-ci di status socio-economico, scale relazionali e scale reputazio-nali, i due autori concentrano su queste ultime la loro attenzio-ne. La differenza con l’indice proposto nelle pagine precedenticonsiste nel fatto che i due autori anziché ricorrere ad un grup-po di giudici, affidano l’attribuzione dei punteggi di scala (con

punteggio peso punteggio peso punteggio peso punteggio pesoAg. di commercio, basso tit., aut. 2,0 3 5,0 3,5 3,0 1,5 2,0 2 32Ausiliario sanità, basso titolo, dip. 3,0 3 2,0 3,5 2,5 1,5 2,0 2 24Avvocato, laureato, autonomo 6,0 3 7,0 3,5 7,0 1,5 7,0 2 67Operaio, media superiore, aut. 2,5 3 3,5 3,5 2,5 1,5 2,0 2 28Pr

ofes

sion

e

Autonomiadecisionale

CompetenzaConsiderazione

socialePunteggio

finale

Responsabilità

16 È interessante notare come la sociologia si sia sforzata nel tempo di stan-dardizzare operativamente quei concetti che ricorrono con maggiore frequenzanella ricerca. A questo proposito, trent’anni fa Perrone (1977, p.91) scriveva chel’indice di status prodotto da indicatori come il reddito annuo, l’occupazione el’istruzione sia “divenuto oggi la misura standard di gerarchia sociale nella socio-logia quantitativa”.

65

un criterio che vedremo tra breve) a un campione piuttostovasto di rispondenti. De Lillo e Schizzerotto assumono, infatti,che le persone abbiano competenze per valutare quelle profes-sioni che sono direttamente connesse con quelle che essi stessiesercitano ovvero quelle professioni svolte da persone dell’en-tourage del quale fanno parte.

Le scale reputazionali vengono dunque costruite con dueaccorgimenti: 1) ciascun intervistato risponde a un numero limi-tato di professioni (arrivando a scalare 590 occupazioni; De Lilloe Schizzerotto, 1985, p.53); 2) lo scalaggio delle occupazioniricalca la tecnica della scala Guttman, che prevede, in luogo del-l’assegnazione di un punteggio ad ogni elemento della scala, l’or-dinamento di ciascun elemento, con possibilità di ex-aequo.

Al di là della differenza procedurale, la scala proposta da DeLillo e Schizzerotto suggerisce anch’essa l’individuazione di unaserie di indicatori sottesi al concetto di “prestigio sociale delleoccupazioni”. Affrancandosi da una definizione di prestigiolegata alla tradizione sociologica classica – quella di Weber,Pareto, Michels, per intendersi – secondo la quale il prestigiorimanderebbe a una dimensione di “superiorità e inferioritàsociale a carattere eminentemente simbolico e sociale” (ibi, p.57), i due autori trascelgono come indicatori del concetto l’insie-me “dei vantaggi e dei prerequisiti materiali (ricchezza, reddito,possibilità di carriera, posizione nella gerarchia organizzativa,grado d’autonomia, ecc.) e immateriali (livello d’istruzione e diqualificazione, grado di soddisfazione nel lavoro, intensità delrispetto pubblicamente goduto, ecc.) derivanti e richiesti dal-l’esercizio delle diverse occupazioni” (ibi, p. 71).

L’indice al quale pervengono dopo un lavoro metodologicocomplesso e certosino viene chiamato indice di preferibilità (Ip) edè così composto:

2Ni + NeIp = —————— x 100

2 (N – 1)

dove N è il numero di occupazioni che l’intervistato deve gra-duare; Ni è il numero di occupazioni che, in un ordinamento

66

dato, possiedono una posizione inferiore a quella dell’occupa-zione di cui si sta calcolando il punteggio; Ne è il numero dioccupazioni che, in un ordinamento dato, possiedono un rangopari a quello dell’occupazione in esame (ibi, p. 98).

(N – 1) è il “numero di confronti a coppie possibili per cia-scun oggetto e quindi 2 (N – 1) rappresenta il valore massimo dipunteggi elementari e dove, inoltre, il fattore 100 è usato soloper far variare Ip da 0 a 100” (ibidem).

Poniamo che un intervistato abbia assegnato la 7a posizionea un’occupazione, collocandola ex-aequo con un’altra su un tota-le di 10. Il punteggio di quella occupazione sarebbe allora:

2x2 + 1 5Ip = ———— x 100 = —— x 100 = 27,7

2 (10 – 1) 18

Il confronto tra le due tecniche di costruzione di un indicequasi-cardinale a partire da variabili a categorie non ordinatemostra ancora una volta due cose: innanzitutto che – quale che siala tecnica adottata – procedure più elaborate come quelle testé pre-sentate sono foriere di risultati più attendibili rispetto a una sem-plice riduzione di spazio di attributi (come nell’esempio di Statera,1982, riportato in Tabella 10), in quanto privano il ricercatore del-l’intero carico di responsabilità in merito all’attribuzione dei pun-teggi di scala. In secondo luogo, ancora una volta dovrebbe risul-tare chiaro quanto nell’ambito delle tecniche di costruzione degliindici ci sia di aleatorio, nel senso che è spesso la creatività del ricer-catore nonché la sua abilità anche di carattere matematico ad avereun potenziale decisivo sui risultati finali.

Riassumendo, è auspicabile che – quando il ricercatore socia-le si trova a dover costruire uno spazio d’attributi che inglobavariabili a categorie non ordinate e quando lo scopo è quello diintegrarle in un indice che si trasforma in una variabile ordinale– il ricercatore stesso non venga a trovarsi in una situazione diisolamento. Un primo passo da compiere per una costruzionedegli indici più accorta possibile è quello di evitare di produrremere sintesi meccaniche, a tavolino. Un secondo passo utile è

67

quello di ripartire il compito con altri membri dell’équipe diricerca, utilizzando poi i valori mediani che scaturiscono dall’at-tribuzione del peso che ciascuno di essi assegnerebbe alle diver-se dimensioni del concetto in oggetto.

Va infine precisato che – nel caso di utilizzo di più di duevariabili categoriali – una possibile alternativa agli indici tipolo-gici può essere l’analisi delle corrispondenze multiple (ACM).Questa tecnica può essere considerata come l’equivalente, pervariabili categoriali, della analisi in componenti principali. Allastregua dell’analisi in componenti principali, l’ACM opera unasintesi sulle variabili, mediante un doppio processo di scompo-sizione in forma matriciale (matrice disgiuntiva completa ematrice di Burt) che produce uno spazio tipologico multidimen-sionale all’interno del quale possiamo trovare tutte le combina-zioni binarie delle variabili prese in considerazione per costruirel’indice. Supponiamo di avere tre variabili con 3 modalità (lavariabile a), ancora 3 modalità (la variabile b) e 2 modalità (lavariabile c). Lo spazio tipologico creato dalla matrice di Burt avràqueste sembianze:

Tabella 24 – Esempio di matrice di Burt

Lo spazio a 64 celle della Tabella 24 ingloba le 9 combinazio-ni prodotte dall’incrocio tra le diverse modalità di ciascuna delletre variabili, creando cioè degli spazi di attributi. L’operazione disintesi della ACM produce dei fattori, rispetto ai quali (in gene-re ci si ferma al primo) è possibile assegnare ai casi dei valori

68

indice, che è appunto ciò che andavamo cercando tramite que-sta procedura. È però bene chiarire che se le variabili sono innumero ridotto (indicativamente, fino a 5) il gioco non vale lacandela, non fosse altro che per il fatto che per ottenere un valo-re di sintesi dovremmo imbarcarci in una procedura piuttostocomplessa, specialmente nelle sue fasi preparatorie. Va anchedetto che l’ACM, alla stregua dell’ACP, viene per lo più impiega-ta come tecnica di analisi esplorativa dei dati: ciò significa che seil ricercatore ha idee molto chiare in merito agli indicatori di undeterminato concetto, il ricorso ad essa può apparire come unsegno di sfiducia mostrato dal ricercatore nei confronti delle suestesse elaborazioni teoriche.

69

CAPITOLO IIIGLI INDICI MATEMATICI

III.1. GLI INDICI ADDITIVI

Sotto il profilo procedurale, gli indici additivi (o per somma)rappresentano una delle procedure più semplici per costruirevariabili cardinali o quasi-cardinali. In più, essi vengono adotta-ti in situazioni che si presentano come assai diverse l’una dall’al-tra, sicché non possiamo dire che questo tipo di indici delimitiun ambito precipuo.

È proprio per l’estrema semplicità che essi richiedono in ter-mini di conversione in procedure di sintassi nell’analisi dei datiche il ricorso a questo genere di indici è così ampiamente diffu-so. Vediamo allora quali sono gli ambiti d’applicazione di questiindici e quali i loro limiti. Si cercherà inoltre di mostrare qualialternative esistano ad essi: alternative in alcuni casi con piùampie garanzie di rigore metodologico ma che richiedono ancheuna maggiore difficoltà procedurale.

Gli indici per somma vengono adottati:- per variabili a categorie non ordinate;- per variabili a categorie ordinate;- per variabili quasi-cardinali;- per variabili cardinali.

Per definizione, la somma è un conteggio. Ne deriva che sol-tanto le variabili cardinali e quelle quasi-cardinali (quelle cioè otte-nibili per misurazione derivata, come suggerisce Marradi, 1980,p.50) hanno trovato legittimamente spazio in questo ambito. Atutta prima, sembrerebbe invece inspiegabile una loro possibileapplicazione con variabili di natura categoriale, peggio se le cate-gorie non sono neppure ordinabili.

70

Si tratta, in verità, di una sorta di escamotage procedurale mira-to a eludere alcuni problemi con la sintassi di programmi perl’analisi dei dati come SPSS. Vale a dire che il ricorso agli indiciper somma avviene in un’ottica interamente stipulativa, in cui lacombinazione tra i punteggi assegnati a due variabili categorialifa scaturire una variabile indice alla quale viene dato un ulterio-re punteggio stipulativo. Ecco perché, ad esempio, nella costru-zione di uno spazio di attributi un indice per somma non va real-mente a sommare i punteggi, ma serve soltanto a passare rapi-damente all’attribuzione dei valori-indice senza dover fare ricor-so a una più complicata sintassi basata sugli operatori logici.

Riprendiamo per esempio la costruzione di uno spazio d’at-tributi come quello mostrato in Tabella 10, relativo alla costru-zione di un indice di status socio-professionale. Se assegniamo aciascuna delle quattro categorie professionali un valore (di ovvianatura stipulativa) e facciamo altrettanto con le 4 categorie rela-tive al titolo di studio, ci troviamo nella condizione di tradurrequesta procedura “carta e matita” in una serie di istruzioni perla sintassi applicativa.

Se, dunque, i codici assegnati a una ipotetica variabile istruzio-ne (‘istruzio’, nella sintassi) sono i seguenti:

1 per licenza elementare o meno2 per licenza media inferiore3 per diploma media superiore4 per laurea

e

10 per negoziante, artigiano, agricoltore, operaio20 per impiegato non direttivo, sottufficiale, insegnante

elementare30 per ufficiale, funzionario direttivo, professore di scuola

media40 per professionista, docente universitario, dirigente,

imprenditore

per quanto riguarda invece la professione (‘profess’ nella sintas-si), allora è possibile procedere in due modi. Uno è quello diricorrere agli operatori logici per ciascuna combinazione, come

71

nell’esempio che segue, che richiama la sintassi del programmadi analisi statistica per le scienze sociali SPSS:

If (istruzio=1 & profess=10) status=1If (istruzio=2 & profess=10) status=2If (istruzio=3 & profess=10) status=3If (istruzio=4 & profess=10) status=4If (istruzio=1 & profess=20) status=2If (istruzio=2 & profess=20) status=2If (istruzio=3 & profess=20) status=3If (istruzio=4 & profess=20) status=3If (istruzio=3 & profess=30) status=4If (istruzio=4 & profess=30) status=4If (istruzio=1 & profess=40) status=3If (istruzio=2 & profess=40) status=3If (istruzio=3 & profess=40) status=4If (istruzio=4 & profess=40) status=517

L’alternativa, ricorrendo appunto a una procedura per somma,è la seguente:

compute status=istruzio+profess.

Con questo comando si impone al programma di calcolare lavariabile indice “status” a partire dalla somma di istruzione e pro-fessione. A questa elementare stringa di comando deve natural-mente seguire la ricodifica della variabile ottenuta: ogni possibileesito della somma (da 11 a 41) deve essere riportato alle 5 catego-rie finali. Così procedendo, è necessario usare l’accorgimento dinon adottare codici che possano dare luogo a somme derivate dacombinazioni diverse (per esempio, 2+3 ma anche 1+4 fornireb-bero il codice 5)18.

17 La combinazione tra licenza elementare o media e ufficiale, funzionario diret-tivo e professore di scuola media non può avere luogo. Pertanto, è stata esclusa dallepossibili combinazioni. ‘Istruzio’ e ‘Profess’ stanno per ‘livello d’istruzione’ e ‘profes-sione’. Sono riportati in questo modo per rispettare i vincoli di programmi comeSPSS, che non consentono di assegnare alle variabili più di 8 caratteri.

18 Si tratta di una variante corretta rispetto alla procedura erronea presentatain coda al par. 2.2., dove i codici iniziali della variabile venivano rimpiazzati dainumeri primi, quindi sommati e infine ricodificati ulteriormente.

72

Talvolta la medesima procedura viene applicata anche a scalecon categorie ordinate o a scale auto-ancoranti. L’effetto, nelprimo caso, è quello di forzare la natura delle variabili, portan-dole a un livello quasi cardinale e trascurando implicitamente ilproblema del peso che le diverse variabili che compongono l’in-dice così ottenuto hanno nel rapporto di indicazione con il con-cetto originario. Nel caso delle scale auto-ancoranti, il discorsonon cambia granché: ricorrendo agli indici per somma, si assu-me implicitamente che vi sia una corrispondenza tra la metricaadottata e il valore semantico dei picchetti della scala, cosa chedobbiamo assumere con una certa cautela19. Esemplificativo inquesto senso potrebbe essere il termometro dei sentimenti, conindici costruiti appunto mediante la semplice somma dei pun-teggi relativi agli indicatori dei diversi atteggiamenti. È una pra-tica assai diffusa, un efficace compromesso tra analisi dei dati etecniche di raccolta, ma esistono soluzioni più efficaci.

Sono tuttavia disponibili alcune alternative a questa prassi dianalisi, che resta comunque indefettibilmente valida nel casodelle variabili sottoponibili a conteggio. Vediamole.

Le variabili quasi-cardinali – secondo la terminologia adotta-ta da Marradi (1980) – sono quelle la cui cardinalità è assunta sti-pulativamente, prive pertanto di un’origine (o zero) assoluta.

Un uso assai comune degli indici ottenibili da variabili di que-sta natura riguarda le scale di atteggiamento, alcune delle quali –come la Likert – richiedono ai soggetti a cui sono rivolte di posi-zionarsi lungo un continuum che oscilla tra un massimo di accor-do con un determinato stimolo, offerto sotto forma di proposi-zione, e un massimo di disaccordo. Accordo e disaccordo vengo-no puntellati con dei numeri, passando per esempio da -3 (totaledisaccordo) a +3 (totale accordo) oppure da 0 (totale disaccordo)a 5 (totale accordo) e via dicendo. La posizione del soggetto sull’in-sieme di questi stimoli, volti a raccogliere informazione rispetto aun determinato atteggiamento, viene computata sulla base dellasomma dei punteggi attribuiti all’accordo/disaccordo con i diversistimoli (items), con due conseguenze: da una parte, si dimentica inquesto modo che tra l’accordo (o il disaccordo) e i punteggi che

19 Per una discussione critica, si veda Marradi (2007, p. 159).

73

vengono poi immessi in matrice vi è – si perdoni il gioco di parole– un accordo soltanto stipulativo. In scale di questo tipo, –2 nonvuole dire “abbastanza in disaccordo” nella stessa misura per tuttele persone e quindi il giunto tra il numero e il suo referente verbaleè quanto mai labile20. In secondo luogo, in questi casi si trascuraspesso il fatto che gli stimoli non hanno tutti la stessa capacità dicogliere l’essenza dell’atteggiamento che si intende ‘misurare’ o, perdirla con termini più tecnici, la loro parte indicante e la loro parteestranea non sono per tutti equivalenti21. Molti autori risolvonoquesto problema caldeggiando l’impiego di scale auto-ancoranti,che godono peraltro, in sede di analisi dei dati, degli stessi vantaggidelle variabili cardinali (Delli Zotti, 1997, p. 195).

Occorrerebbe pertanto, quando si costruisce un indice par-tendo da variabili di questo tipo, fare attenzione (vedremo poicome) alle operazioni algebriche che si compiono.

Un secondo caso di indici quasi-cardinali è rinvenibile nell’at-tribuzione di punteggi a una prova di abilità, di intelligenza, dicultura, eccetera. Anche in questo caso, alcune domande (o sti-moli) potrebbero avere un peso maggiore o minore rispetto adaltre sulla valutazione complessiva della proprietà che contribui-scono a ‘misurare’.

Come ovviare dunque agli inconvenienti che derivano dallacostruzione di variabili quasi-cardinali che non tengono contodel diverso peso delle variabili che vanno a comporli?

Per illustrare le possibili soluzioni al problema, è necessariopartire dalla pratica comune, basata sugli indici additivi.

Il caso più diffuso è rappresentato dai test che siamo abitua-ti a trovare sulle pagine dei rotocalchi, ai quali continuiamo afare riferimento proprio per via della loro familiarità a un pub-blico assai esteso.

Questi test riportano a volte delle domande di cultura generale,oppure settoriale, per farci sapere – ad esempio – quanto siamo pre-parati sulla new-economy, se abbiamo una cultura storica, se difettia-mo nelle nozioni basilari di carattere scientifico e via discorrendo.

20 Per una discussione critica sull’argomento, si veda Marradi e Gasperoni, 2003.21 Per una descrizione critica di questa scala, si veda Pavsic e Pitrone (2003).

74

In generale, il calcolo del punteggio complessivo è ricavatoda una semplice somma delle risposte giuste. Se su 10 domanderispondiamo ad 8, il nostro punteggio sarà ovviamente 8. L’esitodi questa operazione ha due corollari:1. che le domande – sia quelle alle quali abbiamo dato una

risposta corretta che le altre – abbiano tutte lo stesso livellodi difficoltà. Se così non fosse, il nostro punteggio non sareb-be uguale al numero di risposte esatte conseguite;

2. che se il nostro vicino di ombrellone, o la nostra fidanzata o ilnostro papà – che hanno seguito lo stesso test – hanno conse-guito il nostro stesso punteggio, la nostra “competenza” rispet-to all’oggetto del test è pari alla loro.

Sono giuste queste due implicazioni? Rispetto alle premesse,certamente sì. Il problema, però, è che le premesse sono sbagliate.Nelle righe successive si cercherà di dimostrare empiricamente – econ il dovuto sostegno teorico – che computando un indice inquesta maniera si può arrivare a risultati che sfiorano il paradosso.

Immaginiamo – anche se i dati che stanno per essere presen-tati sono assolutamente reali, nel senso che, nomi a parte, proven-gono da una ricerca sugli stili di vita dei giovani – di sottoporre ungruppo di 20 ragazzi a un test di cultura generale. Questi ragazzihanno dovuto rispondere a 24 domande. Secondo la tecnica dicostruzione degli indici per semplice somma, otterremmo in pun-teggio che nella Tabella 25 è indicato con B. Alcuni confronti trai soggetti della nostra inchiesta serviranno a mostrare in che misu-ra questa tecnica possa ingannare22.

Prendiamo innanzitutto Liliana e Manlio. Chi ha mostratomaggiore preparazione tra i due? A tutta prima, sembrerebbeLiliana: la ragazza ha infatti collezionato 12 risposte esatte con-tro le 9 di Manlio, rispondendo così in maniera esatta alla metàdelle domande complessive. Al contrario, Manlio ha risposto cor-rettamente a poco più di un terzo delle domande (37,5%). È giu-sto allora concludere che lo scarto tra i due abbia questa entità?La risposta è certamente affermativa se ci si basa ciecamente sul

22 Un’analisi molto interessante di come le diverse procedure si sintesi dei datiin indici possano produrre risultati assai diversi è in Allegra e Larocca (2004).

75

criterio di costruzione degli indici basato sulla semplice somma.Ma questo criterio, bisogna tornare a ripeterlo, poggia sull’as-sunto che gli indicatori che contribuiscono a formare l’indiceabbiano tutti lo stesso peso.

Tabella 25 – Confronto tra i punteggi calcolati sulle stesse prove ma contecniche diverse

Quale soluzione offrire, dunque? Una soluzione possibile,ancora una volta, è quella di intervenire il meno possibile ‘a tavoli-no’ e di fare parlare i dati empirici. In questo senso, è possibile uti-lizzare un criterio per la ponderazione delle diverse domande checontribuiscono a formare il punteggio complessivo del nostroesempio, ricorrendo alla distribuzione di risposte esatte (e, per con-verso, di risposte sbagliate) date a ciascuna domanda. L’assunto dipartenza è semplice: le domande più facili sono quelle che hannoottenuto la più alta percentuale di risposte esatte; viceversa, quelle

SoggettoA. Punteggio

ponderato

Punteggiorelativo calcolato

su A.

B. Punteggio persomma

Punteggiorelativo calcolato

su B.

Scarto tra i duepunteggi relativi

Amintore 29,4 3,1 3 12,5 -9,4Basilio 75,0 7,8 4 16,7 -8,9Ciriaco 169,6 17,7 7 29,2 -11,5Dalmazio 172,2 17,9 4 16,7 1,3Elisa 227,5 23,7 9 37,5 -13,8Ferruccio 235,7 24,5 7 29,2 -4,6Giuditta 236,0 24,6 9 37,5 -12,9Heather 266,8 27,8 8 33,3 -5,6Ida 280,0 29,2 10 41,7 -12,5Liliana 328,7 34,2 12 50,0 -15,8Manlio 341,4 35,5 9 37,5 -2,0Norberto 342,4 35,7 10 41,7 -6,0Otello 551,1 57,4 17 70,8 -13,5Pamela 551,4 57,4 14 58,3 -0,9Quinto 583,9 60,8 15 62,5 -1,7Raimondo 729,1 75,9 20 83,3 -7,4Samuele 747,5 77,8 19 79,2 -1,3Torquato 751,9 78,3 20 83,3 -5,0Ugo 765,8 79,7 21 87,5 -7,8Vanda 768,5 80,0 20 83,3 -3,3

76

più difficili sono quelle che ne hanno ottenute di meno.Per chiarire meglio questo punto, entriamo più nel dettaglio,

rimanendo nell’ambito della medesima ricerca. Supponiamo che ilpunteggio complessivo vada costruito su tre sole domande (il che,se fosse vero, offrirebbe peraltro un ulteriore vantaggio: quello diportare i punteggi possibili da 3, frutto rispettivamente di 1, 2 o 3risposte esatte, a 9, frutto delle permutazioni ottenibili da 2n – 1 equindi segmentando maggiormente il numero di persone chehanno risposto alle domande23). Le domande sono le seguenti:

Chi è l’autore del noto saggio di astrofisica Dal Big Bang ai buchineri?

1. Einstein2. Hawking3. Rubbia

Chi ha composto La Traviata?1. Puccini2. Rossini3. Verdi

Chi ha scritto la raccolta di poesie Ossi di seppia?1. Montale2. Quasimodo3. Ungaretti

23 Il numero di punteggi possibili da un insieme di n domande – una sempli-ce nozione di calcolo combinatorio – si ottiene elevando a n 2 e sottraendo 1.Perciò, per 3 domande il numero di combinazioni è 7, per 4 è 15, per 5 è 31 e per24 – il numero effettivo di domande della ricerca alla quale si sta facendo riferi-mento – è di 16777215. Si noti che la crescita del valore è ovviamente esponen-ziale e che facilmente il numero ottenuto esubera quello dei soggetti che fannoparte di un campione convenzionale (diciamo dalle 2000 alle 20000 unità per lericerche più estese). Questo significa che se volessimo ordinare perfettamente20000 soggetti sottoposti a un’inchiesta lungo una scala di punteggi ottenuti da untest simile a quello al quale stiamo facendo riferimento, sarebbero sufficienti 15sole domande. La probabilità che due soggetti qualsiasi abbiano esattamente lostesso punteggio (se calcolato in questo modo) è 1:210 (0,48%), pari cioè alle per-mutazioni fattoriali di 15 di ordine 2. Per tre 3 soggetti, questa probabilità scende-rebbe a 1:2730 (0,04%).

77

Lo spoglio delle risposte ha fornito l’esito riportato rispetti-vamente in Tabella 26, Tabella 27 e Tabella 28:

Tabella 26 – Risposte alla domanda Chi è l’autore del noto saggio di astrofisica“Dal Big Bang ai buchi neri”?

Tabella 27 – Risposte alla domanda Chi ha composto “La Traviata”?

Tabella 28 – Risposte alla domanda Chi ha scritto la raccolta di poesie “Ossi di seppia”?

Nella parte b di ciascuna della 3 tabelle è riportata la quotapercentuale di soggetti che hanno fornito una risposta sbagliata.È intuitivo che quante più sono state le risposte sbagliate registra-te a una singola domanda, tanto più quella domanda dovrà esse-re considerata ‘difficile’. Il valore ponderale della domanda devedunque essere desunto dalla quota di risposte sbagliate: rispon-dendo giusto alla domanda sulla fisica (la prima), si otterrà un

a Valori assoluti Valori percentuali b Valori assoluti Valori percentualiHawking 136 52,5 Giusto 136 52,5

Einstein 47 18,1 Sbagliato 123 47,5

Rubbia 76 29,3

Totale 259 100,0 Totale 259 100,0

a Valori assoluti Valori percentuali b Valori assoluti Valori percentualiVerdi 181 69,9 Giusto 181 69,9

Puccini 46 17,8 Sbagliato 78 30,1

Rossini 32 12,4

Totale 259 100,0 Totale 259 100,0

a Valori assoluti Valori percentuali b Valori assoluti Valori percentualiMontale 175 67,6 Giusto 175 67,6

Ungaretti 41 15,8 Sbagliato 84 32,4Quasimodo 43 16,6Totale 259 100,0 Totale 259 100,0

78

punteggio di 47,5; rispondendo giusto a quella sulla poesia siotterrà un punteggio di 30,1 e rispondendo in maniera correttaalla terza domanda, quella sulla musica, si ottengono 32,4 punti.Pertanto, il punteggio complessivo sarà dato dalla somma dei punteggirelativi ai pesi (il valore di ponderazione) attribuiti a ciascuna delle doman-de alle quali si è risposto in maniera corretta.

Se un soggetto risponde esattamente alle prime due doman-de, meriterà dunque un punteggio più alto rispetto a un altro cheha risposto esattamente alle seconde due.

Torniamo allora a Manlio e Liliana. Nel loro caso, lo scartotra il numero di risposte esatte fornite è stato piuttosto contenu-to e il saldo in passivo va però a vantaggio di Manlio, che harisposto a domande più difficili. In questo modo, il punteggiosul quale si assestano i due diventa praticamente lo stesso guar-dando il punteggio relativo riportato sulla terza colonna dellaTabella 25. Nella stessa tabella si può osservare che lo scartoaltrettanto vistoso rispetto al punteggio calcolato additivamentetra Otello e Pamela viene riproporzionato in seguito alla ponde-razione. Il loro punteggio calcolato attraverso la ponderazionerisulta più ‘veritiero’ rispetto a quello calcolato per somma: nelcaso di Pamela, esso rimane pressoché inalterato (57,4 contro58,3), mentre nel caso di Otello subisce una notevole “inflazio-ne”, passando dal 70,8 al 57,4 (si deve sempre tenere conto che100 è il punteggio massimo in entrambi i casi).

L’opportunità di seguire la procedura fin qui descritta è ulterior-mente enfatizzata da una prova empirica condotta a ridosso dellastessa ricerca. Una batteria di 20 domande è stata testata su un cam-pione-pilota di 259 soggetti. La batteria conteneva domande a quizcon tre alternative di risposta ciascuna. Gli intervistati erano tenutia fornire una sola risposta e non avevano la possibilità di risponde-re ‘non so’. La stessa batteria è stata sottoposta a un gruppo di 18giudici, ai quali – dopo avere fornito loro i parametri per identifica-re il campione di riferimento (rispetto alla distribuzione del campio-ne per età, livello di scolarizzazione e genere) – è stata chiesto digraduare in maniera ordinale le 20 domande, dalla più facile alla piùdifficile. Sono stati quindi calcolati i valori medi di difficoltà siarispetto al campione che rispetto alle attribuzioni dei giudici.

79

Nel caso del campione, il livello di difficoltà è stato compu-tato sulla base delle risposte errate registrate da ogni domanda,seguendo la procedura illustrata in precedenza: maggiore eraquesto numero, maggiore la difficoltà della domanda.

Nel caso dei giudici, il livello di difficoltà di ciascuna domandaera fornito dalla media del posizionamento attribuito dai giudici.

Il confronto tra i risultati ottenuti con le due procedure,viene mostrato nella Tabella 29.

Tabella 29 – Confronto tra due diverse procedure di attribuzione di punteggi

In essa si nota non soltanto che le attribuzioni dei giudici sonoin alcuni casi significativamente diverse da quelle del campione in

Domanda

Livello didifficoltàsecondo igiudici(espresso in

decimi)24

Posizionenella scala dei

giudici

Livello didifficoltà

secondo ilcampione

(espresso indecimi)

Posizionenella scala

delcampione

Differenzadi

punteggiotra giudici ecampione

Differenzadi posizionetra giudici ecampione

1 6,0 7 2,5 16 3,5 -9,02 2,5 18 0,3 19 2,2 -1,03 4,7 11 6,1 3 -1,4 8,04 0,7 20 0,3 20 0,4 0,05 6,6 3 4,8 8 1,9 -5,06 2,1 19 1,5 18 0,6 1,07 6,4 5 5,1 5 1,3 0,08 2,6 17 4,4 10 -1,8 7,09 3,2 16 3,0 15 0,2 1,010 6,1 6 4,9 6 1,1 0,011 3,4 15 2,3 17 1,1 -2,012 4,0 14 4,9 7 -0,9 7,013 6,5 4 3,2 14 3,3 -10,014 4,1 13 6,7 1 -2,6 12,015 5,3 10 3,8 13 1,5 -3,016 4,5 12 6,6 2 -2,1 10,017 7,1 2 4,3 11 2,9 -9,018 7,7 1 5,9 4 1,8 -3,019 5,5 9 4,6 9 1,0 0,020 5,9 8 3,8 12 2,1 -4,0

24 I valori di scala variano tra 1 e 10, dove 1 indica la massima facilità delladomanda e 10 la massima difficoltà.

80

termini di punteggio medio (si veda, per esempio, la domandanumero 1, il cui testo era “Quale dei tre ‘padri’ della letteraturaitaliana del ‘300 ha composto Il canzoniere?”) ma anche che laposizione ricoperta nelle due graduatorie è in alcuni casi assaimarcata (come nel caso della domanda 14, il cui testo era:“Quale di questi tre film non è stato interpretato dalla coppiaGassman-Manfredi?”).

Mentre lo scarto tra i punteggi attribuibili attraverso le dueprocedure può essere imputato agli aspetti tecnici, quello diposizione sgombra il campo da qualsiasi equivoco. I punteggiottenuti dalle due procedure, infatti, sono ricavati in due modidiversi: attraverso il computo delle risposte sbagliate nel caso delcampione e attraverso il semplice ordinamento nel caso dei giu-dici. Passi quindi se gli scarti possono apparire cospicui: possia-mo sempre pensare – non senza qualche ragione – che ciò siadeterminato da un vizio procedurale e quindi da una sostanzia-le incommensurabilità tra i due punteggi-indici.

Nel caso delle graduatorie il discorso cambia e lo scarto diven-ta inesorabile. Il confronto tra le stesse graduatorie, operato attra-verso l’indice di cograduazione ρ di Spearman, sancisce irrimedia-bilmente la differenza tra le due procedure: il suo valore è infatti0,45, un punteggio da considerarsi piuttosto insoddisfacente25.

In breve, questo rapido confronto mostra una volta di piùquanto opportuna possa essere una procedura in cui i valori-indice vengono ricavati direttamente dall’indagine campionaria,senza introdurre surrettiziamente distorsioni dovute alle attribu-zioni dei ricercatori. La necessità di ricorrere a una proceduradel genere risulta tanto maggiore quanto più si pensa al fatto che– nell’esempio testé mostrato – l’uso dei giudici tampona alme-no parzialmente la soggettività del singolo ricercatore, spessol’unico – in fase di analisi dei dati – a decidere in merito all’attri-buzione di punteggi ma che ciò spesso non è sufficiente a unaponderazione equilibrata dei punteggi stessi.

A questo va aggiunto che la procedura illustrata è preferibilesoprattutto nei casi in cui si vogliano enfatizzare le differenze tragli elementi del campione. Come abbiamo visto, infatti, il range

25 L’indice di cograduazione di Spearman varia tra –1 e 1.

81

di punteggi coperto dagli indici per somma è notevolmente piùristretto a quello dei punteggi ottenuti con la procedura basatasul dato empirico fornito dallo stesso campione. Ne deriva cheuna procedura del genere permette, per esempio, di sottilizzaresulle differenze esistenti tra gli elementi di un gruppo, permet-tendo un maggior numero di combinazioni tra i punteggi. Serispetto a una certa prova – per esempio – si vogliono ordinarele performance di un numero definito di soggetti adottando ilnormale indice per somma conseguito su 3 diverse prove (conesito “giusto” e “sbagliato”), si avranno soltanto 4 combinazio-ni (sbagliato, sbagliato, sbagliato; sbagliato, sbagliato, giusto; sba-gliato, giusto, giusto; giusto, giusto, giusto), mentre ponderandoi punteggi le combinazioni raddoppiano.

L’avvocato del diavolo potrebbe sempre sostenere che non èaffatto scontato che, come nel caso illustrato di Manlio e Liliana,debba essere penalizzato chi ha fornito più risposte, pur mancan-do quelle più difficili. L’argomento avrebbe senz’altro una suadignità. Tuttavia, va rimarcato il fatto che a fronte della possibilescelta da due criteri che hanno pari dignità argomentativa, quelloche persegue la strada della ponderazione dei punteggi basatasulla distribuzione delle risposte giuste e sbagliate ha il merito dienfatizzare le differenze tra i soggetti e produce solo episodica-mente casi paradossali (come appunto quello illustrato).

Rimangono a questo punto da discutere due problemi ine-renti a questo tipo di approccio. Il primo riguarda l’uso che ilricercatore deve fare delle domande senza risposta, ovvero se biso-gna prevedere o meno la possibilità che un intervistato si rifiutidi rispondere. Il secondo problema riguarda invece la possibilitàdi complicare ulteriormente la tecnica di calcolo dell’indice, sta-bilendo un ulteriore peso da attribuire alla componente ‘nume-ro di risposte esatte’ (la componente quantitativa, dunque) e aquella ‘livello di difficoltà delle domande alle quali si è risposto’(ossia la componente ‘qualitativa’).

Rispetto al primo problema, va subito detto che esistono varie‘scuole di pensiero’ che offrono argomentazioni ugualmenterispettabili. Da un canto, c’è chi afferma che – dal momento chein base al calcolo delle probabilità l’influenza delle risposte date

82

a caso sull’acquisizione di un punteggio alto è minima – tantovale forzare gli intervistati a rispondere subito oppure attribuireloro punteggi aleatori in matrice. Dall’altra parte, c’è chi sostieneche questa pratica forzi oltremodo la rigidità già insita nell’uso distrumenti di rilevazione di questo tipo – cioè come il questiona-rio. Chi sostiene questa posizione suggerisce allora di lasciareall’intervistato maggiore libertà, salvo poi non sapere come anda-re a computare le risposte che finiscono nel ‘non so’, ‘non vogliorispondere’ e via dicendo. Le risposte di questo tipo vanno com-putate come valori mancanti? Vanno attribuiti numeri aleatorianche ad esse? Oppure vanno trattate come risposte comunqueerrate? E se così fosse, non si finirebbe allora col non tenereconto dei fattori di ordine psicologico degli intervistati, alcuni deiquali – vuoi per avventatezza, vuoi per eccesso di sicurezza – ten-terebbero comunque la carta della risposta, mentre altri – peropposte ragioni di natura caratteriale – sono portati a rintanarsinella risposta mancata? Il problema evidentemente ha un suopeso ma esula dai confini di questa discussione.

Un aspetto invece non secondario, bensì ancora legato aquanto illustrato in questo paragrafo, riguarda gli eventuali crite-ri da seguire per la selezione degli item. Un riferimento in per-fetta sintonia con quanto argomentato sinora a proposito dellanecessità di ponderare il livello di difficoltà degli item è rintrac-ciabile nell’ambito dei test psicometrici in un notissimo testo diAnne Anastasi (1954, trad. it. 1981, p.279). In esso la studiosaamericana fa notare che “la difficoltà di una prova è valutata inbase alla percentuale di persone che rispondono correttamentead essa”. Pertanto, la procedura da seguire per la selezione diitem di questo tipo, che altro non sarebbe che una selezione diindicatori, dovrebbe essere la seguente:1. somministrazione di un pretest contenente un numero di

prove (item) maggiore rispetto a quello che verrà impiegatonello strumento di raccolta finale;

2. selezione di quei test che hanno il più alto potere discriminatorio(Perrone, 1977, pp.119-120). Seguendo pedissequamente lalogica degli indicatori, il ricercatore sociale si verrebbe a tro-vare in una situazione ideale nel momento in cui riuscisse a

83

trovare indicatori di un concetto tutti perfettamente equivalen-ti. In questo modo avrebbe la possibilità di escludere qualsiasiprocesso di ponderazione nella costruzione degli indici.Analogamente, lavorando su prove delle quali non si conoscecon certezza la difficoltà per gli intervistati, può essere utileverificare preliminarmente questa difficoltà. Ora, supponiamoche una certa prova, posta sotto forma di domanda alla qualel’intervistato può soltanto dare o una risposta sbagliata o unarisposta corretta, venga sottoposta a 100 intervistati. Se a que-sta prova rispondessero correttamente 50 di essi ed erronea-mente gli altri 50, si otterrebbero 50x50 (cioè 2500) informa-zioni differenziali. In un altro caso potremmo invece trovarcicon 70 risposte giuste e 30 sbagliate, per un totale di 2100informazioni differenziali, oppure con 10 giuste e 90 sbagliate,per un totale di 900 informazioni differenziali. Da ciò si evin-ce dunque che un item, posto sotto forma di domanda di “abi-lità”, risulta essere ottimale quando “taglia” il campione nellamaniera più equilibrata possibile. A questo proposito, Anastasi(ibi, p.280) fa notare che la decisione relativa alla selezione diquegli item contenenti il migliore rapporto tra rispondenti enon rispondenti, e quindi la maggiore capacità differenziale,viene tuttavia complicata “dal fatto che tutte le prove di un testtendono ad essere correlate tra loro, e quando più il test èomogeneo, tanto più elevate saranno le correlazioni. Per fareun caso estremo – prosegue Anastasi – se tutti gli item avesse-ro tra loro correlazioni perfette e fossero tutti a un livello didifficoltà dello 0,50, si avrebbe che le 50 persone su 100 chesuperano ciascuna prova sarebbero sempre le medesime; diconseguenza, metà degli esaminandi otterrebbe un punteggioperfetto e l’altra metà un punteggio di 0”.

La seconda questione – se sia il caso oppure no di procede-re a una combinazione ancora più complessa della dimensionequalitativa con quella quantitativa di un indice di questo tipo –trova invece una sua possibile soluzione negli indici logaritmici,che verranno trattati a parte. Il lettore può quindi fare riferimen-to ad essi per integrare le due procedure.

84

III.2. GLI INDICI LOGARITMICI

Nella ricerca sociale è tutt’altro che infrequente il ricorso a misu-re sintetiche quali tassi, indici di composizione (es.: la spesa dellefamiglie per l’affitto sul totale di spesa per le famiglie), di coesi-stenza (es.: totale delle donne sposate sul totale degli uominisposati in una data regione) e di derivazione (es.: nati vivi suinati), di cui peraltro si è già parlato. In ambito demografico esocioeconomico tali misure sono talmente diffuse da rientrareormai nell’abbecedario che l’uomo comune acquisisce attraver-so il continuo rimando ad essi che viene operato dai mass media.

Queste misure, che raffrontano tra loro operazioni di conteg-gio (per esempio, il totale delle aziende che si sono iscritte allaCamera di Commercio in un determinato anno sul totale delleaziende che, nello stesso anno, hanno segnalato la cessazionedell’attività), hanno l’indubbio pregio di rendere confrontabiliunità aggregate (ossia dati ecologici come una regione o unaprovincia, ma anche qualsiasi altra variabile sottoposta a opera-zioni di conteggio) semplicemente ricorrendo a indici relativi,percentuali, eccetera.

Per quanto semplice e al tempo stesso ingegnosa, questa comu-nissima tecnica – che ingloba al suo interno anche l’altrettanto comu-ne media aritmetica – può rivelarsi inadeguata in taluni contesti.

Vi possono essere infatti situazioni nelle quali la cosiddettaunità di contesto (le dimensioni di un certo territorio, la durata diuna determinata analisi storica, la mole di una certa fonte informa-tiva) possono dare luogo a distorsioni che sfuggono dal punto divista tecnico ma che hanno una rilevanza decisiva dal punto divista teorico, avendo poi ulteriori ricadute sul piano pratico.

Gli esempi che seguono aiuteranno a chiarire quali possonoessere queste situazioni. Immaginiamo di volere mettere a con-fronto la ricchezza lessicale di due romanzieri, basandoci sull’inte-ra loro produzione. Sarebbe corretto – come ad esempio è possi-bile fare attraverso un programma per l’analisi testuale comeSPAD-T – ricorrere a un semplice indice sintetico che metta a con-fronto il numero di parole diverse tra loro usate dal romanziere Acon il totale delle parole usate e poi confrontare il risultato con

85

quello ottenuto rispetto al romanziere B? Lo sarebbe soltanto acondizione che il volume complessivo di parole utilizzate sia grossomodo lo stesso, non potendo, dal punto di vista delle probabilità,essere esattamente lo stesso. Perché accade ciò? Perché, evidente-mente, a mano a mano che si scrive decresce la probabilità diimpiegare termini costantemente nuovi, che non siano stati utiliz-zati in precedenza. Se, poniamo, il romanziere A avesse scritto unmaggior numero di pagine rispetto al romanziere B, rischierebbeautomaticamente di essere penalizzato dal confronto poiché –come si è detto – all’aumentare della produzione testuale decrescela probabilità di utilizzare nuove parole.

È come se, in altri termini, due giocatori di dadi scommettesse-ro di ottenere lo stesso numero, poniamo il 6, con un numero diver-so di lanci. Supponiamo che i due giocatori abbiano a disposizionerispettivamente 2 e 10 lanci26.

Il primo giocatore avrebbe all’incirca il 30% delle probabilità divedere uscire il 6 per due volte di fila, mentre il secondo ne avreb-be circa l’83%, cioè quasi il triplo rispetto al primo. L’esempioovviamente è parossistico, ma mette in luce quelle trappole chealtrimenti rimarrebbero coperte dall’ombra monolitica di opera-zioni consuetudinarie.

Mentre nel primo esempio, quello relativo alla ricchezza les-sicale, è il volume di parole complessivamente prodotte, ossia laquantità di testo scritto, a ergersi quale unità di contesto diri-mente rispetto ai soggetti messi a confronto, nel secondo è laquantità di lanci fatti con i dadi. In entrambi gli esempi, dunque,è il contesto a variare e ad essere decisivo. Il problema diventadunque quello di inserire, all’interno del processo di costruzio-ne degli indici, un fattore di correzione che tenga conto della per-turbazione apportata dal contesto sulla costruzione dell’indicestesso, laddove il contesto medesimo assume rilevanza teorica.

Proviamo a rovesciare il ragionamento con un altro esempio.Supponiamo di voler confrontare il livello di produttività di duefabbriche di orologi. Dobbiamo innanzitutto pensare che, in valo-re assoluto, il numero di orologi prodotti per giornata lavorativa sia

26 Si tratta di questioni afferenti al calcolo delle probabilità, ben note dai tempi diAntoine Gombaud. Per un approfondimento, si veda Spirito (1995, p. 27 e segg.).

86

proporzionale alle dimensioni della fabbrica: una fabbrica piùgrande ha più operai e produce di più. Ma se operassimo un con-fronto non tenendo conto del contesto, cioè delle dimensioni dellafabbrica, ci troveremmo a confrontare grandezze diversamenteproporzionate. Possiamo assumere allora che l’indice calcolatocome produzione media di orologi per operaio in una data unità ditempo vada corretto tenendo conto delle dimensioni della fabbri-ca? La risposta, in questo caso più anodina che nei precedenti,dipende – nemmeno a dirlo – dalla teoria che abbiamo alle spalle,dalle nostre conoscenze pregresse, dalla presenza di ricerche pre-cedenti che possano eventualmente confermare un’ipotesi di que-sto tipo. Nella fattispecie, si potrebbe per esempio assumere l’ipo-tesi secondo la quale un numero maggiore di operai influenza lacomplessità dell’organizzazione, la quale a sua volta produce suglistessi un minore controllo rispetto ai prodotti, con un conseguen-te decremento del rendimento rispetto a colleghi impiegati pressofabbriche di dimensioni minori.

Passando a un altro esempio, ci si potrebbe analogamentedomandare se il maggiore tasso di criminalità che normalmenteviene riscontrato nella aree urbane rispetto a quelle rurali nondebba essere corretto in ragione del fatto che, in termini durkhei-miani, l’aumento della densità sociale lascia automaticamente cre-scere la probabilità di compiere gesti devianti. Un tasso di crimi-nalità corretto in ragione delle dimensioni dell’area di riferimen-to, dunque, risponderebbe implicitamente alla domanda: cosaaccadrebbe nel contesto A e nel contesto B se gli abitanti dientrambi i contesti vivessero esattamente nelle stesse condizioni?

Chiarito dunque il ruolo cruciale giocato dalla teoria e dal-l’esperienza empirica accumulata in precedenza a suffragio diuna determinata ipotesi di ricerca, la correzione degli indici rela-tivi, laddove questa è teoricamente fondata, trova una soluzioneidonea nelle funzioni logaritmiche.

Nella loro applicazione alla ricerca sociale, queste ultime,infatti, hanno la proprietà di correggere, con incrementi a manoa mano più piccoli, le distorsioni che vengono introdotte dall’au-mento dell’unità di contesto.

Due esempi concreti serviranno a mostrare in quale modo e

87

a quali condizioni indici di questo tipo possano essere introdot-ti nella ricerca sociale.

Prendendo quale riferimento una ricerca condotta presso laFacoltà di Sociologia sugli studenti dei corsi di laurea di Sociologiae di Scienze della Comunicazione, supponiamo di volere mettere aconfronto la produttività universitaria degli studenti, tenendo uni-camente conto – nella costruzione dell’indice – di due indicatori:1. il numero degli esami sostenuti con esito positivo (cioè senza

rifiutare il voto e senza subire bocciature);2. i voti conseguiti agli esami.

Si potrebbero avanzare obiezioni sostenendo la necessità ditenere conto anche degli esami sostenuti con esito negativo(bocciatura) ovvero di quelli in occasione dei quali i candidatihanno rifiutato il voto. L’avvocato del diavolo stavolta potrebbeinfatti sostenere che, costruendo l’indice di produttività esclusi-vamente sulla base degli esami condotti a termine, si rimarrebbecon una fascia, più o meno ampia, di studenti che non hannosostenuto alcun esame pur avendo avuto condotte assai diffe-renziate. In questo gruppo sarebbero comunque riscontrabilicomportamenti diversi: dallo studente che ha comunque affron-tato l’esame non riuscendo a superarlo a quello che non ha com-piuto alcun tentativo in tale direzione e che intende il percorsouniversitario come una prolungata vacanza post-maturità.Entrambi confluirebbero dunque nella schiera degli studenti aproduttività zero. È utile differenziarli? È possibile? Se si dispo-nesse di informazioni dettagliate capaci di ricostruire il percorsopre-esame di ciascuno studente, allora sarebbe possibile diffe-renziare questo gruppo a produttività zero, distinguendo chi nonproduce affatto da chi un tentativo in ogni caso lo fa, prendendocomunque con beneficio d’inventario le informazioni ottenute,spesso viziate da bisogni indotti di desiderabilità sociale. Tuttavia,questo non basterebbe, ed è una delle ragioni per le quali è piùopportuno mantenere il gruppo compatto nello stesso livello discala. Da una parte infatti vi è la possibilità di incorrere comun-que, come si diceva, in una scarsa attendibilità della risposte cau-sata dalla desiderabilità sociale (se si viene intervistati da un altro

88

studente, può risultare preferibile dire che le cose non ti sonoandate bene piuttosto che ammettere di non avere nemmenosfogliato le pagine di un libro per preparare un esame); dall’altra,vi è l’intervento di ragioni di natura psicologica che riportano ilproblema al punto di partenza. Come sarebbe infatti possibiledistinguere coloro che hanno tentato un esame per eccesso dileggerezza, per troppo autoconvincimento, per una miope visio-ne delle proprie capacità e della propria preparazione, da coloroche, per opposte ragioni psicologiche – scarsa fiducia in sé stes-si, eccesso di zelo, mancato convincimento rispetto al proprioeffettivo livello di preparazione, rispetto per la commissioned’esame, timidezza estrema – non si sono neppure presentatiall’appello?

Per questi motivi, nella ricerca che stiamo portando ad esem-pio si decise di assegnare una ‘produttività zero’ a questi studen-ti, tanto più che in questo modo:1. la cardinalità della scala di produttività permane, pur non

essendo la scala del tipo ‘di rapporti’, avendo essa soltantoall’apparenza uno zero assoluto (che per le ragioni menziona-te deve essere invece considerato convenzionale);

2. si conservano soltanto informazioni ‘oggettive’ e non di tipo‘soggettivo’ e quindi di natura psicologica come quelle chesono state elencate.

A questi motivi ne va aggiunto un altro. Se si prendessero inconsiderazione gli esami non superati, si andrebbe anche a inci-dere su coloro che, agli esami superati, dovrebbero sommarequelli tentati ma esitati negativamente. A questo riguardo, si èritenuta fuorviante un’informazione del genere. Questo per dueragioni, strettamente collegate tra loro: la prima è che il mancatosuperamento di una o più prove d’esame innalzerebbe automati-camente il valore dell’indice di produttività. In questo modo, unostudente che avesse superato un esame con 30 e ne avesse man-cati altri tre si troverebbe ad avere un valore-indice spropositata-mente alto; la seconda ragione è che la bocciatura o il rifiuto delvoto mal si accordano con la minore difficoltà dei primi esami –almeno nei contenuti più che nei suoi risvolti psicologici.

89

Pertanto, gli studenti che non riescono a superare i primi esamiprobabilmente non si applicano abbastanza e quindi la loro pro-duttività è da considerarsi scarsa. Va anche considerato che la per-centuale cumulata di rifiuti e bocciature è assai ridotta e pari al 2,9dell’intero campione27. Fatte queste dovute premesse, veniamoalla costruzione vera e propria dell’indice. La soluzione standardper la costruzione dell’indice è data dal confronto tra le duevariabili, che contribuiscono a fornire una semplice media.

Secondo le considerazioni dell’équipe di ricerca, invece, eraopportuno affrontare il problema in tutta la sua complessità.Esso infatti era duplice: da una parte era necessario amplificarele differenze in termini di produttività tra coloro che, a parità dimedia, hanno un diverso numero di esami sostenuti con esitopositivo. Dall’altra, si sostiene l’opportunità di mantenere l’in-formazione cardinale proveniente dalle due variabili che forma-no l’indice, senza scendere a un livello ordinale con conseguen-te perdita d’informazione.

La funzione che fa al nostro caso è pertanto una funzione ditipo logaritmico. Le funzioni logaritmiche hanno infatti la proprie-tà di assottigliare, in valore assoluto, le differenze di una distribu-zione a mano a mano che i numeri crescono. Un esempio aiuteràa chiarire questo semplice concetto. Nelle operazioni che compia-mo abitualmente i numeri 1, 2, 3, 4, 5, eccetera si collocano tuttialla stessa “distanza” uno dall’altro, vale a dire che la differenza traciascuno di loro e il precedente (o il successivo) è sempre uguale a1. Le funzioni logaritmiche invece ‘sconvolgono’, per così dire,questa regola: procedendo verso l’alto, la differenza tra un nume-ro e il precedente è sempre più piccola, fino a diventare infinitesi-male. Non a caso il calcolo logaritmico, derivante dalle equazioniesponenziali, fu inventato in epoca ben anteriore alla nascita delcomputer, e cioè intorno ai primi del ‘600, per semplificare il cal-colo di operazioni molto complesse e con numeri enormi chevenivano opportunamente trasformati in altri dotati di una partedetta caratteristica e di una detta mantissa. Artefici ne furono lo scoz-zese John Napier, lo svizzero Eulero e l’inglese Briggs, che misero

27 Per l’esattezza, in occasione della ricerca qui esemplificata la percentualecomplessiva di rifiuti è dello 0,2%, mentre quella delle bocciature è del 2,7%.

90

a punto un sistema di calcolo logaritmico su base trascendente (e,o numero di Eulero, dai quali sono derivati intorno al 1730 i loga-ritmi neperiani) o su base 10 (dovuta a Briggs). Di per sé, il loga-ritmo non è altro che l’esponente, o la potenza, a cui deve essereelevato un numero, detto base, per ottenere un secondo numero,detto argomento28.

Naturalmente la base logaritmica può variare, ossia differiredal numero trascendente e (logaritmi naturali, o neperiani) oppu-re da 10 (logaritmi decimali). Nel nostro caso, l’indice è statocostruito come il prodotto tra il quoziente della somma dei votiottenuti ai diversi esami da uno studente e il numero di esamisostenuti moltiplicato per il logaritmo in base 31 della sommadei voti ottenuti agli esami. In formula:

I.P. = ∑ xij/∑ xi * logval(max) ∑ xij

dove appunto xij è la somma dei voti presi a tutti gli esami soste-nuti (per esempio, 30 + 28 + 27), xi è il numero di esami soste-nuti (nell’esempio, 3). ∑ è un simbolo matematico che sta persommatoria e valmax è il massimo valore empirico assunto dalladistribuzione di riferimento.

Perché questo calcolo all’apparenza tanto complicato ma inrealtà assolutamente ragionevole?

Innanzitutto va spiegato che la scelta della base 31 (corri-

28 L’uso dei logaritmi può essere illustrato considerando ad esempio unasequenza di potenze del numero 2: 21, 22, 23, 24, 25 e 26, che corrisponde allasequenza dei numeri 2, 4, 8, 16, 32 e 64. Gli esponenti 1, 2, 3, 4, 5 e 6 sono i loga-ritmi in base 2 di questi numeri. Per moltiplicare due numeri di questa sequenza èsufficiente sommare i rispettivi logaritmi e determinare l’antilogaritmo dellasomma ottenuta, cioè elevare la base 2 alla somma delle due potenze. Così, pereseguire il prodotto di 16 per 4, bisogna dapprima osservare che il logaritmo di 16è 4, e che il logaritmo di 4 è 2. La somma dei logaritmi trovati, 4 e 2, è 6, e l’anti-logaritmo di 6 è 64, che è il prodotto desiderato. Per eseguire la divisione si pro-cede quindi sottraendo i logaritmi come nel caso precedente, calcolando l’antilo-garitmo del risultato ottenuto. Ad esempio, per eseguire la divisione tra 32 e 8, sisottrae 3 da 5 e si ottiene 2, il cui antilogaritmo, 4, è il quoziente cercato (da“Logaritmo”, Enciclopedia Microsoft Encarta © 1993-1997 Microsoft Corporation.Tutti i diritti riservati).

91

spondente al voto ‘30 e lode’) rende uguale a 31 l’indice di pro-duttività di uno studente che ha sostenuto un solo esame pren-dendo il voto più alto (ossia 30 e lode, nella nostra registrazionedei dati corrispondente a 31).

In secondo luogo, va sottolineato che attraverso la scelta diuna base di riferimento (il valore-indice 31) è possibile capirel’entità dell’indice di produttività, ossia il suo approssimarsi omeno a questo valore standard.

Infine, l’indice tiene sempre in minor conto il peso del nume-ro degli esami sostenuti a mano a mano che questo numero vaaumentando. Vediamone un’applicazione in Tabella 30.

Tabella 30 – Misurazione della produttività degli studenti attraversol’indice logaritmico

Come si può osservare, il punteggio più alto lo otterrebbe lostudente Amintore, che oltre ad avere la media del 30 e lode (31)ha anche sostenuto 5 esami. D’altronde, Ciriaco avrebbe una pun-teggio superiore a quello di Dalmazio: pur avendo quest’ultimo la

∑ (xi)SOMMA VOTI

(∑xij)MEDIA

Amintore 5 155,0 31,0 45,5291Basilio 4 124,0 31,0 43,5146Ciriaco 4 120,0 30,0 41,8245Dalmazio 3 93,0 31,0 40,9176Elisa 2 62,0 31,0 37,2573Ferruccio 2 60,0 30,0 35,7690Giuditta 2 59,0 29,5 35,0285Heather 4 100,0 25,0 33,5264Ida 1 31,0 31,0 31,0000Liliana 1 30,0 30,0 29,7135Manlio 4 88,0 22,0 28,6843Norberto 10 180,0 18,0 27,2200Otello 1 28,0 28,0 27,1701Pamela 5 90,0 18,0 23,5867Quinto 5 90,0 18,0 23,5867Raimondo 4 72,0 18,0 22,4171Samuele 4 72,0 18,0 22,4171Torquato 1 18,0 18,0 15,1505

STUDENTEESAMI SOSTENUTI

PUNTEGGIO(I.P.)

92

media del 30 e lode (contro quella del 30 di Ciriaco), ha però soste-nuto un esame in meno, il che gli vale un punteggio di un soffiopiù basso. Situazione analoga rispetto alla media ma ben più pro-nunciata è quella che divide le due compagne Heather e Ida.Quest’ultima ha infatti un solo esame all’attivo (ha preso 30 e lode),mentre la sua amica, pur con una media più bassa (25) ha fatto ilquadruplo degli esami. Norberto è uno schiacciasassi che agliesami si presenta a suo rischio: ne ha superati più di tutti – ben10 – ma con la media del 18. La sua produttività è pressochéuguale a quella dell’amico Otello che ha superato un solo esameprendendo 28.

Come si può facilmente evincere, con la costruzione dell’in-dice di produttività si riduce la visibilità di quell’area di riscattoche permetteva agli studenti usciti dagli istituti superiori con unbasso voto di diploma di ottenere medie alte una volta imbocca-ta la strada dell’università. La correlazione tra l’indice di produt-tività e il voto di diploma è infatti più alta di quella tra lo stessovoto di diploma e la media dei voti presi agli esami: si passa infat-ti da una correlazione (R di Pearson) di 0.489 a una di 0,574. Larelazione è evidenziata anche nel diagramma a dispersione ripor-tato in Figura 4.

Figura 4 – Curva logaritmica generata dalla realzione tra due variabili

Voto primo diploma di maturità

Indi

cedi

prod

uttiv

ità

93

Va infine precisato che la costruzione dell’indice di produttivi-tà ha sollevato un problema di tipo tecnico: Spss, il comune soft-ware di analisi dei dati in uso nelle scienze sociali, non è infatti pre-disposto alla computazione di logaritmi con base diversa da 10 eda e (il cui valore, detto per inciso, è uguale approssimativamente a2,302). Questa insufficienza richiede la trasformazione della matri-ce dei dati in un programma che consenta questo tipo di operazio-ni. Nel nostro caso, Excel, comunemente in dotazione agli utenti diWindows, va incontro a tale necessità. Un’ulteriore trasformazioneconsente di riportare i dati ottenuti nella matrice in formato Spss.L’esito dell’intera operazione, ivi compresa la ripartizione in treclassi, è riportato in Figura 5.

Figura 5 – Livello di produttività universitario nei due gruppi(Sociologia e Scienze della Comunicazione)

Un ulteriore esempio può essere fatto con i calciatori. Da annile numerose tribune calcistiche televisive ci hanno abituato a unapproccio al calcio come oggetto ‘filosofico’ prima e come terrenodi discussione scientifica poi. Numeri, cifre, ricostruzioni elettroni-che, simulazioni al computer fanno ormai parte del normale appa-rato al quale ricorrono giornalisti e commentatori televisivi per

Livello di produttività universitario

corso di laurea

Sociologia

Sc. Comunicazione

Val

orip

erce

ntua

li

94

discutere i fatti che una volta erano soltanto quelli della domenica.Ebbene, se volessimo in quest’ottica un po’ maniacale controllarechi è stato il migliore goleador della Nazionale di tutti i tempi,potremmo proprio servirci della strategia di costruzione dell’indiceappena illustrata. Potremmo in un primo tempo decidere di taglia-re la classifica a un minimo di 10 marcature, e quindi ricorrere all’in-dice logaritmico per vedere chi è il miglior marcatore di questa spe-ciale classifica. Facendo riferimento a tutto l’anno 2006, la classifica‘al naturale’ si presenta come illustrato in Tabella 31:

Tabella 31 – Classifica dei cannonieri della nazionale italiana di calcio di tuttii tempi29

29 I dati sono aggiornati al marzo 2007.

Calciatore Gol PresenzeLuigi Riva 35 42Giuseppe Meazza 33 53Silvio Piola 30 34Roberto Baggio 27 56Alessandro Del Piero 27 81Adolfo Baloncieri 25 47Alessandro Altobelli 25 61Christian Vieri 23 49Filippo Inzaghi 23 53Francesco Graziani 23 64Alessandro Mazzola 22 70Paolo Rossi 20 48Roberto Bettega 19 42Gianluca Vialli 16 59Julio Libonatti 15 18Angelo Schiavio 15 21Gino Colaussi 15 25Giovanni Ferrari 14 44Gianni Rivera 14 60Mario Magnozzi 13 29Raimundo Orsi 13 35Pierluigi Casiraghi 13 44Luca Toni 12 27Virgilio Felice Levratto 11 28Luigi Cevenini 11 29Riccardo Carapellese 10 16Gianfranco Zola 10 35

95

Viceversa, applicando l’indice logaritmico a base 35 (il mas-simo numero di reti realizzate de un calciatore, Gigi Riva), laclassifica diventerebbe quella riportata in Tabella 32:

Tabella 32 – Classifica dei cannonieri della nazionale italiana di calcio ditutti i tempi in base all’indice logaritmico

Per comprendere quanto possa essere ingannevole il datogrezzo, fornito in valore assoluto, basta mettere a confrontoLibonatti e Vialli: quest’ultimo ha un solo gol all’attivo più diLibonatti, il quale però ha giocato 17 partite contro le 59 di Vialli.Il risultato è che il centravanti del Torino dovette smettere la

Calciatore Gol Presenze IndicePosizione

golPosizione

indiceScarto Anni

Silvio Piola 30 34 0,84 3 1 2 1935-52Luigi Riva 35 42 0,83 1 2 -1 1965-74Julio Libonatti 15 18 0,63 15 3 12 1926-31Giuseppe Meazza 33 53 0,61 2 4 -2 1930-39Angelo Schiavio 15 21 0,54 16 5 11 1925-34Adolfo Baloncieri 25 47 0,48 6 6 0 1920-30Gino Colaussi 15 25 0,46 17 7 10 1935-40Roberto Baggio 27 56 0,45 4 8 -4 1988-04Christian Vieri 23 49 0,41 8 9 -1 1997-05Riccardo Carapellese 10 16 0,40 26 10 16 1947-56Filippo Inzaghi 23 53 0,38 9 11 -2 1997-06Roberto Bettega 19 42 0,37 13 12 1 1975-83Alessandro Altobelli 25 61 0,37 7 13 -6 1980-88Paolo Rossi 20 48 0,35 12 14 -2 1977-86Mario Magnozzi 13 29 0,32 20 15 5 1924-32Francesco Graziani 23 64 0,32 10 16 -6 1975-83Luca Toni 12 27 0,31 23 17 6 2004-07Alessandro Del Piero 27 81 0,31 5 18 -13 1995-07Alessandro Mazzola 22 70 0,27 11 19 -8 1963-74Raimundo Orsi 13 35 0,27 21 20 1 1929-35Virgilio Felice Levratto 11 28 0,26 24 21 3 1924-28Luigi Cevenini 11 29 0,26 25 22 3 1915-29Giovanni Ferrari 14 44 0,24 18 23 -5 1930-38Pierluigi Casiraghi 13 44 0,21 22 24 -2 1991-98Gianluca Vialli 16 59 0,21 14 25 -11 1985-92Gianfranco Zola 10 35 0,19 27 26 1 1991-97Gianni Rivera 14 60 0,17 19 27 -8 1962-74

96

maglia della nazionale dopo poche gare (presumibilmente perl’impuntatura del regime fascista sulle origini argentine del gio-catore) quando, classifica “speciale” alla mano, risulta essere ilterzo miglior realizzatore italiano di tutti i tempi, mentre Vialliprecipita al terzultimo posto della classifica e all’ultimo tra i cen-trattacco puri.

In conclusione, dunque, gli indici logaritmici possono essereimpiegati con considerevoli vantaggi30 in tutte quelle situazioni che:1. richiedono l’intervento di un fattore di correzione, reso necessa-

rio dall’opportunità di ridurre l’influenza esercitata dalle dimen-sioni della cosiddetta unità di contesto; l’operazione deve essereteoricamente fondata;

2. fanno riferimento a non più di due variabili;3. fanno riferimento a variabili cardinali.

III.3. GLI INDICI FATTORIALI

Una tra le strategie di costruzione degli indici più feconde, maanche più abusate nella ricerca sociale, è quella che fa ricorso alletecniche di analisi fattoriale (Fraire, 1989). La progressiva atten-zione riservata a queste tecniche ‘miracolose’, con ormai unsecolo di vita alle spalle ma approdate sui personal computersoltanto in tempi relativamente recenti e capaci di offrirsi comeuna panacea per qualsiasi messe di dati, anche la più inesplora-bile, ha collocato gli indici fattoriali in una posizione privilegia-ta. La manualistica metodologica ha non di rado illustrato i pos-sibili approdi delle tecniche fattoriali (Harman, 1967; Perrone,1977; Fraire, 1989; Di Franco, 1997 e 2001; per una discussionecritica si vedano Marradi, 1976 e Di Franco e Marradi, 2003).

Premesso che le tecniche fattoriali sono utilizzabili soltantocon variabili cardinali e quasi-cardinali, l’uso degli indici fattoria-li presenta – rispetto ad altre tecniche di costruzione degli indici

30 Si tenga conto del fatto che, a dispetto di quanto non si possa immaginare,gli indici logaritmici sono facilmente realizzabili con software comunissimi comeExcel per Windows.

97

– il vantaggio di garantire il massimo livello di standardizzazio-ne procedurale possibile, in ossequio a quella logica di cui sidiceva nelle prime pagine di questo scritto, legata alla necessitàdi riuscire a ottenere da ricercatori diversi un’analisi e una sinte-si dei risultati più univoche possibili. Cosa sono dunque questiindici fattoriali? E da dove vengono? Per rispondere a quest’ul-tima domanda, è necessario fare riferimento a una tecnica dianalisi multivariata dei dati – l’analisi in componenti principali –che consente appunto di ricavare, tra i molti risultati che essafornisce, anche un punteggio-indice per ciascuno dei casi ripor-tati in una matrice dei dati.

L’analisi in componenti principali è, in breve, una tecnicamirata alla sintesi dei dati di una matrice che consente di racco-gliere in indici (chiamati, all’uopo, ‘componenti’ o ‘fattori’) l’in-formazione che proviene da una vasta quantità di variabili cardi-nali o quasi-cardinali. Essa, come ci ricorda Marradi (1976,p.297), realizza i seguenti obiettivi:- “estrarre, da un largo numero di indicatori (preferibilmente

risposte a domande di opinione o risultati di test attitudinali) unnumero assai più ridotto di ‘fattori’, cioè di variabili collocate aun più alto livello di astrazione, teoricamente interessanti;

- fornire una misura della relazione fra ciascun indicatore e cia-scun fattore, sotto forma di factor loading, perfettamente equi-valente a un coefficiente di correlazione;

- fornire anche dei coefficienti che permettano di risalire a unavariabile che presenta interesse teorico ponderando i punteg-gi ottenuti dai soggetti sugli indicatori, dopo avere eliminatole sovrapposizioni fra un indicatore e l’altro e cioè tenendoconto solo del contributo “netto” di un indicatore al fattore.Questi coefficienti di ponderazione (factor scores) sono perfet-tamente equivalenti a coefficienti di regressione parziale stan-dardizzati”.

Per comprendere meglio i vantaggi di questa tecnica, imma-giniamo di avere realizzato un’indagine sui 103 comuni italianicapoluogo di provincia, al fine di darne una valutazione rispettoal grado di sviluppo socioeconomico. Immaginiamo anche che

98

per ottenere degli indici di sviluppo socioeconomico sia fattoricorso a tre indicatori su ciascuna delle dimensioni concettualisupposte: quella demografica, quella culturale, quella urbana equella economica, per un totale di 12 indicatori31:

dimensione demografica - popolazione- numero di immigrati- numero di famiglie

dimensione culturale: - diffusione di quotidiani (in migliaia di copie)- diffusione di settimanali (in migliaia di copie)- totale delle spese per spettacoli(in milioni di lire)

dimensione economica: - numero degli addetti al terziario- totale depositi bancari in miliardi di lire- valore aggiunto totale

dimensione urbana: - numero di incidenti stradali- superficie della provincia in km2

- numero totale di veicoli nuovi immatricolati

La prima operazione da compiere consiste nello standardizza-re i valori delle variabili. Questo passaggio è reso necessario dalfatto che l’analisi in componenti principali risente della metricadelle variabili. Ciò significa che le variabili che hanno un’escursio-ne maggiore (poniamo, con valori che vanno da 0 a 1000) pesereb-bero di più di quelle che hanno un’escursione minore (per esem-pio, da 1 a 5) nella determinazione delle componenti, a meno –appunto – di non riportare prima tutte le variabili a una media

31 È opportuno notare che quando si costruiscono indici multidimensionale lasituazione reale spesso differisce da quella ideale. Non di rado, infatti, alcuni indi-catori possono, ad analisi fattoriale conclusa, mostrare correlazioni più alte condimensioni nelle quali il ricercatore non aveva pensato di includerli e viceversa. Aquesto proposito, molto opportunamente Perrone (1977, pp.108-109) fa notareche il ricercatore si trova a passare da una condizione deduttiva a una meramenteinduttiva, nella quale i nessi tra concetto, dimensioni e indicatori vengono chiaritisoltanto dopo avere osservato l’esito dell’analisi dei dati.

99

uguale a 0 e a uno scarto-tipo uguale a 1, come accade appuntoattraverso il processo di standardizzazione. Fatto ciò, l’analisi con-siste nell’estrarre dalle variabili iniziali (12, nel nostro caso) unnumero più ridotto di variabili (le “componenti”, appunto) chesintetizzano le informazioni provenienti dai diversi indicatori. Ilprincipio che guida l’analisi in componenti principali è quellosecondo il quale ad ogni estrazione l’analisi ammortizza quoteprogressivamente decrescenti della varianza prodotta dalle varia-bili. Ciò significa che la prima componente estratta spiegherà laquota maggiore di varianza; che la seconda – ortogonale allaprima – ne spiegherà una quota inferiore e così via, fino a otte-nere n-1 componenti, dove n è il numero di variabili utilizzate.

Senza entrare nel merito della questione in senso tecnico, pergli approfondimenti della quale si rimanda ad altre letture(Harman, 1967; Marradi, 1976; Perrone, 1977; Rizzi, 1985; DiFranco, 1997 e 2001; Di Franco e Marradi, 2003), ciò che in que-sta sede interessa dire è che qualora si volesse ardire una sintesidi 12 variabili – tante sono nel nostro esempio – in una solavariabile-indice, dovremmo guardare al cosiddetto factor score,ossia al punteggio fattoriale che viene assegnato a ciascun casoper ciascuna delle componenti estratte. Poiché, come abbiamodetto, la prima componente è quella che massimizza l’informa-zione delle variabili (e quindi degli indicatori ai quali questefanno riferimento), il factor score relativo ad essa ci fornirà il valo-re della variabile indice da attribuire a ciascuno dei casi (nel-l’esempio, i 103 comuni).

Per orientarci un minimo nell’ambito degli indici fattoriali otte-nuti mediante l’analisi in componenti principali, si rende indispen-sabile un abbecedario che consenta di capire alcuni aspetti dellaprocedura. L’output ottenibile con l’analisi in componenti princi-pali offre una quantità di dati utili all’interpretazione dei risultati.Non tutti questi dati, tuttavia, hanno la stessa rilevanza ai fini delleriflessioni proposte in queste pagine. I concetti chiave che ci occor-rono sono quelli di autovalore, di comunalità, di factor score e di factorloading. L’autovalore fa riferimento al potere di sintesi di ciascuna com-ponente estratta: più è alto il valore che esso assume, maggiore è laquota di varianza riprodotta da quella componente.

100

Tabella 33 – Componenti, autovalori e varianza spiegata

Di norma si scelgono tante componenti quante sono quelle conautovalore maggiore o uguale a 1 (nell’esempio riportato, una soltan-to; si vedano la Tabella 33 e la Figura 6, nella quale è visualizzato ilgrafico relativo alla varianza spiegata da ciascuna componente).

Figura 6 – Diagramma relativo alla quota di varianza spiegatada ciascuna componente

Autovalori iniziali32

Componente Totale% di varianza

spiegata% di varianza

spiegata cumulata1 9,431 85,735 85,7352 0,985 8,956 94,6913 0,302 2,741 97,4324 0,136 1,236 98,6685 6,42E-02 0,584 99,2526 3,10E-02 0,282 99,5347 2,42E-02 0,220 99,7538 1,72E-02 0,156 99,9099 4,13E-03 3,76E-02 99,94710 3,51E-03 3,19E-02 99,97911 2,32E-03 2,11E-02 100,00

Numero della componente

1110987654321

Aut

oval

ore

10

8

6

4

2

0

32 I numeri che finiscono con -02, -03, ecc. (per esempio 6,421E-02) stanno asignificare che sono uguali allo zero, seguito, dopo la virgola, da tanti zeri quantesono le cifre indicate dopo il trattino e quindi dai rimanti numeri. Pertanto 6,421E-02 significa 0,006421.

101

Per converso, la comunalità fa riferimento alla quota di varian-za che ciascuna variabile riproduce nell’insieme delle componen-ti estratte. Maggiore è questo valore, maggiore sarà il peso com-plessivo che una singola variabile ha avuto nel processo di estra-zione delle componenti (Tabella 34).

Tabella 34 – Comunalità delle variabili standardizzate

I component loadings costituiscono una misura della relazionelineare tra ciascuna variabile e ciascuna componente. I componentscores (o factor scores), infine, forniscono un punteggio a ciascuncaso rispetto a ciascuna delle componenti estratte.

L’interpretazione semantica delle componenti ricalca le diffi-coltà di qualsiasi procedimento che si muova sul continuum traestensione e intensione concettuale: il passaggio da una dimen-sione più analitica (l’indicatore) a una più sintetica (l’indice)richiede ovviamente l’individuazione di un concetto a più altolivello di generalità, come avviene in molte tecniche multivariateesplorative come appunto l’analisi in componenti principali ol’analisi delle corrispondenze multiple. Laddove questo concet-to coincide, come nel caso di nostro interesse, con un unicoconcetto iniziale (il grado di sviluppo socioeconomico), il pro-blema non sussiste. Qualora invece si volesse perseguire canoni-camente l’analisi in componenti principali, lasciando cioè spazio

Initial Extraction

ZVA_TOT Zscore(VA_TOT) 1 0,989ZAD_TR_9 Zscore(AD_TR_96) 1 0,985ZDEPBK_9 Zscore(DEPBK_97) 1 0,978ZFAM_95 Zscore(FAM_95) 1 0,961ZSP_SPET Zscore: SP_SPET_96 1 0,961ZDIF_QUO Zscore: DIF_QUO_96 1 0,944ZIMMI_97 Zscore(IMMI_97) 1 0,903ZPOP97 Zscore(POP97) 1 0,901ZINCSTR_ Zscore: INCSTR_97 1 0,892ZDIF_SET Zscore: DIF_SET_96 1 0,878ZSUP_97 Zscore(SUP_97) 1 3,82E-02

102

all’identificazione di un certo numero di componenti estratte, sirenderebbe necessaria l’interpretazione di ciascuna di questecomponenti. Ciò equivale a individuare, in ragione del peso checiascuna variabile ha avuto nella determinazione di ciascunacomponente, una dimensione semantica atta a rappresentare lacomponente estratta.

115

BIBLIOGRAFIA

ADORNO T.W., FRENKEL BRUNSWICK E., LEVINSON D.J. eSANFORD R.N., 1950, The authoritarian personality, Harper,New York; trad. It. La personalità autoritaria, Edizioni di comu-nità, Milano, 2 voll., 1973 (ed. cons. 1982).

AGNOLI M.S., 1992, “La costruzione delle variabili tra rilevazio-ne e analisi dei dati: il caso dei sondaggi”, in Costruire il dato 2,a cura di A. Marradi e G. Gasperoni, Franco Angeli, Milano.

AGNOLI M.S., 1994, Concetti e pratica nella ricerca sociale, FrancoAngeli, Milano.

AGNOLI, M.S. e FASANELLA A. (a cura di), 1999, La formazionesociologica. Prospettive di analisi e risultati di ricerca, Seam, Roma.

AGODI M.C., 1996, “Qualità e quantità: un falso dilemma e tantiequivoci”, in Il sociologo e le sirene, a cura di C.Cipolla e A.DeLillo, Franco Angeli, Milano.

AGODI M.C., 1999, “Lazarsfeld e la ‘natura’ della classificazionenelle scienze sociali”, in Paul Felix Lazarsfeld: un “classico” mar-ginale, a cura di E. Campelli, A. Fasanella e C. Lombardo,numero monografico di Sociologia e ricerca sociale, n.58-59.

ALÌ M., 1988, La laurea difficile. Gli abbandoni nell’Università diRoma “La Sapienza”, Franco Angeli, Milano.

ALLEGRA S.F. e LAROCCA A., 2004, “Sintetizzare misure elemen-tari: una sperimentazione di alcuni criteri per la definizione diun indice composto”, in Documenti ISTAT, 16.

ALLEGRA S.F., FASANELLA A., 1995, “Validità dei dati e approc-cio multitratto-multitecnica”, in Sociologia e ricerca sociale,n.47/48.

AMMASSARI P., 1984, “Validità e costruzione delle variabili: ele-menti per una riflessione”, in Sociologia e ricerca sociale, n.13.

116

ANASTASI A., 1954, Psychological testing, MacMillian, London; trad.it. I test psicologici, Franco Angeli, Milano, 1981; ed. cons. 1997.

ANZERA G., 1999, L’analisi dei reticoli sociali: problematiche di acqui-sizione dei dati e strategie metodologiche nella network analysis,Euroma, Roma.

BAILEY K.D., 1982, Methods of social research, New York, The FreePress, New York; trad. it. Metodi della ricerca sociale, Il Mulino,Bologna, 1985; ed. cons. 1991.

BALLATORI E., 1986, Statistica e metodologia della ricerca, Galeno,Città di Castello.

BARTON A.H., 1965, “Il concetto di spazio di attributi in sociolo-gia” in R. Boudon e P.F.Lazarsfeld, L’analisi empirica nelle scienzesociali, Il Mulino, Bologna, 1969, 2 vol., vol. I, pp. 193-220.

BELL W., MEIER D.L., 1970, “Anomia and the differential accessin the achievement in life goals”, in Readings of social stratifica-tion, a cura di M. Tumin, Prentice-Hall, Upper Saddle River,New Jersey.

BERGE C., 1965, “La costruzione di un indice di influenza” in R.Boudon e P.F.Lazarsfeld, L’analisi empirica nelle scienze sociali, IlMulino, Bologna, 1969, 2 vol., vol. I, pp. 315-320.

BEZZI C., 1998, “La valutazione sociale. Una mappa concettua-le”, in Strategie di valutazione. Strumenti di lavoro, a cura di C.Bezzi e M. Palumbo, Gramma, Perugia.

BEZZI C., 2001, Il disegno della ricerca valutativa, Franco Angeli,Milano.

BEZZI C., PALUMBO M. (a cura di), 1998, Strategie di valutazione.Strumenti di lavoro, Gramma, Perugia.

BIORCIO R., 1993, L’analisi dei gruppi, Franco Angeli, Milano.

BIORCIO R., 1995, “Scelta degli indicatori e costruzione degliindici: xenofobia del senso comune e politica”, in Sociologia ericerca sociale, n.47/48.

117

BLYTH C.R., 1972, “On Simpson’s paradox and the sure-thingsprinciple” e “Some probability paradoxes in choise fromamong random alternatives”, in Journal of the AmericanStatistical Association, giugno 1972, pp.364-373.

BOUDON R. e LAZARSFELD P.F. (a cura di), 1958, Méthodes de lasociologie. Le vucabulaire des sciences sociales, Mouton et Co., Paris-La Haye; trad. it. L’analisi empirica nelle scienze sociali, Il Mulino,Bologna, 1969.

BOUDON R., 1969, Les méthodes en sociologie, Presses Universitairesde France, Paris; trad. it. Metodologia della ricerca sociologica, IlMulino, Bologna, 1970.

BOURDIEU P., 1979, La distinction, Les editions de minuit, Paris; trad.It. La distinzione. Critica sociale del gusto, Il Mulino, Bologna, 1983.

BUZZI C., 1995, “L’utilizzazione previsionale degli indicatori:il casodel sistema dell’istruzione”, in Sociologia e ricerca sociale, n.47/48.

CAMPBELL D.T., FISKE D.W., 1959, “Convergent and discrimi-nant validation by the multitrait-multimethod matrix”, inPsycological bulletin, 56, pp. 81-105.

CAMPBELL D.T., STANLEY J.C., 1966, Experimental and quasi-expe-rimental designs for research, Houghton Mifflin Co., Boston,Massachusetts; trad. it. Disegni sperimentali e quasi-sperimentaliper la ricerca, Eucos, Roma, 2004.

CAMPELLI E., 1991, Il metodo e il suo contrario, Franco Angeli, Milano.

CAMPELLI E., 1996, “Metodi qualitativi e teoria sociale”, in Ilsociologo e le sirene, a cura di C. Cipolla e A. De Lillo, FrancoAngeli, Milano.

CANNAVÒ L. e FRUDÀ L. (a cura di), 2007, Ricerca sociale. Dal pro-getto dell’indagine alla costruzione degli indici, Carocci, Roma.

CANNAVÒ L., 1983, “Alle origini dell’analisi operazionale insociologia”, in Sociologia e ricerca sociale, n.10.

CANNAVÒ L., 1989, “Qualità e quantità: tra metodologia sociolo-gica e sociologia della scienza”, in Sociologia e ricerca sociale, n.28.

118

CANNAVÒ L., 1995, “Il primato della pragmatica. Il senso degli indi-catori nella ricerca sociale”, in Sociologia e ricerca sociale, n.47/48.

CANNAVÒ L., 1999, Teoria e pratica degli indicatori nella ricerca sociale.Vol. 1 – Teorie e problemi della misurazione sociale, Led, Milano.

CAPECCHI V., 1972, “Struttura e tecniche della ricerca”, in Ricercasociologica e ruolo del sociologo, a cura di P. Rossi, Il Mulino,Bologna.

CAPECCHI V., 1996, “Tre Castelli, una Casa e la Città Inquieta”,in Il sociologo e le sirene, a cura di C. Cipolla e A. De Lillo,Franco Angeli, Milano.

CARDANO M. e MICELI R. (a cura di), 1991, Il linguaggio delle varia-bili, Rosenberg & Sellier, Torino.

CARMINES E.G. e ZELLER R.A., 1980, Measurement in the social sci-ences, Cambridge University Press, Cambridge.

CARTOCCI R., 1984, “Concetti e indicatori: il contributo dellanuova retorica”, in Sociologia e Ricerca sociale, n. 13.

CASSANO F., 1983, La certezza infondata. Previsioni ed eventi nellescienze sociali, Dedalo, Bari.

CAVALLI A., 1996, “Per una ricomposizione tra qualità e quanti-tà”, in Il sociologo e le sirene, a cura di C. Cipolla e A. De Lillo,Franco Angeli, Milano.

CHIESI L., 2002, “Qualità e Quantità: un outline del dibattito euna proposta”, in Sociologia e ricerca sociale, n. 67.

CIPOLLA C. e DE LILLO A. (a cura di), 1996, Il sociologo e le sirene,Franco Angeli, Milano.

CIPOLLA C., 1989, Teoria della metodologia sociologica. Una metodologiaintegrata della ricerca sociale, Franco Angeli, Milano.

CIPRIANI R. e BOLASCO S. (a cura di), 1995, Ricerca qualitativa ecomputer, Franco Angeli, Milano.

COLEMAN J.S., 1964, Introduction to mathematical sociology, The FreePress, New York.

119

COMMONS J.R., 1908, “Standardization of housing investigations”in Quarterly Publications of the American Statistical Association, XI.

CORBETTA P., 2003, La ricerca sociale: metodologia e tecniche. III. Letecniche qualitative, Il Mulino, Bologna.

CRONBACH L., 1943, “On estimates of test reliability”, in Journalof educational and psychological measurement, XXXIV: 485-494.

CRONBACH L., 1947, “Test reliability: its meaning and determi-nation”, in Psychometrika, I: 1-16.

DAL LAGO A., 1987, “Introduzione all’edizione italiana”, in H.Schwartz e J.Jacobs, Sociologia qualitativa, Il Mulino, Bologna.

DE FRANCESCO C. e TRIVELLATO P., 1978, La laurea e il posto.Istruzione superiore e mercato del lavoro in Italia e all’estero, IlMulino, Bologna.

DE FRANCESCO C. e TRIVELLATO P., 1985, L’università incontrolla-ta. Alcune cose da sapere prima di iscriversi, Franco Angeli, Milano.

DE FRANCESCO C., 1989, “Un’università poco selettiva e pocoproduttiva?” in La sociologia dell’educazione in Italia. Centralità emarginalità della scuola, Zanichelli, Bologna.

DE LILLO A. e SCHIZZEROTTO A., 1985, La valutazione sociale delleoccupazioni, Il Mulino, Bologna.

DEI M., 1996, “La dispersione tra gli studenti nell’università ita-liana”, in Polis, X, Agosto.

DELLI ZOTTI G., 1996, “Quale quantità e quanta qualità nellaricerca sociale: tra integrazione e convergenza”, in Il sociologoe le sirene, a cura di C. Cipolla e A. De Lillo, Franco Angeli,Milano.

DELVECCHIO F., 1995, Scale di misura e indicatori sociali, Cacucci, Bari.

DI FRANCO G. e MARRADI A., 2003, Analisi fattoriale e analisi incomponenti principali, Bonanno, Acireale-Roma.

DI FRANCO G., 1997, Tecniche e modelli di analisi multivariata dei dati,Seam, Roma.

120

DI FRANCO G., 2001, EDS: Esplorare. Descrivere e sintetizzare i dati.Guida pratica all’analisi dei dati nella ricerca sociale, Franco Angeli,Milano.

FABBRIS L., 1997, Statistica multivariata, analisi esplorativa dei dati,McGraw-Hill, Milano.

FALLETTA N., 1983, The paradoxicon, John Wiley & Sons Inc.,London; trad. it. Il libro dei paradossi, Tea, Milano, 2001.

FASANELLA A., 1993, Concettualizzazione e spiegazione sociologica. Ilmodello nomologico-inferenziale e la sua applicabilità alle scienze socia-li, Franco Angeli, Milano.

FASANELLA A., 1999, “Il principio dell’intercambiabilità degliindici”, in Paul Felix Lazarsfeld: un “classico” marginale, a cura diE. Campelli, A. Fasanella e C. Lombardo, numero monogra-fico di Sociologia e ricerca sociale, n. 58-59.

FERRAROTTI F., 1989, La sociologia alla riscoperta della qualità,Laterza, Roma-Bari.

FIDELI R., 2001, “La costruzione di un indice tipologico: criterisemantici, numerici ed empirici”, in Sociologia e Ricerca Sociale, n.64.

FRAIRE M., 1989, “Problemi e metodologie statistiche di misu-razione di fenomeni complessi tramite indicatori e indici”, inStatistica, n. 2.

GALLINO L., 2000, Globalizzazione e disuguaglianze, Laterza, Roma-Bari.

GALTUNG J., 1967, Theory and methods of social research,Universiteforlaget, Oslo.

GIAMPAGLIA G., 1985, “La stima dell’attendibilità nella costru-zione delle scale”, in Rassegna italiana di sociologia, XXVI.

GIAMPAGLIA G., 1986, “Alpha, omega e theta: sono attendibili lemisure dell’attendibilità?”, in Sociologia e ricerca sociale, XXI: 75-99.

GIAMPAGLIA G., 1990, Lo scaling unidimensionale nella ricerca sociale,Liguori, Napoli.

GIAMPAGLIA G., 1995, Da modelli a indicatori multipli ai modelli

121

lisrel: una rivoluzione silenziosa nella ricerca sociale, inSociologia e ricerca sociale, n.46.

GOODE W.J. e HATT P.K., 1952, Methods in social research,McGraw-Hill, New York; trad. it. Metodologia della ricerca socia-le, Il Mulino, Bologna, 1962; ed. cons. 1968.

GRASSO M., 2002, “Una misurazione del benessere nelle regioniitaliane”, in Politica economica, n.2.

GUALA C. e MARRA E., 1990, Indicatori sociali e territorio, Sagep,Genova.

GUBA E.G., LINCOLN Y.S., 1989, Fourth generation evaluation, Sage,Newbury Park, CA.

GULLIKSEN H.O., 1936, “The content reliability of a test”, inPsychometrika, III: 189-194.

GULLIKSEN H.O., 1950, “Intrinsic validity”, in Psychologist, V:427-439.

GUTTMAN L., 1950, The problem of attitude and opinion measurement,in Measurement and prediction. Studies in social psychology in worldwar II, a cura di S.A.Stouffer e altri, Princetown UniversityPress, Princetown.

HARMAN H., 1967, Modern Factor analysis, University of ChicagoPress, Chicago.

HOROWITZ H. e SMITH E., 1965, “L’intercambiabilità degli indi-ci socio-economici” in R. Boudon e P.F.Lazarsfeld, L’analisiempirica nelle scienze sociali, Il Mulino, Bologna, 1969, 2 vol, vol.I, pp. 101-108.

HUGHES J.A., 1980, The philosophy of social research, New York,Longman Inc.; trad. it. Filosofia della ricerca sociale, Il Mulino,Bologna, 1982.

JAMES W., 1904, “The pragmatic method”, in Journal of Philosophy,psychology and scientific methods; trad. it. Saggi pragmatici, a cura diG.Papini, Carabba, Lanciano, 1948.

KIRK J. e MILLER M.L., 1986, Reliability and validity in qualitativereserach, Sage, London.

122

KRIPPENDORFF K., 1980, Content analysis. An introduction to itsmethodology, Sage, Beverly Hills & London; trad. it. Analisi delcontenuto. Introduzione metodologica, Eri, Torino, 1983.

KUDER F.G. e RICHARDSON M.W., 1937, “The theory of theestimation of test reliability”, in Psychometrika, II: 151-160.

LAZARSFELD P.F. e BARTON A.H., 1951, “Qualitative Measurementin the Social Sciences: Classification, Typology and Indices”, inThe Policy Sciences: Recent Developments in Scope and Method, a curadi D. Lerner e H.H. Lasswell, Stanford University Press,Stanford (CA), pp. 155-192; tr. it., “Classificazioni, tipologie eindici”, in Lazarsfeld P.F., 1967, pp. 231-306.

LAZARSFELD P.F. e BARTON A.H., 1955, “Some Functions ofQualitative Analysis in Social Research”, Frankfurter Bertragezar Sociologie, I, 1955, pp. 321-361; tr. it., “Alcune funzioni del-l’analisi qualitativa nella ricerca sociale”, in Lazarsfeld P.F.,1967, pp. 307-368.

Lazarsfeld P.F. e Rosenberg M. (a cura di), 1955, The Language ofSocial Research: A Reader in the Methodology of Social Research, TheFree Press, New York; Collier-Macmillan Limited, London.

LAZARSFELD P.F. e THIELENS W. JR., 1965, “Due indici di “eccel-lenza”” in R. Boudon e P.F.Lazarsfeld, L’analisi empirica nellescienze sociali, Il Mulino, Bologna, 1969, 2 vol, vol. I, pp. 95-100.

LAZARSFELD P.F., 1949, “The American Soldier. An ExpositoryReview”, Public Opinion Quarterly, XIII.

LAZARSFELD P.F., 1953, “A Conceptual Introduction to LatentStructure Analysis”, ai Lazarsfeld P.F. (a cura di), MathematicalThinking in the Social Sciences, Glencoe (III.), The Free Press,New York; tr. it., “Introduzione al concetto di analisi dellastruttura latente”, in Lazarsfeld, 1967, pp. 447-524.

LAZARSFELD P.F., 1955, “Recent Developments in LatentStructure Analysis”, Sociometry, XVII, pp. 391-403; tr. it.,“Recenti sviluppi nell’analisi della struttura latente”, inLazarsfeld P.F, 1967, pp. 525-40.

123

LAZARSFELD P.F., 1958, “Evidence and Inference in SocialResearch”, Daedalus, LXXXVII; parzialmente ristampato coltitolo “Des concepts aux indices empiriques”, in R. Boudone P.F. Lazarsfeld (a cura di), 1965, pp. 7-36; tr. it. parz., “Daiconcetti agli indici empirici”, in R. Boudon, Lazarsfeld P.F.,L’analisi empirica nelle scienze sociali, Il Mulino, Bologna, 1969, 2voll., vol. I, pp. 41-52.

LAZARSFELD P.F., 1959, “Problems in Methodology”, in R.K.Merton, L. Broom, L.S. Cottrell jr. (a cura di), Sociology Today,New York, Basic Books, 1959, pp. 39-78; tr. it., “Problemi dimetodologia”, in Lazarsfeld P.F., 1967, pp. 179-229.

LAZARSFELD P.F., 1966, “Concept Formation and Measurementin the Behavioral Sciences: Some Historical Observations”,in G.J. Di Renzo (a cura di), Concepts, Theory and Explanation inthe Behavioral Sciences, Random House, New York.

LAZARSFELD P.F., 1967, Metodologia e ricerca sociologica, Il Mulino,Bologna.

LAZARSFELD P.F., 1969, “Il concetto di formulazione di sintesi”,(tratto da Lazarsfeld P.F., A.H. Barton, 1955) in L’analisi empi-rica nelle scienze sociali, a cura di R. Boudon e P.F Lazarsfeld,1965; tr. it, pp. 323-329.

LAZARSGELD P.F., KATZ E., 1955, Personal influence, The FreePress, New York; trad. it. L’influenza personale nelle comunicazio-ni di massa, Eri, Torino, 1968.

LEONARDI F., 1991, “Contro la sociologia qualitativa”, in Sociologiae ricerca sociale, n.35.

LOMBARDO C., 1994, La congiunzione inespressa. I criteri di selezionedegli indicatori nella ricerca sociale, Franco Angeli, Milano.

LOMBARDO C., 1995, “Teorie, modelli di senso comune e model-li dell’attore sociale nell’istituzione del rapporto di indicazio-ne”, in Sociologia e ricerca sociale, n.47/48.

MARRADI A. (a cura di), 1988, Costruire il dato, Franco Angeli, Milano.

124

MARRADI A. e GASPERONI G. (a cura di), 1992, Costruire il dato 2,Franco Angeli, Milano.

MARRADI A. e GASPERONI G. (a cura di), 2002, Costruire il dato 3.Le scale Likert, Franco Angeli, Milano.

MARRADI A. e RODOLFI F., 1999, “Rivendicando il ruolo dellatipologia”, in Quaderni di sociologia, 19, pp.102-136.

MARRADI A., 1976, “Appendice metodologica”, in C.Tullio-Altan e A.Marradi, Valori, classi sociali, scelte politiche, Milano,Bompiani; in particolare 14.1. (L’analisi fattoriale) e 14.2. (Comecostruire un indice mediante l’analisi fattoriale).

MARRADI A., 1980, Concetti e metodo per la ricerca sociale, LaGiuntina, Firenze; ed. cons. 1991.

MARRADI A., 1981, “Misurazione e scale: qualche riflessione euna proposta”, in Quaderni di sociologia, XXIX.

MARRADI A., 1990a, “Fedeltà di un dato, affidabilità di una defi-nizione operativa”, in Rassegna italiana di sociologia, XXXI.

MARRADI A., 1990b, “Classification, tipology, taxonomy”, inQuality and quantity, XXIV.

MARRADI A., 1993, L’analisi monovariata, Franco Angeli, Milano.

MARRADI A., 1994, “Referenti, pensiero e linguaggio: una questio-ne rilevante per gli indicatori”, in Sociologia e ricerca sociale, n.43.

MARRADI A., 1996, “Due famiglie e un insieme”, in Il sociologo e lesirene, a cura di C.Cipolla e A.De Lillo, Franco Angeli, Milano.

MARRADI A., 2007, Metodologia delle scienze sociali, Il Mulino, Bologna.

MATTIOLI F., 1991, Sociometria, Euroma, Roma.

MERAVIGLIA C., 2004, Metodologia delle scienze sociali. Un’introduzione,Carocci, Roma.

MINGO I., 2007, “La costruzione degli indici”, in Ricerca sociale.Dal progetto dell’indagine alla costruzione degli indici, a cura di L.Cannavò e L. Frudà, Carocci, Roma.

125

MORENO J.L., 1953, Who shall survive?, Beacon House, Beacon,NY; trad. it. Principi di sociometria, di psicoterapia di gruppo e socio-dramma, Etas Kompass, Milano, 1964.

NOBILE S., 1997, La credibilità dell’analisi del contenuto, FrancoAngeli, Milano.

NOELLE NEUMAN E., 1983, “The effect of media on mediaeffects research”, in Journal of Communication, XXXIII.

PALUMBO, M., 2002, Il processo di valutazione: decidere, programmare,valutare, Franco Angeli, Milano.

PAVSIC R. e PITRONE M.C., 2003, Come conoscere opinioni e atteggia-menti, Bonanno, Acireale-Roma.

PAWSON R., 1980, “Empiricist measurement strategies. A cri-tique of the multiple indicator approach to measurement”, inQuality and quantity, XIV, 5: 651-678.

PAWSON R., 1989, A measure for measures. A manifesto for empiricalsociology, Routledge, London.

PERRONE L., 1977, Metodi quantitativi della ricerca sociale, Feltrinelli,Milano; ed. cons. 1982.

REFFIEUNA A., 2003, Le relazioni sociali in classe: il test sociometrico,Carocci, Roma.

RICOLFI L. (a cura di), 1997, La ricerca qualitativa, La Nuova ItaliaScientifica, Roma.

RICOLFI L., 1985, “Operazioni di ricerca e scale”, in RassegnaItaliana di Sociologia, XXVI; ristampato in M. Cardano, L.Miceli (a cura di), 1991.

RICOLFI L., 1992, “Sul rapporto di indicazione: l’interpretazionesemantica e l’interpretazione sintattica”, in Sociologia e ricercasociale, n.39.

RIZZI A., 1985, Analisi dei dati. Applicazioni dell’informatica alla sta-tistica, La Nuova Italia Scientifica, Roma; ed. cons. 1989.

126

ROSSI P. (a cura di), 1972, Ricerca sociologica e ruolo del sociologo, IlMulino, Bologna.

SAPPINO M., 2000, Dizionario del calcio italiano, Baldini & Castoldi,Milano, 2 vol.

SIMPSON E.H., 1951, “The interpretation of interaction in con-tingency tables”, in Journal of the Royal Statistic Society, Series B(Methodological), Vol. 13, No. 2, pp. 238-241.

SLOTTJE D.J., “Measuring the Quality of Life AcrossCountries”, in The Review of Economics and Statistics, n. 4.

SOLOMON R.L., 1949, “Extension of control group design”, inPsychological bulletin, 46, pp.137-150.

SPIRITO G., 1995, Matematica dell’incertezza, Newton Compton,Roma.

STAME N., 1998, L’ esperienza della valutazione, Seam, Roma.

STATERA G., 1982, Metodologia e tecniche della ricerca sociale,Palumbo, Palermo.

STATERA G., 1984, “Contro la nouvelle vague antimetodologica”, inMetascienza, a cura di A. Marradi, numero monografico diSociologia e ricerca sociale, n.13.

STATERA G., 1990, Metodologia e tecniche della ricerca sociale. Unaintroduzione sistematica, Palumbo, Palermo.

STEVENS S.S., 1946, “On the theory of scales of measurement”, inScience, III; trad. it. in M. Cardano, L. Miceli (a cura di), 1991.

STOETZEL J. e LAZARSFELD P.F., 1965, “Definizione di intenzionee spazio di attributi” in R. Boudon e P.F.Lazarsfeld, L’analisiempirica nelle scienze sociali, Il Mulino, Bologna, 1969, 2 vol, vol.I, pp. 245-250.

STOUFFER S.A., 1965, “Costruzione di una scala di tolleranza” inR. Boudon e P.F.Lazarsfeld, L’analisi empirica nelle scienze sociali,Il Mulino, Bologna, 1969, 2 voll., vol. I, pp. 165-173.

THORNDIKE E.L., 1936, Factor analysis of social and abstract intelligence,

127

in “Journal of educational psychology”, XXVII: 231-233.

TOMASELLI V., 1993, Analisi multidimensionale e inferenza sociologica.Validità e attendibilità delle tecniche statistiche: fattori, componenti e“solving”, Franco Angeli, Milano.

UNITED NATIONS DEVELOPMENT PROGRAMME, 1995, Rapportosullo sviluppo umano, vol. IV: la parte delle donne, Rosenberg &Sellier, Torino.

VARDANEGA A., 1997, Strumentalismo, indicatori e ricerca sociologica,Roma, EuRoma – Editrice Universitaria di Roma LaGoliardica.

VERGATI S. (a cura di), 1989, Dimensioni sociali e territoriali dellaqualità della vita, EuRoma – Editrice Universitaria di Roma LaGoliardica, Roma.

VERGATI S., 1995, “Definizioni semi-operative e progettazionedi indicatori soggettivi: il caso della qualità della vita urbana”,in Sociologia e ricerca sociale, n.47/48.

WILSON T.P., 1989, “Metodi qualitativi “contro” metodi quanti-tativi nella ricerca sociale”, in Sociologia e ricerca sociale, n.29.

ZAJCZYK F., 1995, “Gli indicatori della povertà: prospettivemacro e micro”, in Sociologia e ricerca sociale, n.47/48.

ZANI S., 2000, Analisi dei dati statistici, Volume II, Giuffrè, Milano.

ZEISEL H., 1965, “Due esempi di costruzione di un indice” in R.Boudon e P.F.Lazarsfeld, L’analisi empirica nelle scienze sociali, IlMulino, Bologna, 1969, 2 voll., vol. I, pp. 267 – 272.

ZETTERBERG H.L., 1954, On theory and verification in sociology,Bedminster Press, Totowa.

Finito di stampare nel mese di luglio 2008da Runner s.a.s. – Catania

Documents

TEORIA E METODO 1 · 2019. 11. 19. · 11 vita, trascurando così a piè pari la complessità semantica del concetto. Viene così a rompersi la struttura “a diamante” pro-pria