Metodi statistici in genetica forense - Familias statistici... · 2016-06-04 · Biologa, genetista forense, Medicina Legale, UNIBO Federica Alessandrini Biologa, genetista forense,

Metodi statistici in genetica forense

terza edizione

GENETISTI FORENSI ITALIANI

Bologna, 6-7 Giugno 2016

Carla BiniFederica Alessandrini

Thore EgelandOskar Hansson



Thore EgelandProfessore di statistica alla Norwegian University of Life Sciences (NMBU), progetti correlati a Familias

Oskar HanssonSenior Forensic Scientist (Norwegian Institute of Public Health)

Carla BiniBiologa, genetista forense, Medicina Legale, UNIBO

Federica AlessandriniBiologa, genetista forense, Medicina Legale, UNIVPM

Calcolo biostatistico indagini di paternità e

parentela



1. Per valutare l'incertezza di una data ipotesi ènecessario considerare almeno una ipotesi alternativa

2. L’interpretazione scientifica si basa su domande deltipo: «qual è la probabilità dell’evidenza datal’ipotesi?»

3. L'evidenza scientifica è condizionata non solo dalledue ipotesi fatte, anche dal contesto entro cui taliipotesi devono essere valutate

Principi generali

Nel caso di un test di paternità le ipotesi alternativeformulate sono:

H1: PP è il padre di F

H2: Un altro uomo non imparentato è il padre di F

1. Formulazione ipotesi

Likelihood = Pr(evidenza|ipotesi) = Pr(E|H)

2. Probabilità di E data H

Likelihood ratio (LR)

Misura la strenght of the evidence in relazione ad unaipotesi

E’ la probabilità dell’evidenza data quella particolareipotesi in rapporto alla probabilità dell’evidenza l’ipotesialternativa

LR =P(E|H1)

P(E|H2)

Paternità Standard

PP M

F

A/A B/B

A/B

LR = PI =Probabilità dell’evidenza assunto che PP è il padre (H1)

Probabilità dell’evidenza assunto che un uomo a caso è il padre (H2)

1

pA

=

pA=0.05

1

0.05= = 20=

P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 20 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.

Paternità Standard

PP M

F

C/D E/E

C/E

LR = PI =0.5

pC

=

pC=0.1

0.5

0.1= = 5

P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 5 volte più probabile assumendoche PP sia il padre di F, in confronto all’ipotesi alternativa che unuomo a caso sia il padre.

Paternità Standard

PP M

F

A/A B/B

A/B

LR = CPI =1

pA

=0.5

* = 20*5 = 100P(F|M,PP)

P(F|M)

Interpretazione: il dato osservato è 100 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.

C/D E/E

C/E

pC

PA=0.05

PC=0.1

1

0.05

0.5*

0.1=

ERRORE

Una affermazione riguardo la probabilità delle ipotesidata l’evidenza:

E’ 100 volte più probabile che PP sia il padre di Cpiuttosto che un altro uomo non imparentato sia il padredi C

Diremmo qualcosa di P(H1|E) e P(H2|E) che nonconosciamo

Formule per calcolo LR

Madre Figlio Presunto Padre LR=PI

A A AB

0.5/pA

A AB AB

A AB BC

AB A AB

AB A AC

BC AB AB

BC AB AC

BD AB AC

A A A

1/pA

AB A A

B AB A

BC AB A

AB AB AC 0.5/(pA+pB)

AB AB A1/(pA+pB)

AB AB AB

Interpretazione dei risultati (LG SIGU sulle analisi genetiche di accertamento parentale, 2013)

EsclusioneIl Gruppo di Lavoro, per addivenire all’esclusione di compatibilitàbiologica, suggerisce un valore di rapporto di verosimiglianzainferiore a 1:10.000 (Brenner C, 2004).

AttribuzioneIl Gruppo di Lavoro, per definire l’attribuzione, suggerisce un valoredi rapporto di verosimiglianza superiore a 10.000:1.

InconclusivitàConseguentemente si definisce inconclusivo qualsiasi risultato chegeneri un rapporto di verosimiglianza compreso tra 1:10.000 e10.000:1.

Teorema di Bayes: P Hp E = P Hp P(E|Hp

P Hp P(E|Hp +P Hd P(E|Hd

La probabilità di paternità W sulla base dell’osservazione dei profiligenetici (probabilità a posteriori) richiede una stima (soggettiva)delle probabilità a priori P(Hp) e P(Hd) valutate sulla base delle soleevidenze circostanziali (non genetiche)

Probabilità di Paternità: P(Hp|E) = W

Quando P(Hp) = P(Hd)=1/2 P Hp E = P Hp P(E|Hp

P Hp P(E|Hp +P Hd P(E|Hd=

= P(E|Hp

P(E|Hp + P(E|Hd=

P(E|Hp / P(E|Hp

P(E|Hp + P(E|Hd / P(E|Hp=

1

1 + 1/LR=

𝐋𝐑

𝐋𝐑 + 𝟏

Formula di Essen-Moller

COMPLICAZIONI

1. Mutazioni

2. Alleli silenti

3. Theta – correction

4. Pedigrees complessi

Mutazioni

Mutazioni: è il prezzo da pagare per avere marcatori altamente polimorfici e non codificanti Somatiche individuo Germinali progenie

Abbiamo buoni dati per stimare il tasso di mutazione:American Association of Blood Banks (AABB) 2003 Annual Reporthttp://www.cstl.nist.gov/strbase/mutation.htm

Tasso di mutazione (probabilità di un cambiamento nel DNA da una generazione all’altra) varia con:

Sesso (M>F) Locus Età

Modelli per le mutazioni

Modelli per le mutazioni: «Equal» «Stepwise»

«extended stepwise»

Modello stabile: introducendo una persona non tipizzata nelpedigree il valore di LR non cambia.

Questa è una proprietà ragionevole, poiché le informazioni nonrilevanti non dovrebbero cambiare il risultato

Per tenere in considerazione la possibilità di mutazioni si sonosviluppati dei modelli parametrici: Matematicamente coerenti Formulati in termini di parametri che possono essere interpretati Ragionevoli dal punto di vista biologico

«stationary» (stabile) «unstationary» (non stabile)

Matrici per le mutazioni

La matrice specifica il modello

Due alleli: 1 e 2Probabilità di mutare da 1 a 2 = 0.01Probabilità di mutare da 2 a 1 = 0.01

M=m11 m12

m21 m22

M=0.99 0.01

0.01 0.99

Tre alleli: 1, 2 e 3

M=

m11 m12 m13

m21 m22 m23

m31 m32 m33

Somma

0,990 0,005 0,005 1

M1= 0,005 0,990 0,005 1

0,005 0,005 0,990 1

0,990 0,009 0,001 1

M2= 0,005 0,990 0,005 1

0,001 0,009 0,990 1

Intervallo di mutazione: Mutation range r

Mutation range (r) = 0.1la probabilità di mutazione decresce di 1/10 per ogni ulterioredifferenza di unità ripetuta

Somma

0,990 0,009 0,001 1

M2= 0,005 0,990 0,005 1

0,001 0,009 0,990 1

Mutation range = 0.001/0.009 = 0.1111

M=

m11 m12 m13

m21 m22 m23

m31 m32 m33

Qual è il modello «giusto»?

Alleli silenti

PP M

F

B/- A/-

A/-

LR =pS(pA+pS)

(pA+pS)2(pB+2pS)+pApS(pB+2pS)

0.05(0.1+0.05)

(0.1+0.05)2(0.1+2*0.05)+0.1*0.05(0.1+2*0.05)= 1.363636

Problema: persone non imparentate imparentate!

Soluzione: Theta – correction (ϴ)

Equilibrio di HW

2 alleli, A e BpA=0.4, pB=0.6

A/A= 0.42 =0.16A/B= 2*0.4*0.6 =0.48B/B= 0.62 =0.36

1.00

Theta-correction (ϴ)

Omozigoti AA: ϴpA+ pA2(1-ϴ)

Eterozigoti AB: 2pA pB(1-ϴ)

Se ϴ=0.1 (suggerito 0.01)

A/A= 0.1*0.4+0.42(1-0.1) =0.184A/B= 2*0.4*0.6(1-0.1) =0.432B/B= 0.1*0.6+0.62(1-0.1) =0.384

1.00

ϴ è la probabilità che 2 alleli presi a caso siano identici per discendenza (IBD)

Theta – correction (ϴ)

Theta – correction (ϴ)

Se x alleli sono di tipo A su un totale di n alleli campionati dallasottopopolazione, la probabilità che il successivo sia di tipo A è

xϴ + (1- ϴ)pA

1 + (n- 1) ϴ

PP M

F

A/A B/B

A/B

x=2 n=4

LR= 1

P(F ha A|non paternità)

P(F ha A|non paternità) =2ϴ + (1- ϴ)pA

1 + (4- 1) ϴLR= 1 + 3ϴ

2ϴ + (1- ϴ)pA

Esempio

ϴ riduce il valore di LR: approccio conservativo

Pedigrees complessi

Paternità deficitarie

Ricostruzione di linee parentali

Incesti

……

Documents

Metodi statistici in genetica forense - Familias statistici... · 2016-06-04 · Biologa, genetista forense, Medicina Legale, UNIBO Federica Alessandrini Biologa, genetista forense,