Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Metodi statistici in genetica forense
terza edizione
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
Carla BiniFederica Alessandrini
Thore EgelandOskar Hansson
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
Thore EgelandProfessore di statistica alla Norwegian University of Life Sciences (NMBU), progetti correlati a Familias
Oskar HanssonSenior Forensic Scientist (Norwegian Institute of Public Health)
Carla BiniBiologa, genetista forense, Medicina Legale, UNIBO
Federica AlessandriniBiologa, genetista forense, Medicina Legale, UNIVPM
Calcolo biostatistico indagini di paternità e
parentela
GENETISTI FORENSI ITALIANI
Bologna, 6-7 Giugno 2016
1. Per valutare l'incertezza di una data ipotesi ènecessario considerare almeno una ipotesi alternativa
2. L’interpretazione scientifica si basa su domande deltipo: «qual è la probabilità dell’evidenza datal’ipotesi?»
3. L'evidenza scientifica è condizionata non solo dalledue ipotesi fatte, anche dal contesto entro cui taliipotesi devono essere valutate
Principi generali
Nel caso di un test di paternità le ipotesi alternativeformulate sono:
H1: PP è il padre di F
H2: Un altro uomo non imparentato è il padre di F
1. Formulazione ipotesi
Likelihood = Pr(evidenza|ipotesi) = Pr(E|H)
2. Probabilità di E data H
Likelihood ratio (LR)
Misura la strenght of the evidence in relazione ad unaipotesi
E’ la probabilità dell’evidenza data quella particolareipotesi in rapporto alla probabilità dell’evidenza l’ipotesialternativa
LR =P(E|H1)
P(E|H2)
Paternità Standard
PP M
F
A/A B/B
A/B
LR = PI =Probabilità dell’evidenza assunto che PP è il padre (H1)
Probabilità dell’evidenza assunto che un uomo a caso è il padre (H2)
1
pA
=
pA=0.05
1
0.05= = 20=
P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 20 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.
Paternità Standard
PP M
F
C/D E/E
C/E
LR = PI =0.5
pC
=
pC=0.1
0.5
0.1= = 5
P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 5 volte più probabile assumendoche PP sia il padre di F, in confronto all’ipotesi alternativa che unuomo a caso sia il padre.
Paternità Standard
PP M
F
A/A B/B
A/B
LR = CPI =1
pA
=0.5
* = 20*5 = 100P(F|M,PP)
P(F|M)
Interpretazione: il dato osservato è 100 volte più probabileassumendo che PP sia il padre di F, in confronto all’ipotesialternativa che un uomo a caso sia il padre.
C/D E/E
C/E
pC
PA=0.05
PC=0.1
1
0.05
0.5*
0.1=
ERRORE
Una affermazione riguardo la probabilità delle ipotesidata l’evidenza:
E’ 100 volte più probabile che PP sia il padre di Cpiuttosto che un altro uomo non imparentato sia il padredi C
Diremmo qualcosa di P(H1|E) e P(H2|E) che nonconosciamo
Formule per calcolo LR
Madre Figlio Presunto Padre LR=PI
A A AB
0.5/pA
A AB AB
A AB BC
AB A AB
AB A AC
BC AB AB
BC AB AC
BD AB AC
A A A
1/pA
AB A A
B AB A
BC AB A
AB AB AC 0.5/(pA+pB)
AB AB A1/(pA+pB)
AB AB AB
Interpretazione dei risultati (LG SIGU sulle analisi genetiche di accertamento parentale, 2013)
EsclusioneIl Gruppo di Lavoro, per addivenire all’esclusione di compatibilitàbiologica, suggerisce un valore di rapporto di verosimiglianzainferiore a 1:10.000 (Brenner C, 2004).
AttribuzioneIl Gruppo di Lavoro, per definire l’attribuzione, suggerisce un valoredi rapporto di verosimiglianza superiore a 10.000:1.
InconclusivitàConseguentemente si definisce inconclusivo qualsiasi risultato chegeneri un rapporto di verosimiglianza compreso tra 1:10.000 e10.000:1.
Teorema di Bayes: P Hp E = P Hp P(E|Hp
P Hp P(E|Hp +P Hd P(E|Hd
La probabilità di paternità W sulla base dell’osservazione dei profiligenetici (probabilità a posteriori) richiede una stima (soggettiva)delle probabilità a priori P(Hp) e P(Hd) valutate sulla base delle soleevidenze circostanziali (non genetiche)
Probabilità di Paternità: P(Hp|E) = W
Quando P(Hp) = P(Hd)=1/2 P Hp E = P Hp P(E|Hp
P Hp P(E|Hp +P Hd P(E|Hd=
= P(E|Hp
P(E|Hp + P(E|Hd=
P(E|Hp / P(E|Hp
P(E|Hp + P(E|Hd / P(E|Hp=
1
1 + 1/LR=
𝐋𝐑
𝐋𝐑 + 𝟏
Formula di Essen-Moller
COMPLICAZIONI
1. Mutazioni
2. Alleli silenti
3. Theta – correction
4. Pedigrees complessi
Mutazioni
Mutazioni: è il prezzo da pagare per avere marcatori altamente polimorfici e non codificanti Somatiche individuo Germinali progenie
Abbiamo buoni dati per stimare il tasso di mutazione:American Association of Blood Banks (AABB) 2003 Annual Reporthttp://www.cstl.nist.gov/strbase/mutation.htm
Tasso di mutazione (probabilità di un cambiamento nel DNA da una generazione all’altra) varia con:
Sesso (M>F) Locus Età
Modelli per le mutazioni
Modelli per le mutazioni: «Equal» «Stepwise»
«extended stepwise»
Modello stabile: introducendo una persona non tipizzata nelpedigree il valore di LR non cambia.
Questa è una proprietà ragionevole, poiché le informazioni nonrilevanti non dovrebbero cambiare il risultato
Per tenere in considerazione la possibilità di mutazioni si sonosviluppati dei modelli parametrici: Matematicamente coerenti Formulati in termini di parametri che possono essere interpretati Ragionevoli dal punto di vista biologico
«stationary» (stabile) «unstationary» (non stabile)
Matrici per le mutazioni
La matrice specifica il modello
Due alleli: 1 e 2Probabilità di mutare da 1 a 2 = 0.01Probabilità di mutare da 2 a 1 = 0.01
M=m11 m12
m21 m22
M=0.99 0.01
0.01 0.99
Tre alleli: 1, 2 e 3
M=
m11 m12 m13
m21 m22 m23
m31 m32 m33
Somma
0,990 0,005 0,005 1
M1= 0,005 0,990 0,005 1
0,005 0,005 0,990 1
0,990 0,009 0,001 1
M2= 0,005 0,990 0,005 1
0,001 0,009 0,990 1
Intervallo di mutazione: Mutation range r
Mutation range (r) = 0.1la probabilità di mutazione decresce di 1/10 per ogni ulterioredifferenza di unità ripetuta
Somma
0,990 0,009 0,001 1
M2= 0,005 0,990 0,005 1
0,001 0,009 0,990 1
Mutation range = 0.001/0.009 = 0.1111
M=
m11 m12 m13
m21 m22 m23
m31 m32 m33
Qual è il modello «giusto»?
Alleli silenti
PP M
F
B/- A/-
A/-
LR =pS(pA+pS)
(pA+pS)2(pB+2pS)+pApS(pB+2pS)
0.05(0.1+0.05)
(0.1+0.05)2(0.1+2*0.05)+0.1*0.05(0.1+2*0.05)= 1.363636
Problema: persone non imparentate imparentate!
Soluzione: Theta – correction (ϴ)
Equilibrio di HW
2 alleli, A e BpA=0.4, pB=0.6
A/A= 0.42 =0.16A/B= 2*0.4*0.6 =0.48B/B= 0.62 =0.36
1.00
Theta-correction (ϴ)
Omozigoti AA: ϴpA+ pA2(1-ϴ)
Eterozigoti AB: 2pA pB(1-ϴ)
Se ϴ=0.1 (suggerito 0.01)
A/A= 0.1*0.4+0.42(1-0.1) =0.184A/B= 2*0.4*0.6(1-0.1) =0.432B/B= 0.1*0.6+0.62(1-0.1) =0.384
1.00
ϴ è la probabilità che 2 alleli presi a caso siano identici per discendenza (IBD)
Theta – correction (ϴ)
Theta – correction (ϴ)
Se x alleli sono di tipo A su un totale di n alleli campionati dallasottopopolazione, la probabilità che il successivo sia di tipo A è
xϴ + (1- ϴ)pA
1 + (n- 1) ϴ
PP M
F
A/A B/B
A/B
x=2 n=4
LR= 1
P(F ha A|non paternità)
P(F ha A|non paternità) =2ϴ + (1- ϴ)pA
1 + (4- 1) ϴLR= 1 + 3ϴ
2ϴ + (1- ϴ)pA
Esempio
ϴ riduce il valore di LR: approccio conservativo
Pedigrees complessi
Paternità deficitarie
Ricostruzione di linee parentali
Incesti
……