Upload
detty87us
View
147
Download
2
Embed Size (px)
Citation preview
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 1/13
C OMPARAREA SECVENELOR DE
AMINOACIZI PRIN UTILIZAREA
INDICATORILOR DE SIMILARITATE
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 2/13
OBIECTIV:
Utilizarea parametrilor de similaritate pentrucompararea a dou stringuri de aminoacizi.
Clasificarea speciilor investigate în funcie de
similaritate/diversitate.
Compararea prin utilizarea indicatorilor desimilaritate a urmtoarelor dou proteine:
Concanavalin-Br i Concanavalin-Ma, prin
utilizarea urmtoarelor indicatori:
y Indicele Jaccard
y Coeficientul Dice
y Indicele Tversky( = 0,5, = 1)
y Indicele Sørensen
y Indicele Simpson i mrimile derivate
y Indicele de diversitate al lui Shanon
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 3/13
SECVENE DE AMINOACIZI
Concanavalin-BrADTIVAVELDTYPNTDIGDPSYPHIGIDIKSVRSKKTAKWNMQNGKVGTAHIIYNSV
GKRLSAVVSYPNGDSATVSYDVDLDNVLPEWVRVGLSASTGLYKETNTILSWSFTS
KLKSNSTHETNALHFMFNQFSKDQKDLILQGDATTGTEGNLRLTRVSSNGSPQGSS
VGRALFYAPVHIWESSAVVASFEATFTFLIKSPDSHPADGIAFFISNIDSSIPSGSTGRL
LGLFPDAN
Concanavalin-MaADTIVAVELDTYPNTDVGDPSYPHXXXXXXSVRXXTAKWNMQNGKVGTAHISYN
SVGKRLSAVVSYPNGDSATVSYDVDLDNVLPEWVRVGLSASTGLYKETNTILSWSF
TSKLKSNSTHETNALHFMFNQFTKDQKDLILQSDATTGTDGNLXXTRVSSNGPSQG
STVGRALFYAPVHIWESSATVAGFDATFXXLIKSPDSHPADGIAFFISNIDSSIPSGSTG
RLLGLFPDAN
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 4/13
Alinierea secvenelor de amino-acizi, pentru bazecare nu sunt identice se atribuie un scor de -1.
Indicatori de similaritate utilizai:
Indicele Jaccard Coeficientul Dice
Indicele Tversky( = 0,5, = 1)
Indicele Sørensen
Indicele Simpson i mrimile derivate Indicele de diversitate al lui Shanon
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 5/13
INDICELE JACCARD
A plicarea legii ´ Totul sau nimicµ (ex: prezent = 1 /
absent = 0)
A plicarea formulei de calcul a Indicelui Jaccard:y J = 19 / 20 = 0,95
Calcularea distanei Jaccard:
y
Jd = 1 ² 0,95 = 0,05
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 6/13
COEFICIENTUL DICE
Formula de calcul:
y D = 2J/(1 + J)
y D ia valori în intervalul [0,1]
y Deci dac Jaccard era J = 0,95
D = 2*0,95/(1 + 0,95) = 0,974358974
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 7/13
INDICELE TVER SKY (S)
Msur asimetric a similaritii
Utilizat pentru compararea unei variate cu un
prototip
S ia valori în intervalul [0,1] Formula de calcul:
Unde , 0 sunt parametrii indicelui Tversky.
= 0 , 5 , = 1
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 8/13
INDICELE SØRENSEN(COEFICIENTUL DE SIMILARITATE
SØRENSEN )
Compar similaritatea a dou eantioane
Se aplic pentru variabile de tip calitativ
Formula: QS = 2C/(A+B)
y Unde A i B sunt numrul de specii în eantionul A, respectiv B, C= numrul de specii comune celor dou eantioane
Ia valori identice cu coeficientul Dice
Cunoscut i sub denumirea de indicele Czekanowski
QS = 2 * 19 / (19 + 20) = 0,974358974
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 9/13
INDICELE SIMPSON
Definiie : probabilitatea ca doi indivizi extrai laîntâmplare din populaie s aparin aceleai specii.
Formula de calcul:
y unde ni = numrul de indivizi al speciei i N = numrul de indivizi ai tuturor speciilor
D ia valori în intervalul [0,1]
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 10/13
INTERPRETARE INDICELE SIMPSON
0 = diversitate
1 = lipsa diversitii
Concanavalin-Br = 0,053948792Concanavalin-Ma = 0,061683943
Ambele valori sunt foarte apropiate de 0
deci au o mare diversitate
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 11/13
MRIMI DERIVATE: INDICELE DEDIVER SITATE SIMPSON
Formula de calcul : 1 ² D
Ia valori în intervalul [0,1]
Cu cât valoarea este mai mare cu atât diversitatea în
eantion este mai mare Reprezint probabilitatea ca 2 indivizi extrai la
întâmplare s aparin unor specii diferite
Concanavalin-Br = 0,946051208
Concanavalin-Ma = 0,938316057
y Valoarea este foarte apropiat de 1 deci diversitatea în
eantion este mare
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 12/13
MRIMI DERIVATE: RECIPROCAINDICELUI SIMPSON
Formula de calcul:
Interpretare: Cu cât valoarea este mai mare cu atât diversitatea este mai mare
Valoarea maxim pe care o poate lua este egal cu numrul maxim
de specii
Concanavalin-Br = 18,53609626
Concanavalin-Ma = 16,21167453
5/12/2018 ComparatiiSimilaritate - slidepdf.com
http://slidepdf.com/reader/full/comparatiisimilaritate 13/13
INDICELE DE DIVER SITATE AL LUI
SHANNON (H)
Formula de calcul:
Unde pi = probabilitatea de apariie a speciei i
Interpretare : cu cât valoarea indicatorului e mai mare
cu atât diversitatea e mai mare
Concanavalin-Br = 2,79403411
Concanavalin-Ma = 2,839483104