13
 C OMP ARAREA SEC VE NELOR DE  AMINOACIZI PRIN UTILIZAREA  INDICATORILOR DE SIMILARITATE 

ComparatiiSimilaritate

Embed Size (px)

Citation preview

Page 1: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 1/13

 

C OMPARAREA SECVENELOR DE 

 AMINOACIZI PRIN UTILIZAREA

 INDICATORILOR DE SIMILARITATE 

Page 2: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 2/13

 

OBIECTIV:

Utilizarea parametrilor de similaritate pentrucompararea a dou stringuri de aminoacizi.

Clasificarea speciilor investigate în funcie de

similaritate/diversitate.

Compararea prin utilizarea indicatorilor desimilaritate a urmtoarelor dou proteine:

Concanavalin-Br i Concanavalin-Ma, prin

utilizarea urmtoarelor indicatori:

y Indicele Jaccard

y Coeficientul Dice

y Indicele Tversky( = 0,5, = 1)

y Indicele Sørensen

y Indicele Simpson i mrimile derivate

y Indicele de diversitate al lui Shanon

Page 3: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 3/13

 

SECVENE DE AMINOACIZI

Concanavalin-BrADTIVAVELDTYPNTDIGDPSYPHIGIDIKSVRSKKTAKWNMQNGKVGTAHIIYNSV

GKRLSAVVSYPNGDSATVSYDVDLDNVLPEWVRVGLSASTGLYKETNTILSWSFTS

KLKSNSTHETNALHFMFNQFSKDQKDLILQGDATTGTEGNLRLTRVSSNGSPQGSS

VGRALFYAPVHIWESSAVVASFEATFTFLIKSPDSHPADGIAFFISNIDSSIPSGSTGRL

LGLFPDAN

Concanavalin-MaADTIVAVELDTYPNTDVGDPSYPHXXXXXXSVRXXTAKWNMQNGKVGTAHISYN

SVGKRLSAVVSYPNGDSATVSYDVDLDNVLPEWVRVGLSASTGLYKETNTILSWSF

TSKLKSNSTHETNALHFMFNQFTKDQKDLILQSDATTGTDGNLXXTRVSSNGPSQG

STVGRALFYAPVHIWESSATVAGFDATFXXLIKSPDSHPADGIAFFISNIDSSIPSGSTG

RLLGLFPDAN

Page 4: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 4/13

 

Alinierea secvenelor de amino-acizi, pentru bazecare nu sunt identice se atribuie un scor de -1.

Indicatori de similaritate utilizai:

     

Indicele Jaccard     Coeficientul Dice

     Indicele Tversky( = 0,5, = 1)

     Indicele Sørensen

     Indicele Simpson i mrimile derivate     Indicele de diversitate al lui Shanon

Page 5: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 5/13

 

INDICELE JACCARD

 A plicarea legii ´ Totul sau nimicµ (ex: prezent = 1 /

absent = 0)

 A plicarea formulei de calcul a Indicelui Jaccard:y J = 19 / 20 = 0,95

Calcularea distanei Jaccard:

y

Jd = 1 ² 0,95 = 0,05

Page 6: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 6/13

 

COEFICIENTUL DICE

Formula de calcul:

y D = 2J/(1 + J)

y D ia valori în intervalul [0,1]

y Deci dac Jaccard era J = 0,95

D = 2*0,95/(1 + 0,95) = 0,974358974

Page 7: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 7/13

INDICELE TVER SKY (S)

Msur asimetric a similaritii

Utilizat pentru compararea unei variate cu un

prototip

S ia valori în intervalul [0,1] Formula de calcul:

Unde , 0 sunt parametrii indicelui Tversky.

= 0 , 5 , = 1

 

Page 8: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 8/13

INDICELE SØRENSEN(COEFICIENTUL DE SIMILARITATE

SØRENSEN )

Compar similaritatea a dou eantioane

Se aplic pentru variabile de tip calitativ

Formula: QS = 2C/(A+B)

y Unde A i B sunt numrul de specii în eantionul A, respectiv B, C= numrul de specii comune celor dou eantioane

Ia valori identice cu coeficientul Dice

Cunoscut i sub denumirea de indicele Czekanowski

QS = 2 * 19 / (19 + 20) = 0,974358974

 

Page 9: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 9/13

INDICELE SIMPSON

Definiie : probabilitatea ca doi indivizi extrai laîntâmplare din populaie s aparin aceleai specii.

Formula de calcul:

y unde ni = numrul de indivizi al speciei i N = numrul de indivizi ai tuturor speciilor

D ia valori în intervalul [0,1]

 

Page 10: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 10/13

INTERPRETARE INDICELE SIMPSON

0 = diversitate

1 = lipsa diversitii

Concanavalin-Br = 0,053948792Concanavalin-Ma = 0,061683943

Ambele valori sunt foarte apropiate de 0

deci au o mare diversitate

 

Page 11: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 11/13

MRIMI DERIVATE: INDICELE DEDIVER SITATE SIMPSON

Formula de calcul : 1 ² D

Ia valori în intervalul [0,1]

Cu cât valoarea este mai mare cu atât diversitatea în

eantion este mai mare Reprezint probabilitatea ca 2 indivizi extrai la

întâmplare s aparin unor specii diferite

Concanavalin-Br = 0,946051208

Concanavalin-Ma = 0,938316057

y Valoarea este foarte apropiat de 1 deci diversitatea în

eantion este mare

 

Page 12: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 12/13

MRIMI DERIVATE: RECIPROCAINDICELUI SIMPSON

Formula de calcul:

Interpretare: Cu cât valoarea este mai mare cu atât diversitatea este mai mare

Valoarea maxim pe care o poate lua este egal cu numrul maxim

de specii

Concanavalin-Br = 18,53609626

Concanavalin-Ma = 16,21167453

 

Page 13: ComparatiiSimilaritate

5/12/2018 ComparatiiSimilaritate - slidepdf.com

http://slidepdf.com/reader/full/comparatiisimilaritate 13/13

INDICELE DE DIVER SITATE AL LUI

SHANNON (H)

Formula de calcul:

Unde pi = probabilitatea de apariie a speciei i

Interpretare : cu cât valoarea indicatorului e mai mare

cu atât diversitatea e mai mare

Concanavalin-Br = 2,79403411

Concanavalin-Ma = 2,839483104