View
12
Download
0
Category
Preview:
Citation preview
40 60 80 100 120
40
60
80
mm
Simulating sequence evolution under domainconstraints
Tina Koestler
CIBIV
February 3, 2011
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 1 / 12
40 60 80 100 120
40
60
80
mm
Protein domain - an evolutionary conserved region
UCH
ZnF_UBP
zf-UBPYEAST
FUNGI
METAZOA
PLANTS
PROTISTS
UCH
ZnF_UBPzf-UBP
HOMSA
UCHZnF_UBP
zf-UBP
ARATH
UCH
DICDI
UCH
ZnF_UBP
zf-UBP
DICDI
best BLAST hit
best FACT hit
UCH
BATDE
D. discoideum
UCHZnF_UBP
zf-UBP
LACBI
Sgf11 Sus1
FACT
FACT FACT
FACT
? FACT
FACT FACT
? FACT
Sgf73 Sac3 Thp1 Sus1 Cdc31
FACT
FACT FACT
FACT
FACT FACT FACT
FACT FACT FACT
FACT FACT
Sem1
Ubp8SAGA TREX2
UCH
TRYBR
UCH
ZnF_UBP
zf-UBP
TRYBR
best BLAST hit
best FACT hit
*BM Basidiomycota**CM Chytridiomycota
BM*
CM**
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 2 / 12
40 60 80 100 120
40
60
80
mm
Simulating protein sequence evolution without constraints
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12
40 60 80 100 120
40
60
80
mm
Simulating protein sequence evolution without constraints
0.3
G
E
A
F
B
D
C
2
0.1
0.5
0.1
1
0.1
0.1
0.5
0.2
0.1
0.2
0.1
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 3 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
Begin M1 M2 M3 Mx
D1 D2 D3 Dx
I0 I1 I2 Ix-1
End
Ix
M Q V I G ... GTina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 4 / 12
40 60 80 100 120
40
60
80
mm
Profile Hidden Markov Model - pHMM
M4 M5 M6
S G D
qii = −�
j �=irijπj
qi = −qii
qS qG qDACDE..
ACDE..
ACDE..
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 5 / 12
40 60 80 100 120
40
60
80
mm
Simulation workflow
phylogenetic tree
S1 S2S3
S4
root sequence
HMMscan
Pfam
simulation program
S1
S2
S3
S4
>S1CCGCCIAC-MACPVVAIDFSRLANSLLGL---AIV>S2CCSCCVACVMACPVVGLLFSRLANSLLGL---LIV>S3AC-TCVAC---C-VVFSRFSRLA-SLLGLNIILII>S4ACDTCVAC--AC-VVILVFSRLA-SLLGLNIILIV
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 6 / 12
40 60 80 100 120
40
60
80
mm
ABC tran
ABC_tran
insertion position
Fre
quen
cy
0 20 40 60 80 100 120
020
0040
0060
0080
0010
000
84
64
36
2252
47
●●●●●
●
●●●●
●●●
●
●●
●●
●
●
●
●●
●●
●
●●
●
●●
●●●●●
●
●
●●●●●
●●
●●
●
●●●
●
●●●
●
●●
●
●●●●●●
●●●●
●
●●
●
●●
●●●
●
●●●●●●●●
●
●●
●●●●●●
●●●
●●●●
●●
●
●●
●
●●●
0 20 40 60 80 100 120
05
1015
2025
3035
mean insertion length per position at different branch lengths
position
leng
th
●
●●●●●●
●●●●
●
●
●●
●●●●
●
●●
●
●●●
●●●●
●●●●●●●
●●●
●●
●
●
●●●●●●
●
●
●●●
●●●●
●
●●●
●
●●●●
●
●●●●●●●●
●●●●●
●
●
●●●●●●●●●●
●●●●●●
●●●
●
●●
●
●
●
●●
●
●
●●●●●●
●●
●●●
●●●●
●
●
●
●●
●
●
●●
●●
●
●●
●
●●
●●●●●●
●●●
●
●
●●●
●●●●●
●●●
●
●
●
●●●
●●●●●●●
●
●
●●●●●
●●●
●
●
●●
●
●●●●●
●
●
●●●●●●●
●●●
●●●
●●
●
●●●●●●●
●
●
●●●
●●●●●●●
●●●●●
●●●●●●
●●
●
●●●●
●●●
●
●●●●●
●●
●
●
●●●●
●●●
●
●
●●●●
●●●
●●●●
●
●●●
●●●
●
●●●●
●
●●●
●●●●
●●●●
●●●●●
●●
●
●
●●●●
●
●●
●●
●●●
●●●●
●●●●●
●●●●
●●●●●●●
●
●●●●●
●●●●●
●
●●●
●
●
●●
●●●●
●
●
●●●●
●●●●●●●●●●
●
●●●●●●●●●●●
●
●●
●
●●
●●
●●●●●●●
●
●●●●●●
●●●●
●
●●●
●●●●●
●
●●●●●●●●●●
●●●●●●●
●●●
●●●●
●
●●●●●
●
●●●
●
●
●
●
●
●
0.10.51.01.52.05.0
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 7 / 12
40 60 80 100 120
40
60
80
mm
Evolving 22,000 human proteins
●
●
●
●
●
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
branch length
reco
vere
d do
mai
ns [%
]● ●
●
●●
●
●
no InDelsno InDels + FInDel rate=0.05InDel rate=0.05 + FInDel rate=0.1InDel rate=0.1 + F
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 8 / 12
40 60 80 100 120
40
60
80
mm
Generate your own protein family
( ( ( (C : 0 . 2 ,B : 0 . 1 ) : 0 . 1 ,A : 0 . 1 ) : 0 . 1 ,G : 2 . 0 ) : 0 . 1 , ( ( F : 1 , E : 0 . 5 ) : 0 . 1 ,D : 0 . 5 ) : 0 . 2 ) ;
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 9 / 12
40 60 80 100 120
40
60
80
mm
Generate your own protein family
0.3
G
E
A
F
B
D
C
2
0.1
0.5
0.1
1
0.1
0.1
0.5
0.2
0.1
0.2
0.1
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
A/1-445B/1-382C/1-414D/1-360E/1-408F/1-371G/1-465
1111111
34343433283930
DK L L G- I A - - - - - - - A F D- - - V R I A V Y DP GQ C L A K K C TQ A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y NP SQ C L P K K C T E A EM E I QDN L L G- L A - - - - - - - T Y D- - - V R I A V Y DP GQ C L P K A C T E A EMK I QDT L L G- W I - - - - - - - A Y - - - - V R I A V I DP GR C L P K K C T A S E L K I LDK - - G- L - - - - - - - - - - - - - - I R V F V V NAGQ C L P K K C S V A K L K I H- E L NK Y V D FQ S GP R V GT - - - - V K V Y V V S E GQ C L A K R C T V - K L I F TDR L - - - V K - - - - - - - DC S S P - L K L A V L R A GR C L A K K C TQ - - - - I Q
35353534294031
66625760566665
C P V E L GT L - - - - - - - - - V K I K ND- C E E I V N EMV D- C - - V L C P D S DC P V - - D- - - - - - - - - - - V R I GND- C E E N S D EMV D- C - - V A C P DP DC P V - - DA L - - - - - - - - - V K I K ND- C E - - - - - M I E - C - - I L - - NP DC P V - - - - - - - - A E - - A V - - V P DD- C I E I A N LMA E - C - - L A - - D S EC P L R L - - - - - - E D- - - - V K V GD E - CM EM- Q SMQD- A - - I A - - D E EC P V - - - - - - - - A T S E - - MK I P A D- C - E V - N S V V D- C - - T A - - DNDC P AD L A H F E S N- - - - - - I R T GR N- C K V P A DR NP D- C V C I S - - D E E
67635861576766
938282888710780
R C V V C - - - GA CQ A R C P A NAM- - - K - L Y T G- AMNV - - - - - - - F - - -R C V V C - - - E A CQ A R C P A E A I - - - K - L Y - - - - - - - - - - - - - - - - - -R C I V C - - - E A CQ A R C P A NA I - - - K - L L T G- - - NA - - - - - - - F - - -K C V F C - - - GA CQ A Y C P Q DV V - - - Q - V Y T Y S K L NG- - - - - - - F - - -K C I F C DAG S E C V E A C P L GA V - - - T - E Y K G F A L DA - - - - - - - F - - -Q C V F C - - - C A C I R R CDQ NA I K GNT - V Y GGV A L D E A A L K K P R Y T NR- - - - - - - - - - - - - - C P GNAW- - - T - F Y - - DK S T Y - - - - - - - F - - -
948383898810881
1139810210099130106
- - - - - - - - - - T - - - N S G S TQ - - - - - - A L K D- - K - F E I HT A GD- - -- - - - - - - - - - - - - - - - - E TQ - - - - - - L L R E - - K - Y D I HT E GD- - -- - - - - - - - - - T - - - N S G E TQ - - - - - - A L R E - - K - Y S VQ I E GD- - -- - - - - - - - - - A - - - E K N- AQ - - - - - - A L P D- - - - - - - - - - GK - - -- - - - - - - - - - S - - - NA A - SQ - - - - - - A L E D- - - - - - - - - - DA - - -GA T S NA Y I P E T - - - R F A - A K - - - - - - A - K DAD- - - - - - - - T L - - -- - - - - - - - - - ND L R E A P - S - - E L E T G E L I D- - R S A I MY - - A DV - -
11499103101100131107
145127130125123161131
G- - - - S T LMA A L E G I LQ P T - - R G S I T I H- - - - - - SMYMV - T R P TWA - - - - A T LMA A L E G I LQ - - - - R G S I T V H- - - - - - SMY T V - T R P S -A - - - - S T LMA A I T G I MQ - - - - R G S I S T H- - - - - - - MY T V - S R P S -A - - - - S S L L E A V E R I L K - - - - R G E I T I H- - - - - A - - - - - S - - P T HA - - - - S T LM E A I T T I QQ P K - - R G E V A L H- - P G- - - - - - - - - - - - -A - - - - SM L I E V L I R V I - - T HP A E I NA V HP - - - - E E L Y S A - DQ - - -NT GK - T T LMR A L T S LMDP E - - V L A L E L H- - - - - - - - - - - - - - - - -
146128131126124162132
179156158154148195145
L G- - V - G I I TQ N F L DV - - - - - - - HN S V - L A D L D I GK R H L E I R S S GL R - - I - G I I KQ N F L S V - - - - - - - HK S V - L A D L D I GK R H L E - - - - -- R - - I - GA I TQ N F L S V - - - - - - - HNT I - L S D L E I GR R H L E - - - - -F G- - V - P A I S E E F P E V - - - - - E - - S A V - L E N I NV GK R D L N- - - - -- - - - - - GA I P Q N F L E V - - - - - - A E K T I - L DA L DMGR R D- - - - - - -WR - - V - GV N SQ K F F E F GCQWK - DA KMV S L E E V DY GK K A - - - - - - -- - P C - - - MV E NT F K R V - - - - - - - - - - - - - - - - - - - - - - - - KQ - P -
180157159
146
207163164
164
K K R G E D E P E GV RQM S K L DP T A NW- - - - - - - - - - - - - G L - - - - Y R K- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A I S F R K - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - I A V G F E - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -S R G- - - - - - - - - - - - - - - - E GG- T S K E NK F LMG E E I - - - - - - - - -
165 208
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -NT T T - K A P L R Y GDV P I R S A S GA SQ G I A L F K S I NV A NK R E GNT K A L
209 243
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Y S T - - - E L T A ANP N S C E K S L DV - - - - - - - E G F GM L K K S DM L A S AQ
208164165155149196244
228184185174167211278
- - - - - - - - - - - - - - - - - - - - - - - Q N SQ I E K T T I LMT V A I - S AMK S- - - - - - - - - - - - - - - - - - - - - - - Q R S E I E K AQ I LMT V P K - S VMK S- - - - - - - - - - - - - - - - - - - - - - - Q T SQ I E K AQ I L L T I P M- S SMK S- - - - - - - - - - - - - - - - - - - - - - - R A E R I E A A R I LMA L P I - S VM E -- - - - - - - - - - - - - - - - - - - - - - - T - A R I R K S L I LMK I K I - S V S R -- - - - - - - - - - - - - - - - - - - - - - - - - - R I E DDR I L L A - A I - DVMR -NDG E L L V Y ND FQ G E - - - - - - - - - A A S R I S GA TM I V T I P V N I T V D-
229185186175168212279
266222223213207253311
T V A T V S GGQ K V L L E I MV T L A E V K K L L I L D E P A S - MKQ T A - - - - - -T V A T V S GGQ K V L L E FM E C L V E V K K L I I L D E P A S - MKQ S D- - - - - -T V A A V S G SQ K V L L A VMV C L V E V K K L L I L D E P A S - MTQ S D- - - - - -- I G S L S E GQ KM L L P L A E C L V E V R K L L I L D E S T S - MK P V T I G - - - -- V DT L S GGQWMR L E I A E C FMK V R K L L L L D E P T S - L K V T C E GT - - -R L T T L A DGQ R V R LM I F E CMK A E K TM L L V D E P T A - DK I Q A E G- V K -- - - K L S V GKQ V K V T L A T EM F T K T K Y L I L D E T V T - - - A P P - - - - - -
267223224214208254312
291239241231227265323
- - F - - - - - N F G- H- - T - - DP Q T V S DD SQ V - - - - I NG L I - - - - T T L- - L - - - - - N- - - - - - - - - - - - - V S DD- - - - - - - R Y NMNG I I - S T L- - Q - - - - - N F G- H- - T - - DP AQ L S DD- - - - - - - R - - - - - - - - S T L- - F - - - - - GW S - G- - S L S DA R V S S D- - - - - - - - - - - - - - - - - S T LHA F - - - - - Q F G- D- - S I NG E R A S NV - - - - - - - - - - - - - - - - - T T L- - - - - - - - D F E LQ - - R GAG- - - - - - - - - - - - - - - - - - - - - - - S A L- - V - - - - - D I G - H L A - - - D- - - - - - - - - - E - - - - - - - - - - - - V T L
292240242232228266324
325272272256263287340
I G L P T S L L DK T E NNV HP R T - - - - - - - - A - - - K NK L S S S S L K R A H EI G L P I S L L E K T E NNV HP R T - - - - - - - - E - - - K NK L S D S S L K R A H-I G L P I S L L E K T E N S I HP R K - - - - - - - - E - - - K - - L T S S NP QQ AH-I A L P Y S L L DK G S I N I S P EQ P I G S - - - Y - - - - K - - - - - - - - - - - - -V N L P Y S L L NK GK I E I HP QQ P V GR E K - - D- - - R - - - S NR S V R R A H-L S A P Y A L L E V GK GK I R P RQ V - - - - - I - - - - - N- - - - - - - - - - - - -F L Y P T G S LQ - F AMR L E GR - - - - - - - - - - - - - - - - - - - - - - - - - - -
326273273257264288341
350286288275293305351
L V I S NY HDK - - - - - - I P I L P Q P W L D F - - - NHGNV - - - - - - - - - - -- - - - - - - - - - - - - - - L G I L P Q P W L D F - - - - - L DV - - - - - - - - - - -- - - - - - - - - - - - - - - I G I L P Q P W L D F - - - NH L DV - - - - - - - - - - -- - - - - - - - - - - - - - - L S I V P Q P WR D F L DA K HGDV - - - - - - - - - - -- - - - - - - - - S V E - - - L P I V P E P W L D F - - - T HGK A E R I A Y T S VWP P- - - - - - - - - S V - T P F - - I V EQ P W LQ F - - - - HGDV - - - - - - - - - - -- - - - - - - - - - - - - - - L YWV NQ HK F L F - - - - - - - - - - - - - - - - - - -
351287289276294306352
361298308282325312355
- - - - - - - - - - - - - - - - - - - - - - - - - E L K L NT S HDT A - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K L K P S H E T A A - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - E L K LQ P S HD I A A K T L A A S L A- - - - - - - - - - - - - - - - - - - - - - - - - E L T L S P A - - - - - - - - - - - - -K L DK FQ S SQ P S K SMT GY A GR R NHKQQ L R L I P S - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - Q F R V Y P A - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - L N I K - - - - - - - - - - - - - - -
362299309283326313356
382319351298345332374
- - - - - - - - - - - - - - - - - - - - - - A T T P A D I GV EMV D L I NQ V DH- Q -- - - - - - - - - - - - - - - - - - - - - - A T T K A E I GA EMV N L I Y GADH- A -R K K RQ S S T DN S A N F S E K DV K GDA K T P A E I A A EMV G F I YQ V DH- A -- - - - - - - - - - - - - - - - - - - - - - S I T P V A I GT EMV N I I N- - - - - - -- - - - - - - - - - - - - - - - - - - - - - A I T P EQ I G L DMT T I I NDADH- - -- - - - - - - - - - - - - - - - - - - - - - E I A P E E A A T TM L R L V S E I DR - - -- - - - - - - - - - - - - - - - - - - - - - - - - E S A GD LQ L L K L T NY S NNG- D
375 398
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -T E S - - E D- - - A Y - G- - - - - - - V L D S E L V I P Q L DHR SM- - - - - - - -
399 421
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -- DD- Q S - - - - - - DN S - - GK G E V E - Y S - - N L F I N- - - - - - - - G SW-
383320352299346333422
421358390337381362456
- - - S V S HY S G F - Q E V K V K A I R A T V A - E KM I V LQ D EMT V - V A T GK G- - - S V S HY S G F - Q E V R V NA I HA T I A - N L K VM LQ D EMT V - V A T GK A- - - S V S HY S G F - Q E V K V NA I R A T V A - NKMV V I Q D EMT V - A A T GK G- - - P V TQ Y S G F - E KMK V K S I R L A A K - D EM L L LQ D E I T I - V A T GK G- - - R S T HY S G F D E KQ K I H SMHMAAAD E KMV V I Q D E I T S - I - - - - -- - - - - - - - - - F - E K E R V K S A R A V A A - E AMV A V I D E P T T - V C L G- -- - - DT DHY SQ G- E P V R L S AMR A L I C - S L T V A I E DD L V - - Q T I - - -
422359391338382363457
445382414360408371465
R P A E K - - - - E K C E DMQ R - - L A C A G L V - T - A I - SR P A EQ - - - - E T C S D L E R - - V T C A GP V - M- T I - RK S A E K - - - - E NC S D L K R - - V V C AGP M-M- V I - SR P - - - - - - EQ T C F D L V R R L V A C P G- - VM- A T - D- - A DAQ GGNN L C V D L DQ - -MV CDGP L VM- A V - K- - - DA - - - - - - - - - - - - - - - - - - - P T V - - SQ P KL P G- - - - - - - - - - - - - - - - - - - - - - L - N S P L - K
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 10 / 12
40 60 80 100 120
40
60
80
mm
Outlook
What proteins are appropriate to reconstruct a specific phylogeny
Gene 1
Gene 2
Gene 3
Gene 4
spec
ies
A
spec
ies
B
spec
ies
C
spec
ies
D
spec
ies
E
A B C D E
A BCD E
A B C D E
A B C D E
How far back in time can we trace a protein
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 11 / 12
40 60 80 100 120
40
60
80
mm
Acknowledgements
Ingo EbersbergerArndt von Haeseler
Tina Koestler (CIBIV) Evolution under domain constraints February 3, 2011 12 / 12
Introduction
Recommended