29
EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

Embed Size (px)

Citation preview

Page 1: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Annotation und Klassifikation nuklearer Domänen

Tobias Doerks

Page 2: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Systematische Annotation bekannter nuklearer Domänen . und Implementation in die Domänendatenbank Smart

Identifikation und funktionelle Analyse . unbekannter (nuklearer) Domänen

Annotation und Klassifikation nuklearer Domänen (1)

Semi-automatische Analyse aller nuklearen Proteine

Page 3: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Eine Domäne ist eine evolutiv konservierte

strukturelle und funktionelle Einheit

PMS1_HUMAN

UBF1_HUMAN

WHSC1

Annotation und Klassifikation nuklearer Domänen (2)

Definition – Domäne:

eine sich unabhängig faltende Region eines Proteins

ein abgrenzbar homologer Bereich in Proteinen mit

unterschiedlicher modularer Architektur

Page 4: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Annotation und Klassifikation nuklearer Domänen (3)

Definition – nuklear:

80% nuklear in SwissProt

Literatur

Page 5: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Systematische Annotation bekannter nuklearer Domänen und Implementation in die

Domänendatenbank Smart (1)

Erstellung von Alignments

Generierung von HiddenMarkovModels

Page 6: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

Systematische Annotation und

Implementation (2)

118 (164) nukleare Domänen in mehr als 50000* Proteinen

(J. Schultz, R. R. Copley, T. Doerks,

C. P. Ponting, P. Bork Nucleic Acids Res 2000

Jan 1;28(1):231-234)

(I.Letunic, L. Goodstadt, N.J. Dickens, T.Doerks,

J. Schultz, R.Mott, F. Ciccarelli, R:R: Copley

C.P. Ponting, P. Bork Nucleic Acids Res 2002

Jan 1; 30(1):1-3

* Aktualisiterter Stand Januar 2003* Aktualisiterter Stand Januar 2003

Page 7: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

- Gesamthäufigkeit

- Evolution

- Verteilung in unter- schiedlichen Spezies

Systematische Annotation und

Implementation (3)

Page 8: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

- 3D-Struktur

- Literatur

Systematische Annotation und

Implementation (4)

- Krankheitsrelevanz

Page 9: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (1)

Page 10: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

L27, eine neue

Hetero-Dimer-bildende Domäne in .

den Rezeptor-Targeting-Proteinen

Lin-2 and Lin-7

(Doerks T, Bork P, Kamberov E, Makarova O, Muecke S, Margolis B Trends Biochem Sci 2000 Jul;25(7):317-318)

-Heterotrimerkomplex aus Guanylatkinase Lin-2, Lin-7 und Lin-10

-Transport des Wachstumsfaktor Let-23 zur basolateralen MembranLet-23 zur basolateralen Membran von Epithelzellenvon Epithelzellen

Lin2-like proteinsLin2-like proteins

Lin7-like proteinsLin7-like proteins

other proteinsother proteins

Page 11: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (2)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen

Page 12: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

(Doerks T, Strauss M, Brendel M, Bork P Trends Biochem Sci 2000 Oct;25(10):483-5)

GRAM, eine neue Domäne

in Glucosyltransferasen,

Myotubularinen und anderen

Membran-assoziierten

Proteinen

EMBL Heidelberg

Page 13: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (3)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen

Page 14: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

(Doerks T, Copley R, Bork P 2001

Trends Biochem Sci 26, 145-146)

DDT, eine neue

DNA-bindende Domäne in

unterschiedlichen

Transkriptionsfaktoren,

Chromosom-assoziierten

und anderen nuklearen

Proteinen

EMBL Heidelberg

Page 15: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

L27, eine neue Hetero-Dimer-bildende Domäne in . den Rezeptor-Targeting-Proteinen Lin-2 and Lin-7

Identifikation und funktionelle Analyse unbekannter (nuklearer) Domänen (4)

GRAM, eine neue Domäne in Glucosyltransferasen, ..Myotubularinen und anderen Membran-assoziierten Proteinen DDT, eine neue DNA-bindende Domäne in unterschiedlichen ..Transkriptionsfaktoren, Chromosom-assoziierten und ..anderen nuklearen Proteinen

BSD, eine neue putativ DNA-bindende Domäne in . Transkriptionsfaktoren, Synapsen-assoziierten ..und anderen hypothetischen Proteinen

Page 16: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

BTF2-like transcription factorsYeast, Arabidopsis, C. elegans, Drosophila and human

Arabidopsis, C. elegans, Drosophila and human

Proteins with homology to Synapse-associated proteins of Drosophila

Arabidopsis,

BTB-domain-containing proteins Arabidopsis,

Dos2-like proteins in Yeast, Arabidopsis, C. elegans and human and other hypothetical proteins Paramecium and Leishmania

BSD

BSD

BSD

BSD

BSD

BSD

BSD, eine neue putativ

DNA-bindende Domäne in

Transkriptionsfaktoren,

Synapsen-assoziierten

und anderen

hypothetischen Proteinen

(Doerks T, Huber S, Buchner E, Bork P

2002 Trends Biochem Sci 27, 168-170)

Page 17: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

Automatisches Homologie-basiertes Gruppieren aller

unbekannten Regionen nuklearer Proteine

Ergebnis ohne iterative

PSI-BLAST-Suchen :

aus ~15000 Sequenzen

~ 4000 cluster

~ 150 in unterschiedlichem

Domänen-Kontext

~ 8 neue Domänen

Ergebnis mit iterativen

PSI-BLAST-Suchen :

aus ~15000 Sequenzen

~10000 cluster

~ 400 in unterschiedlichem

Domänen-Kontext

~ 20 neue Domänen

Semi-automatische Analyse aller nuklearen Proteine (1)

Page 18: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Semi-automatische Analyse aller nuklearen Proteine (2)

Klassifizierung 28 neuer Domänen

15 neue Domänen in verschiedenen Proteinfamilien in . unterschiedlichen Spezies und molekularem Kontext

3 spezies-spezifische Domänen

7 neue Subfamilien

3 N- oder C- terminale Domänen-spezifische Extensionen

28 neue Domänen in mehr als 1800 Proteinen*

Page 19: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Semi-automatische Analyse aller nuklearen Proteine (3)

Funktionsvorhersagen für 20 von 28 Domänen (1400* Proteine)

4 Domänen mit enzymatischer Funktion 4 Protein/Protein-Interaktionsdomänen 8 RNA/DNA-Bindungsdomänen 4 Metallionen-Bindungsdomänen

5 Domänen mit möglicher Krankheitsrelevanz

10 Domänen sind nukleusspezifisch lokalisiert

18 Domänen sind im Nukleus oder Cytosol lokalisiert

(Doerks T*, Copley R R*, Schultz J, Ponting C P, Bork P Genome Res 2002 Jan;12(1):47-57) *die Autoren sind gleichberechtigt beteiligt an der Publikation

Page 20: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Weitere Projekte und Kollaborationen

Analyse von Steroid-Hormonrezeptoren als Teil des

Humangenomprojektes (International Human Genome Sequence Consortium 2001 Nature 15, 860-921)

Kollaboration mit E. Izauralde Gruppe (Genexpression EMBL)(Stutz F, Bachi A, Doerks T, Braun I C, Seraphin B, Wilm M, Bork P, Izauralde E 2000 RNA 6, 638-650)

(Suyama M, Doerks T, Braun I C, Izauralde E, Bork P 2000 EMBO Reports 1, 53-58)

Re-Annotation des Mycoplasma pneumoniae Genoms(Dandekar T, Huynen M, Regula J T, Ueberle B, Zimmermann C U, Andrade M A, Doerks T, Sanchez-Pulido L, Snel B, Suyama M, Yuan Y P, Herrmann R, Bork P 2000 Nucleic Acids Res 28, 3278-3288))

Analyse von Spir (Actin organizer)(Kerkhoff E, Simpson J C, Leberfinger C B, Otto I M, Doerks T, Bork P, Rapp U R, Raabe T, Pepperkok 2001 Curr Biol 11 (24), 1963-8)

Kollaboration mit M. Vingron, theorethische Bioinformatik DKFZ(Nicodeme P, Doerks T, Vingron M 2002 Bioinformatics 18, 161-171)

Page 21: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Zusammenfassung

Systematische Annotation von 108 nuklearen Domänen . und Implementation in die Domänendatenbank Smart

Identifikation und funktionelle Analyse von 4 ..unbekannten Domänen (2 signalling, 2 nuklear)

Semi-automatische Analyse aller nuklearen Proteine und . Identifikation von 28 neuen Domänen in 1800* Proteinen

Page 22: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Danksagung

Gutachter der schriftlichen Arbeit und die Prüfer

Mitglieder der Bioinformatik-Arbeitsgruppe von Peer Bork

Peer Bork

Anna Starzinski-Powitz

Page 23: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Page 24: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Page 25: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

Page 26: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

MAGUKMAGUK

Cask_b mm 405 ACask_b mm 405 AVVQQRARAKKEEVVLLEEEEIISCYPE[1]NDSCYPE[1]NDAAKEKELLKRIKRILLTQ PHTQ PHFFMAMALLLLQQTTHHDDVVVVAHEVYSDEALR O70589 AHEVYSDEALR O70589

P55T/PALS2_b mm 56 NP55T/PALS2_b mm 56 NLLEELVLVNNEEIILLEDEDIITPLIS[2]ENTPLIS[2]ENVVAEAELLVGIVGILLKE PHKE PHFFQSQSLLLLEEAAHHDDIVIVASKCYDSPPSS AAD45009ASKCYDSPPSS AAD45009

Camguk_b dm 405 ACamguk_b dm 405 AVVGGRCRCRRDDVVLLEQEQLLSSTSG[7]YASSTSG[7]YAKKEEEELLMRLMRLLLAA PHAA PHMMQAQALLLLHSHSHHDDVVVVARDVYGEEALR Q24210ARDVYGEEALR Q24210

Dlg3_b hs 68 ADlg3_b hs 68 AVVAALALAEEDDVVMMEEEELLQAASV[1]SDEREQAASV[1]SDERELLLQLLQLLLST PHST PHLLRARAVLVLMMVVHHDDTVTVAQKNFDPVLPP Q13368AQKNFDPVLPP Q13368

Dlg2_b hs 91 NDlg2_b hs 91 NLLEELVLVQQEEIILLRDRDLLAQLAE[2]STAQLAE[2]STAAAEAELLAHIAHILLQE PHQE PHFFQSQSLLLLEETTHHDDSSVVASKTYETPPPS Q14168ASKTYETPPPS Q14168

LIN2_b ce 421 TSTLIN2_b ce 421 TSTLRLRKKEETTLLNQNQIIDGLLG[2]PEDGLLG[2]PEAALELELLRQLRQLLLNS PHNS PHLLASASCVCVQQALALDDVVVVVCEIRDPKNEA P54936VCEIRDPKNEA P54936

PALS1_b hs 186 VQDPALS1_b hs 186 VQDLVLVQQEEVQTVVQTVLLKPVHQ KEGQEKPVHQ KEGQELLTALTALLLNA PHNA PHIIQAQALLLLLLAAHHDDKVKVAEQEMQLEPIT AF199008AEQEMQLEPIT AF199008

HSZZ27178 hs 15 AHSZZ27178 hs 15 AAAAALALADDDDLLAAEEEELLQNKPL[1]SEQNKPL[1]SEIIRERELLLKLLKLLLSK PNSK PNVVKAKALLLLSSVVHHDDTTXAQKNYDPVLPP AA322046XAQKNYDPVLPP AA322046

Cask_a mm 346 ACask_a mm 346 AVVSQSQVVLLDDSSLLEEEEIIHALTD[3]KDHALTD[3]KDLLDFDFLLHSVHSVFFQD QHQD QHLLHTHTLLLLDDLYLYDDKIKINTKSSPQIRNP O70589NTKSSPQIRNP O70589

LIN-7LIN-7

LIN-7 ce 120 DLIN-7 ce 120 DVVQQRIRILLEELLMMEHEHVVQKTGE[3]AKQKTGE[3]AKLLASASLLQQVQQVLLQS EFQS EFFFGAGAVRVREEVYVYEETVTVYESIDADTTPE CAA22459 YESIDADTTPE CAA22459

LIN-7-BA rn 15 DLIN-7-BA rn 15 DVVAARARAIIEELLLLEKEKLLQESGE[3]HKQESGE[3]HKLLQSQSLLKKVKKVLLQS EFCTAQS EFCTAIRIREEVYVYQQYMYMHETITVNGCPE Q9Z251HETITVNGCPE Q9Z251

hypLIN7 sm 1 hypLIN7 sm 1 .............RCPE[3]SK .............RCPE[3]SKLLAAAALLQRIQRILLQS DFCDMQS DFCDMIRIREEVYVYEEHIHIYTTVDINGSEE O17458YTTVDINGSEE O17458

  

  

HPTHPT

rdea dd 26 Erdea dd 26 EKKEEFTFTFFEELLLLDSDSYYISSVE EHISSVE EHLLPEPELLLNSLNSFFEA [1]DLEA [1]DLKKGAGAVLVLHSHSHHDDIKIKGSSSYIGCEAV O77083GSSSYIGCEAV O77083

EVGS_ECOLI ec 1098 DEVGS_ECOLI ec 1098 DLLQQLMLMQQEEIILLMTMTFFQHETH KDQHETH KDLLPAPAAAFQAFQALLEA [1]DNEA [1]DNRRTFTFHHQCQCIIHHRRIHIHGAANILNLQKL P30855GAANILNLQKL P30855

ATHP3 at 38 NPDATHP3 at 38 NPDFVFVSQVSQVVVTLTLFFFQDSD RIFQDSD RILLNDNDLLSLSSLSLLDQ [3]DFDQ [3]DFKKKVDPHKVDPHVVHHQQLKLKGSSSSIGAQRV Q9ZNV9GSSSSIGAQRV Q9ZNV9

Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....Consensus (80%) .hthh.-.hpph.t..t....ph..L.t.hpp......ht.hhthaphhttt...s....

Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......Sec.struc.pred.(2lin) ..hHHHHHHHHHH.......HHHHHHHHHHh.....HHHHHHHHHHHHHhhhh.......

Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............Sec.struc.pred.(7lin) .HHHHHHHHHHHHH......HHHHHHHHHHHH....HHHHHHHHHHHh............

Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....Sec.struc.(1a0b) ..HHHHHHHHHHHHHHH...HHHHHHHHHHHH.....HHHHHHHHHHHHHHHHHH.....

  

  

  

L27

Page 27: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

FIP1 at 138 KVFIP1 at 138 KVFFKQTKQTFFD----D----CCLPDLPDEEKKLLLLKT------KT------YYAACCYYLLSTS--------------AGPSTS--------------AGPVVLLGGVVMMYYLLSSTHTHKLAKLAFFSSSSDNPLSYKE--GEQTLWSYYKDNPLSYKE--GEQTLWSYYKVVVVLLPPAANQNQLLKAKAVVNPST Q9SE96NPST Q9SE96

T31B5_20 at 143 SLT31B5_20 at 143 SLFFRQIRQIFFG----TEPNG----TEPNEETTLKLKKT------KT------FFAACCYYLLSTT--------------TGPSTT--------------TGPVVAAGGTTVVYYLLSSNANARVARVAFFCCSSDDRRPLYFTAP-SGQESWSYYRPLYFTAP-SGQESWSYYRVVVVVVPPLLANANVVATATVVNPVV CAB86627NPVV CAB86627

ARP hv 229 KLARP hv 229 KLYYKQTKQTFFG----SGPDG----SGPDEEHHVKVKKT------KT------FFAACCYYLLSTA--------------TGPSTA--------------TGPVVAAGGTTLLYYLLTTNTNNTNVAVAFFCCSSDDRRPLSFAAP-SGQTAWSYYKPLSFAAP-SGQTAWSYYKVVMMIIPPLLAKAKLLAAAAVVEPVT Q9ZTW0EPVT Q9ZTW0

  

UGT51B1a pp 196 EKUGT51B1a pp 196 EKLLKTTKTTFFD----D----LLSDDSDDDDEEFVFVND------ND------YYPPCCWWLLLH---------------ELH---------------EVVFFLLQQGGHHIIYYIITTSRSRYLLYLLYYFFAFAFLLPKRDS--------------------------- Q9Y751aPKRDS--------------------------- Q9Y751a

UGT51C1 ca 296 DKUGT51C1 ca 296 DKLLQRVQRVFFD----D----LLSDESDEDDTTFCFCGN------GN------YYSSAAWWLLIK---------------DIK---------------DVVLLLLQQGGHHVVYYLLTTKDKDALLALLYYFFAFAFLLPKRFS--------------------------- Q9Y752aPKRFS--------------------------- Q9Y752a

L9470.23a sc 187 AKL9470.23a sc 187 AKLLRQRRQRFFC----C----LLDEQDEQEEPPFLFLND------ND------FFPPAAWWLLLK---------------DLK---------------DVVLLVVQQGGHHIIFFIITTTKTKHFLHFLFFFFAYAYLLPKNPR--------------------------- Q06321aPKNPR--------------------------- Q06321a

UGT52 dd 207 IKUGT52 dd 207 IKIIKNKKNKLLG----G----LLPADPADEEVVLILITW------TW------FFNNCCTNFKG--------------AQLTNFKG--------------AQLKKYYGGFFLLYYIISSNNNNNNICICFFRRSSKKFFGFQKR----- ------TGFQKR----- ------TIIVVIIPPLLSQSQVVIEIEIIKKYS Q9XYD4KKYS Q9XYD4

  

YHO0_YEAST sc 548 AEYHO0_YEAST sc 548 AEFFHAIHAIFFKDS-GKDS-GVVSPNSPNEERRLILILD------LD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDQDQHIHIGGFFYYSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKTKTIIVQVQIIEKRA P38800EKRA P38800

D9798.13 sc 647 SED9798.13 sc 647 SEFFHTLHTLFFKDC-DKDC-DIINPNNPNEEKKLILIVD------VD------HHSSCCAALLSR---------------DSR---------------DIILLLLQQGGRRMMYYIISSDADAHIHIGGFFFFSSNNIILGWVS------------TLGWVS------------TVVFFIIPPFFKEKEIIVQVQIIEKKT Q06681EKKT Q06681

KIAA0767 hs 440 GNKIAA0767 hs 440 GNFFHEIHEIFFN----N----LLTENTENEERPRPLLAVCENG--AVCENG--WWRRCCCCLLINRDRKMPT--------DINRDRKMPT--------DYYIIRRNNGGVVLLYYVVTTENENYLCYLCFFEESSSSKKSGSSKR-----------NSGSSKR-----------NKKVVIIKKLLVDVDIITDTDIIQKYK Q9Y4B9QKYK Q9Y4B9

  

VRP hs 42 EFVRP hs 42 EFFFRAFRAFFFR----R----LLPRKPRKEEKKLHLHAV------AV------VVDDCCSSLLWTPFS------------RWTPFS------------RCCHTAHTAGGRRMMFFAASSDSDSYICYICFFAASSRREDGCC-------------KEDGCC-------------KIIIILLPPLLREREVVVSVSIIEKME O95759EKME O95759

KIAA0676a hs 154 LKKIAA0676a hs 154 LKMMRKQRKQFFG----G----MMPEGPEGEEKKLVLVNY------NY------YYSSCCSSYYWKG--------------RWKG--------------RVVPPRRQQGGWWLLYYLLTTVNVNHLCHLCFFYYSSFFLLLGKEV------------SLGKEV------------SLLVVVVQQWWVDVDIITRTRLLEKNA O75163 EKNA O75163

KIAA0676b hs 300 ECKIAA0676b hs 300 ECYYRATRATFFR----R----LLPRDPRDEERRLLDGH------TSDGH------TSCCTTLLWTPFN------------KWTPFN------------KLLHHIIPPGGQQMMFFIISSNNNNYICYICFFAASSKEEDAC-------------HKEEDAC-------------HLLIIIIPPLLREREVVTITIVVEKAD O75163 EKAD O75163

Y45F10A.6a ce 166 EKY45F10A.6a ce 166 EKFFHKSHKSFFS----S----IIPPDPPDEEKKLVLVNY------NY------YYKKCCCCLLWKG--------------KWKG--------------KVVPPAAQQGGDDLLFFLLSSVNVNFLCFLCFFHHAFAFMMMGNET------------KMGNET------------KIIKKLLKKWWTDTDIIVRVRLLERVS O62462 ERVS O62462

Y45F10A.6b ce 321 DAY45F10A.6b ce 321 DAFFRCQRCQFFN----N----LLPLTPLTEEKKLLDGD------TQDGD------TQCCRRLLFTPYD------------RFTPYD------------RRRHHVVPPGGKKLLFFVVSSANANFVCFVCFFAASSRTERLV-------------SRTERLV-------------SIIVVVVPPLLIEIEVVTSTSIIEECS O62462 EECS O62462

CG7324a dm 136 SKCG7324a dm 136 SKFFRQIRQIFFK----K----MMPEEPEEEERRLVLVIS------IS------YYSSAATTYYVKN--------------KVKN--------------KIIPPRRQQGGQQLLYYIISSLNLNHVCHVCFFYYSSYYMMLGQEI------------KLGQEI------------KRRIIIIRRFFAEAELLEDEDIISRNA Q9VP46 SRNA Q9VP46

CG7324b dm 282 EECG7324b dm 282 EEFFRIYRIYFFR----R----LLPQSPQSEEIIIIDGK------DGK------IIKKAANNIIWTPYS------------KWTPYS------------KRRFNSFNSGGFFIIYYLLSSPNPNFFCFFCFFRRSSDDVVKDLV-------------SKDLV-------------SVVVVIIPPMMKTKTIIKSKSVVEKKD Q9VP46 EKKD Q9VP46

MIC1_YEAST sc 29 EKMIC1_YEAST sc 29 EKFFRLKRLKYYK----K----LLPANPANEENNILILEDTNAEVSEDTNAEVSFFATSATSIIKDGKGHSDRVNNKGRKTAKDGKGHSDRVNNKGRKTAYYVVYYSSGGRRLLFFLLTTPHPHFLVFLVFFRRDADAFFDHSSC------------VDHSSC------------VLLIILLNNIISTSTIIKRKRVVERSP P53258ERSP P53258

C1259.11C sp 20 LDPASFC1259.11C sp 20 LDPASFFFR----R----IINKQNKQEEEEIIIIAS------TVAS------TVCCEEIIGWE--------------YSKSFGWE--------------YSKSFGGNNAAYYIICTSCTSFLCFLCFFHHSSDDFKT--------------RDDFKT--------------RFFTTFFPPLLAAAAVVRKRKLLEREN O94711 EREN O94711

** **** **

MTM1_HUMAN hs 29 RDMTM1_HUMAN hs 29 RDLLTEATEAVVP----P----RRLPGLPGEETTLILITD--KEVITD--KEVIYYIICCPPFFNG-----------------PNG-----------------PIIKKGGRRVVYYIITTNYNYRLYLRRLYLRSS--LLETDSSL-----------IETDSSL-----------ILLDDVVPPLLGVGVIISRSRIIEKMG Q13496EKMG Q13496

MTMR1 hs 90 AQMTMR1 hs 90 AQMM-EE-EEAAP----P----LLFPGFPGEESSIKIKAI-VKDVMAI-VKDVMYYIICCPPFFMG-----------------AMG-----------------AVVSSGGTTLLTTVVTTDFDFKLYKLYFFKKN-N-VVERDPHF-----------IERDPHF-----------ILLDDVVPPLLGVGVIISRSRVVEKIG AJ224979EKIG AJ224979

  

SBF_DM dm 922 PKSBF_DM dm 922 PKIIQTPQTPCC----------LLLPGLPGEEDDLVLVTD-----HTD-----HLLRRCCFFLLMPDGREDE------TQCLMPDGREDE------TQCLIIPPAAEEGGAALLFFLLTTNYNYRVIRVIFFKKGSPCDPLFCEQ-------VIVGSPCDPLFCEQ-------VIVRRTTFFPPIIASASLLLKEKKIS AE003693LKEKKIS AE003693

SBF1 hs 656 PKSBF1 hs 656 PKLLLRPLRPRRL----L----LLPGEPGEEECCVLVLDG------DG------LLRRVVYYLLLPDGREEGAGGSAGGPALLPDGREEGAGGSAGGPALLLPPAAEEGGAAVVFFLLTTTYTYRVIRVIFFTGMPTDPLVGEQ-------VVVTGMPTDPLVGEQ-------VVVRRSSFFPPVVAAAALLTKEKRIS AAC39675TKEKRIS AAC39675

SBF_CE ce 788 GNSBF_CE ce 788 GNFF-DP-DPVV----------LLAHGAHGEEFFLILISD-----PSD-----PIIDDCCYYLLLTSIEESE-MSLNRLENLLTSIEESE-MSLNRLENLLLPPAADDGGSSLLFFLLTTNYNYRVIRVIFFKKGKSVDINATNG-------TIVQTGKSVDINATNG-------TIVQTIIPPLLYSYSMMESESFFKKLT AAC67405KKLT AAC67405

Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...Consensus 80% ..hpp.a.....h...-phh.p......a.s.h.p...............ph.h.G.haho..hhsFhu.h..................h.h.h.ph..hp...

Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh... Sec.struct.pred. ...ee.............ee........eEEEEe....................eEEEEEE.eEEEEEe.............hhhhhhhhhhhhhhhhhhh...

GRAM

Page 28: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

  

BPTF hs 102 NEHBPTF hs 102 NEHIIMNMNVIVIAAIYIYEEVLVLRNRNFFGTGTVVLLR-R-LLSPSPFFR------R------FFEDEDFFCAACAALLVSQ-EQCTLVSQ-EQCTLMMAAEEMHVVMHVVLLLLKKAVAVLREEDT Q9UIG2LREEDT Q9UIG2

CG17135 dm 189 NTHCG17135 dm 189 NTHVVLRLRALALSSIYIYEEVLVLRRRRFFRHRHMVMVR-R-LLSPSPFFR------R------FFEDEDLLCAACAALLACE-EQSALACE-EQSALLLTTEEVHIMVHIMLLLLKKAIAILREEDA Q9W0T0LREEDA Q9W0T0

F26H11 ce 253 TASF26H11 ce 253 TASIIMDMDAVAVEEIYIYEEILILRSRSYYHRHRTTLLR-R-IITPTPFFT------T------FFEDEDFFCAACAALLISH-NNSCIISH-NNSCIMMAAEEVHMAVHMALLLLRNRNCCLKSDDE O45409LKSDDE O45409

BAZ1A hs 573 PEIBAZ1A hs 573 PEIFFGDGDALALMMVLVLEEFFLLNANAFFGEGELFLFD-D-LLQDEFPDG-VTQDEFPDG-VTLLEEVVLLEEAEEALLVGN-DSEGPVGN-DSEGPLLCCEELLFFFLLFFFLLTTAIAIFQAIAE Q9UIG1FQAIAE Q9UIG1

BAZ1B hs 605 NTLBAZ1B hs 605 NTLFFGDGDVAVAMMVVVVEEFFLLSCSCYYSGSGLLLL----LLPDPDAAQYP--ITQYP--ITAAVSVSLLMEAMEALLSADKGGFLYSADKGGFLYLLNRNRVLVIVLVILLLLQTQTLLLQDEIA Q9UIG0LQDEIA Q9UIG0

ACF1 dm 347 EHLACF1 dm 347 EHLLLGDGDAFAFMMMRMREEFFMMHTHTYYTGTGLLLLSGSGIIEVEVFFRQN--LSRQN--LSFFYYEEMMTRATRALLTAR-EIAGPTAR-EIAGPLLSSDDILLVILLVLLLLGTGTVVFDLQKE Q9Y0W1FDLQKE Q9Y0W1

ZK783 ce 525 SQGZK783 ce 525 SQGFFADADALALMMVHVHEEFFVVQNQNFFGHGHVVLLG-G-IIDLEIA---PKDLEIA---PKLLEESSLLCAGCAGLLDGDANHAEQTLQDGDANHAEQTLQLLTTRRQQLLLLRRLALALEFPGM Q23590LEFPGM Q23590

H20J04 ce 473 NAEH20J04 ce 473 NAEFFEDEDYLYLFFIFIFQQFFFFNSNSFFKQKQLLLLP-P-LLKEKEIIRGSDEVQRGSDEVQFFSSDDIIIIAIIAIIKCNDPQNSSKCNDPQNSSFFAADDLLRVLLRVLLLLSSIRIRTDIADE AAF39888TDIADE AAF39888

F3M18 at 658 DETF3M18 at 658 DETVVGNGNLLLLMMVWVWRRFFLLISISFFSDSDVVLLD-D-LLWPWPFFT------T------LLDEDEFFIQAIQAFFHDY-DSR-LHDY-DSR-LLLGGEEIHVIHVTTLLLLRSRSIIIRDVED Q9SGP0IRDVED Q9SGP0

MLN1 at 515 DENMLN1 at 515 DENVVANANLLLLMMVWVWRRFFLLITITFFADADVVLLG-G-LLWPWPFFT------T------LLDEDEFFAQAAQAFFHDY-DPR-LHDY-DPR-LMMGGEEIHIVIHIVLLLLKTKTIIIKDIEG BAB10985IKDIEG BAB10985

MOI20 at 193 EEAMOI20 at 193 EEAVVAHAHLLLLSSVYVYGGFFLLRSRSFFSFQSFQLLY-Y-IICPCPFFE------E------LLNNDDFFVGAVGALLYFS-GPNSLYFS-GPNSLLLDADAVHVAVHVALLLLRRALALKGHLER BAA98208KGHLER BAA98208

MAH20 at 298 MDCMAH20 at 298 MDCVVGDGDLLLLMMVWVWDDFFCCTSTSFFGRQGRQLLH-H-LLWRWRFFS------S------LLEDEDFFENAENAVVCHKESNLVLCHKESNLVLIIMMEEVHAVHASSLLFFRRFLFLINERGD BAB10012INERGD BAB10012

Ypl216 sc 376 QFPTERYpl216 sc 376 QFPTERLLLLVVVYVYQQFFLLSFSFFFGRGRFIFIG-G-LLSHSHFFN------N------FFDDQQFFLTTLTTIIKCT-SPEALKCT-SPEALVVDDEEYVYVKKIINNFFLKTYNSKGS Q08964LKTYNSKGS Q08964

F1N21 at 217 TEEF1N21 at 217 TEEAAGNGNVCVCQQLFLFEEFFCCSASAFFGKGKAALLA-A-LLKEGHAET-IVKEGHAET-IVRREELLFFICGICGRRNTRRQQYCSNTRRQQYCSIITQTQMMIMMIQQLLLLDDLILISKDREM O49273SKDREM O49273

YGN3 sc 424 FDSYGN3 sc 424 FDSFFGKGKLLLLQQAYAYQQFFLLNTNTFFGSKGSKIIC-C-LLSHSHFFS------S------LLDDQQFFITSITSLLKCT-DPYELKGKCT-DPYELKGEEVVLVVVLVNNIIRTQTSKEQE P53125RTQTSKEQE P53125

hypAT1 at 187 EEAhypAT1 at 187 EEAVVVYVYLLLLSSVYVYGGFFLLRSRSFFSVQSVQLLY-Y-IICPCPFFG------G------LLDDDDFFVGAVGALLNFL-GPNSLNFL-GPNSLLLDADAVHVAVHVALLMMRRALALKGHLER BAB11682KGHLER BAB11682

hypAT2 at 258 PEDhypAT2 at 258 PEDAAGNGNVFVFQQFLFLEEFFCCSASAFFGKGKAALLD-D-LLRKGQAE--CVRKGQAE--CVIIRREEMMLSGLSGRRSKRRQQYSTSKRRQQYSTLLTQTQMIIMIIQQLLLLTTVIVILEDRGE BAB10159LEDRGE BAB10159

Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...Consensus(80%) ...h.phh.lhpFhpsFuphL..lp.hp......hpph..ul.sp.p....h.plhhhLLphhhpp...

sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....sec.struc.pred ...hhHHHHHHHHHHHHHhh..............HHHHHHHH.......hHHHHHHHHHHHHHHh....

DDT

Page 29: EMBL Heidelberg Annotation und Klassifikation nuklearer Domänen Tobias Doerks

EMBL Heidelberg

TFB1_a sc 165 LDDSLSTFB1_a sc 165 LDDSLSKKEEKLLTNKLLTNLLKLQQ---SKLQQ---SLLLLKGNKVKGNKVLLMKMKVFVFQE---TQE---TVIVINAGNAGLLPPSEPPSEFWFWSTSTRIRIPLPLLLRARAFFA P32776A P32776

TFB1_b sc 243 SENKVNTFB1_b sc 243 SENKVNVVNLSRNLSREEKKIIL------NL------NIFIFENYPIENYPIVVKKKKAYAYTD----NTD----NVVPPKNKNFFKKEEPEPEFWFWARARFFFFSSSSKKLFLFRRK P32776K P32776

BTF2_a hs 99 LLPKFKBTF2_a hs 99 LLPKFKRRKANKKANKEELEEKN----RLEEKN----RMLMLQEDPVQEDPVLLFQFQLYLYKD---LKD---LVVVVSQVSQVIISAEESAEEFWFWANANRLRLNVNATDS P32780NVNATDS P32780

BTF2_b hs 180 GCNGLRBTF2_b hs 180 GCNGLRYYNLTSNLTSDDIIIIE------SE------SIFIFRTYPARTYPAVVKMKMKYKYAE----NAE----NVVPPHNHNMMTTEEKEKEFWFWTRTRFFFFQSQSHHYFYFHHR P32780R P32780

TFB1dm_a dm 109 LLPNFKTFB1dm_a dm 109 LLPNFKRRKVDKKVDKDDLEDKN----RLEDKN----RILILVENPNVENPNLLLQLQLYLYKD---LKD---LVIVITKVTKVLLTSDETSDEFWFWATATHHAAKDKDHHALALKKK Q9V713 K Q9V713

TFB1dm_b dm 182 GCNGLKTFB1dm_b dm 182 GCNGLKYYNLTSNLTSDDVVIIH------CH------CIFIFKTYPAKTYPAVVKRKRKHKHFE----NFE----NVVPPAKAKMMSSEEAEAEFWFWTKTKFFFFQSQSHHYFYFHHR Q9V713R Q9V713

R02D3.3_a ce 116 NELAKSR02D3.3_a ce 116 NELAKSVVEESQSKQSQSKQVVELQAKQKIELQAKQKILLQEDRNLEKLQEDRNLEKLYYQNL----QNL----VAVATKLTKLIITPDDTPDDFWFWSDSDYYYYQKEGVSE O44499 QKEGVSE O44499

R02D3.3_b ce 231 CKEILKR02D3.3_b ce 231 CKEILKFFTIQCTIQCEEYYLLTR-----KTR-----KIISRSENYSRSENYIIQKQKKKNLE----NLE----LVLVPPHEHEMMSSEEENENFWFWKKKKFFFFQSQSHHYFYFHHR O44499 R O44499

F2A19.20_a at 82 LTPAEQF2A19.20_a at 82 LTPAEQLLSMAEFESMAEFELLRF-----KRF-----KLLLLRENSERENSELLQKQKLHLHKQ---FKQ---FVVESKVESKVLLTTEEDEDEFWFWSTSTRKRKKLKLLLGKDS Q9M322 GKDS Q9M322

F2A19.20_b at 161 RTNRVTF2A19.20_b at 161 RTNRVTFFNLTSNLTSEEIIIIF------QF------QIFIFAEKPAAEKPAVVRQRQAFAFIN----IN----YVYVPPKKKKMMTTEEKDKDFWFWTKTKYFYFRAEYLRAEYLYYS Q9M322S Q9M322

SPAC16E8_a sp 60 RVNSTNSPAC16E8_a sp 60 RVNSTNLLEEKDIKDIDDLQE------SLQE------SLLLLTNNPDTNNPDLLLQTLQTFFKE---AKE---AVMVMKGHKGHLLSNEQSNEQFWFWSTSTRLRLHLHLLLRARAHHA O13745 A O13745

SPAC16E8_b sp 134 VDNQMKSPAC16E8_b sp 134 VDNQMKVVSLTGQQSLTGQQIIH------DH------DMFMFEQHPLEQHPLLLRKRKVYVYDK----DK----HVHVPP-P-PLLAAEEGEGEFWFWSRSRFFFFLSLSKKLCLCKKK O13745 K O13745

B8B20.390_a nc 147 WFEDDMB8B20.390_a nc 147 WFEDDMLLKADVKADVEELQQ------SLQQ------SLMLMKKDKAKKDKALLAHAHIYIYND[6]DSND[6]DSLLSDASFNSQSDASFNSQFWFWATATRIRISLSLLLRARAYYA Q9P5N7 A Q9P5N7

Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.Consensus (80%) ......hp.p...h........lhp....l..hh.p....hss..hp.ppFW.haa..h..h.

sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...sec.struc.pred ........hhHHHHHHHHHHHHHHHh.hHHHHHHHH...........hHHHHHHHHHHh...   

BSD