Upload
amanda
View
39
Download
4
Embed Size (px)
DESCRIPTION
A proteinek szerkezetének osztályozása. Készítette: Németh Valéria IV. biológus. A proteinek struktúrájának és funkciójának evolúciója. Kérdések: A protein struktúrák közti evolúciós kapcsolatok szekvencia-struktúra-funkció kapcsolatokat - PowerPoint PPT Presentation
Citation preview
A proteinek szerkezetének osztályozása
Készítette: Németh Valéria
IV. biológus
A proteinek struktúrájának és funkciójának evolúciója
Kérdések:
• A protein struktúrák közti evolúciós kapcsolatokszekvencia-struktúra-funkció kapcsolatokat
• Hogyan tükrözi a struktúrában történő változás a szekvencia megváltozását?
• Hogyan tudnak különböző szekvenciák hasonló struktúrát létrehozni?
• Hol van a szekvenciában és a stuktúrában az evolúciós hely, mely egy proteinnel indul, és hol lehet még egyéb evolúciósan hozzáférhető pont?
Állandóság és változás a protein struktúrák evolúciójában
• rokon struktúrák megtartják a másodlagos struktúrájuk legtöbb elemét: hélixek és lemezek Össze lehet hasonlítani és osztályozni a nem rokon proteinek konformációit a másodlagos struktúrájuk és a hajtogatódási mintázatuk alapján.
• struktúra magja- a központi hélixek és/v. lemezek összeszerelődése- megtartja a topológiai/hajtogatódási mintáját. A közeli rokon proteinek magja tartalmazza majdnem a teljes struktúrát. A távoli rokon proteineknél a mag az aminosavak felét v. még kevesebb részét tartalmazhatja csak.
• perifériás régió, a magon kívül, teljesen megváltoztathatja a hajtogatódási mintáját.• mutáció eredményeként a hélixek és a lemezek elmozdulhatnak és elforoghatnak.• konzervált funkciók pl. megtartani az aktív hely integritását
Ha az evolúció során változik a funkció, egy új „megkötöttség”lecseréli a korábbit, ami a funkció megtartásához szükséges, a strukturális változás nagyobb lesz.
• protein családok osztályozása 70’-es évektől-Dayhoff és munkatársai, szekvencia hasonlóságokon alapult (szekvencia adat sokkal bővebb, mint a strukturális, közel két nagyságrenddel)
• struktúra osztályozás később a 90’-es években - protein adatbank(PDB), 1000<struktúrára 2002.16ezer PDB bejegyzés= 30ezer proteinlánc de! néhány ezek közül szintetikus v. modell protein, peptidek és DNS fragment
• A proteineket strukturális családokbaevolúciós mechanizmusok analízise pl. strukturális változás tolerálása, kedvező strukturális motívumok ismétlődése, funkciók evolúciója a családokban, megkötések a másodlagos struktúra pakolódásában és kedvező topológiai elrendeződésében
• A strukturális mag sokkal konzerváltabb a legtöbb proteincsaládban, de a magban történt jelentős változás egykor néhány családnál funkcionális változáshoz vezetett.
• A legtöbb strukturális osztályozás domén szinten történik, könnyebb meghatározni a doménhatárokat a strukturális adatokból, mint a szekvencia adatokból.
Evolúciós rokonság a proteinek között: homológok, ortológok és paralógok
• homológok = közös “ancestor”-ból
• ortológok =különböző fajok homológjai, melyek egy “ancestrális” proteintől származnak
• paralógok =azonos faj homológjainál génduplikáció Ezek utódjai is paralógok. A proteinpár egyik tagja megőrzi az eredeti funkciót, míg a másiknál új funkció alakul ki. ortológoknál könnyebb következtetni a funkcióra a homológiából, mint a paralógoknál.
• Pl: globin család Egy “ancestrális” monomerikus gén megkettőződése 450-500 millió éve paralóg - és -láncot erdményezett. További változás: ortológ -lánc és -lánc jött létre különböző fajoknál pl. ló, ember.
A különböző génvesztés megnehezíti az ortológok megkülönböztetését a paralógoktól. Embernél az -, míg lónál a -lánc tűnt el. A megmaradt humán - és a ló -lánc egymás ortológjainak tűnnek tévesen!
A proteinek hasonlóságának vizsgálatakor a szekvenciákat illesztjük:
• szekvencia illesztés: a közeli rokon homológoknál, kizárólag szekvenciákon alapuló illesztés. l. abcdefg:abzd-fg szubsztitúció(c-z) és deléció A szgépes program a szekvencia-illesztésekből megadja a szekvenciák hasonlóságának mértékét. A hasonlósági index egy optimális illesztésben: % azonos aminosav
• többszörös szekvencia illesztés: három v. több szekvencia kölcsönös illesztésetöbb információ !konzervatív mintákat tár fel A régiókat közös inszerciók és deléciók alapján azonosítják =ált. perifériás hurkoknál a struktúrán belül
• strukturális illesztés: két protein struktúra szuperpozálása : azonosítják a molekulán belül azonos pozíciókban levő aminosavakat, és ezen alapul az illesztés. Bár a strukturális hasonlóságtól függ, még mindig szekvencia-illesztésről van szó. !!! struktúra sokkal lassabban változik az evolúció során, mint a szekvencia, a strukturális illesztés a nagyon távoli homológ proteinpároknál is sikerül tisztán szekvencián alapuló eljárás, pontos eredményt ad
A strukturális illesztés eredményei:
• 1)illesztés: ams-ams egyezés ! illeszkedő és nem illeszkedő régiók elkülönítésekép: vörösréz-megkötő e--transzport proteinek a)nyárfalevél plasztocianin
b)azurin távoli homológok hasonló hajtogatódási mintával Mindkettő tartalmaz egy dupla -lemez struktúrát- lemezek szemtől szemben állnak, lemezben a szálak azonos irányban futnak. Mindkét molekulában a Boldali hosszú hurok megváltozott konformációjú, a szekvenciák megfelelő régiói nem illeszkednek. A hosszú hurok a Boldalon tartalmaz egy hélixet mindkét molekulában, de!nem homológok a hélixek
• 2)strukturális hasonlóság mértéke: az illeszkedő atomok átlagos eltérése
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései
kép a-d: papaya papain és 4 homológjának szekvencia illesztése és szuperpozíciójaa közeli rokon kiwi actinidin és az egyre távolabbi rokonok: humán procathepszin L, humán cathepszin B és a Staphylococcus aureus staphopain. Egyre távolabbi rokonságnál a szekvencia és a struktúra is kevésbé hasonló.
A növények is tartalmaznak szulfhidril proteinázokat, melyek segítségével a főzéskor sokkal porhanyósabb lesz a hús papaya v. ananászlevet hozzáadva.
A szulfhidril proteináz enzimcsalád: prokariótákban, állatokban és növényekben is
Emberben: cathepszinek- lizoszómális proteinázok,caspázok- apoptózisban, calpainek hasító proteinek - sejt mozgásképességében és
az adhézióban
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései
a)papaya papain- kiwi actinidin b)papaya papain- humán procathepszin L
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései
c)papaya papain- humán máj cathepszin B,Mind az illesztésnél, mind a szuperpozíciónál nagyobb hasonlóság van a szekvenciák elején és végén, mint a középső régióban .
d)papaya papain- S. aureus staphopain
e)papaya papain, szekvencia térképezése a struktúrára
A struktúra
• elsődleges: egy proteinben a kémiai kötések halmaza
• másodlagos: -hélix és a -lemez eloszlása-a fő lánc rendezett hidrogén-kötési mintázata
• harmadlagos: a hélixek és a lemezek térbeli összeszerelődése és kölcsönhatása
• negyedleges: több monomer alegységből áll össze
•szupermásodlagos/motívum: a proteinek ismétlődő kölcsönhatási mintákat mutatnak a hélixek és a lemezek között szorosan együtt a szekvenciában. A rangsorban a szupermásodlagos szerkezet a másodlagos és a domén szerkezetek közé esik. a)hélix-hairpin, b) -hairpin, c)-- egység
Az ilyen struktúrák lokálisak, a szekvencia kontigous szegmenseit alkotják. A rövid -hairpin: 6 ams hosszú A szoros turn-höz legalább 1 ams-nak kell eltérnie a standardtól- R v. a -régióban a Ramachandran ábrázolásban- és transz peptid-kötés kell. Ez az ams lehet az L konformációban egy glicin, v. egy prolin előzi meg cisz peptid-kötésként. A -hairpin konformációját előre meg lehet határozni a glicin v. prolin aminosav hurkának pozíciójából.
Domén
• Richardson önálló tekeredési egység
• Ams-k több belső kontaktust létesítenek a doménen belül, mint a polipeptid maradék részén
• kompakt, globuláris, több motívumból összeálló független hajtogatódási egység
• evolúciós egységként létezik ez a régió
• Rangsorban a szupermásodlagos és a harmadlagos szerkezet közé esik.
b) E.coli aszpartát karbamoiltranszferáz Alegységeket képez katalítikus és regulációs lánccal, két-két doménné állnak össze. Összesen 6 katalítikus és 6 regulációs alegységből áll.
kép: a) foszfoglicerát kináz aktív helye két domén közti hasítékbanAz enzim a konformációja megváltozik, ha a szubsztrátja bekötődött
A doménhatárok azonosítása
2002. protein struktúrák 40%-a multidomén
de!genom analízisek a gének nagyobb
hányada multidomén: ~60% egysejtűek,
80% metazoák, 90% feletti az eukarióták
esetében.
A krisztallográfia kezdeti időszaka:
polipeptidláncok fragmentálása a vélt
doménhatároknál a struktúra
meghatározására
Röntgenkrisztallográfia multidomén
proteinek
De!távoli homológoknál a szekvencia alapú eljárások megbízhatatlanok a doménhatárok meghatározására. Ha ismert 3D struktúra, akkor a vélt határok finomíthatók manuális ellenőrzéssel grafikus értelmezés felhasználásával. A RASMOL program hozzáférhető és segítségével megkapható a protein struktúrák 3D értelmezése, el is lehet forgatni.
Autómata eljárások a doménhatárok azonosítására: DBS: 3 különböző doménhatár program kimenő jelét hasonlítja össze(DETECTIVE, DOMAK, PUU)DETECTIVE: strukturális domének detektálása, azonosítja a domének hidrofób magjátDOMAK: domén készítő; algoritmus domének több belső, mint külső összeköttetésekkel Kiszámít egy hasítási értéket, ha tetszőlegesen hasítjuk 2 részre a proteint.STRDL: strukturális domén határok; proteinek aminosav-halmazokba való felosztásaDOMS: a modell strukturális elemei változó állapotúak a szomszédaik állapotainak, funkcióinak megfelelően. PUU: a proteinek nem hajtogatódó egységeinek elemzése; algoritmus domének több belső, mint külső összeköttetést csinálnak, harmonikus modellt használnak az inter-domén dinamika megközelítéséreDAD: algoritmus domének több belső, mint külső ö. láncokat szétvágják, hogy az inter-domén összeköttetéseket minimálisra csökkentsék
•DBS=Domain Boundary Suite
•DETEKTIVE=DETEKTing struktural domains
•DOMAK=DOMain MAKer
•STRDL=STRuctural Domain Limits
•PUU=Parser for Protein Unfolding Units
Moduláris proteinek
• gyakran tartalmaznak több kópiában közeli rokon doméneket
Pl. Fibronektin hosszú extracelluláris protein, részt vesz a sejt adhéziójában és migrációjában, 29 domént tartalmaz: F1, F2 és F3 típusú domének többszörös tandem ismétlődéseit. Lineáris sort képez: (F1)6(F2)2(F1)3(F3)15(F1)3. A fibronektin doménjei megjelennek más moduláris proteinekben is. A modulok rekombinációja fontos szerep a proteinek evolúciójában.
Mi a különbség a modul és a domén között?Csaknem szinonímek, a használatuk nem következetes.Domén - egy egyedi polipeptidlánc struktúrájának kontextusában egy proteinen belül, mint egy tömött alegység működik
több motívumból épül fel.
Modul - protein alegység, mely együtt marad egy egységként az evolúció során, különböző strukturális kontextusokban vesz részt.
A protein hajtogatódásának osztályozása
A protein struktúrák katalogizálása:
katalogizálás+ tartalomjegyzék“Fehér lap”-on a struktúra neve “Sárga lap”-on a bejegyzéseket logikus osztályokba rendezik.
Számos adatbázisnál a proteinek osztályozása a hajtogatódási mintáik hasonlóságán alapszik.
A web-en hozzáférhetők az adatbankok, hasznos információk: keresés szekvenciára, a struktúra ábrázolására és a kapcsolódó oldalakra pl. irodalmi adatbázisok.
A proteinek strukturális osztályozása(SCOP): evolúciós rokonság és a strukturális hasonlóság szerint rendezA hierarchikus szintek:domének,homológok családjai: olyan domének, melyek hasonlóak struktúrában, funkcióban és szekvenciában(ams azonosság 30%) és közös evolúciós eredetűek.szupercsalád: közös funkciójú és struktúrájú családok fold/topológia: közös hajtogatódási topológiát mutató és jelentős részében azonos szekvenciájú szupercsaládok - másodlagos struktúrák fő összeállásának fajtája, !fontos a másodlagos struktúrák orientációja és a köztük levő kapcsolatokarchitektúra: a másodlagos struktúrák fő összeállásának fajtája, független kapcsolódásosztály -fő osztályok: , , +, / (CATH-bán összevonva 3+4.) és“kis proteinek”, melyeknek gyakran kis másodlagos szerkezetük van, melyeket diszulfid-hidak v. ligandok tartanak együtt. Pl.. búzacsíra agglutinin
Különböző családok proteinjei gyakran tartalmaznak ismétlődő strukturális motívumokat(szupermásodlagos
struktúra)
• A három legtágabb osztályozás analízisekor (SCOP, DALIDD, CATH) kiderült: jelentős egyezés van a fold csoport (>75%) és a szupercsalád (>80%) szinteknél. Különbségek: alternatív protokolloknak, különbségek az automatizált küszöbökben, melyeket a strukturális rokonságok felismerésére és ezek fold csoportokba és homológ szupercsaládokba való klaszterezésre használnak.
• Az azonosítást nehezíti: a fold csoportok összetettek a különböző protein osztályokban a kedvező strukturális motifok ismétlődése miatt. Ezeket gyakran szupermásodlagos motifokként írják le, két v. több másodlagos struktúrát tartalmaznak(pl. -hairpinek és -kanyarok főleg -osztályban, -hairpinek a főleg -osztályban és - és kapcsolt - motifok az - osztályban). Ezeket strukturális “continuum”okként írják le--sok fold csoport kapcsolódik a közös motifjaik alapján, a strukturális átfedés fokának ismerete szükséges a két protein klaszterezéséhez.
• .Hozzávetőleg a homológ szupercsaládok 20%-a kevesebb, mint 10 különböző fold csoportba tartozik.
• A fold csoportok száma 500-750 a különböző adatbázisoknál- protokoll, bejegyzések száma.
• A homológ szupercsaládok száma 1000-1200 között mozog a SCOP, DDD és CATH osztályozásoknál.
kép:két hasonlóan 3-rétegű -szendvics architektúra, de különböző az összeköttetéseik, így ezeket külön fold-ba soroljuk
A CATH osztályozás fő architektúrális csoportjai
• -barrel
-roll
• -sendvics
-bundle
• -solenoid
6-propeller
-patkó
-lóhere•eltorzult szendvics
Clam
-barrel
•Ortogonális prizma
•Aligned prizma
Non-bundle
4-propeller
7-propeller 8-propeller 2-solenoid
3-solenoid complex roll
barrel 2rétegű szendvics 3rétegű szendvics
3rétegű szendvics 4rétegű szendvics box
patkó complex propeller
FSSP és a DALI domén szótár
• A DALI program: általános és szenzitív eljárás a protein struktúrák összehasonlítására. A koordináták két halmazát megadva meghatározható a maximális közös struktúra és illeszti a közös aminosavakat. Az egyik legjobb a programok között, képes felismerni a távoli rokonságot is és a megvalósítás is gyors. Megnézi a PDB-t, a proteinhez hasonló struktúrát keres. Krisztallográfia és az NMR spektroszkópia megfejti az új struktúrát, a DALI rutinszerűen fut a koordinátákon át, a hasonlóságokat keresi az ismert struktúrához viszonyítva.
• Két osztályozás a DALI program felhasználásával:
1.)FSSP(Fold osztályozás a proteinek struktúra-struktúra illesztésén alapulva)Hasonló struktúrájú proteinek illesztése, a struktútálisan azonos aminosavak leközlése. A web helyről a felhasználó többszörös szekvencia illesztést készíthet és egymásra vetítheti a struktúrákat. 2.)DALI domén szótár(DDD)-az ismétlődő domének struktúrális osztályozása
Adatbázis, terjedelem, eljárás, típus, fajta3Dee 7231PDB bej.; STAMP; Teljesen autómatikus használja a SCOP
osztályozást; A protein domének többszörösen hierarchikus osztályozása
CAMPASS 4612 domén és 1067 szupercsalád; COMPARER; A SCOP szupercsaládkeveréke és annak irodalma; CAMPASS:A proteinek szekvenciáinakillesztéseinek összehasonlítását tartalmazza, ezek a szupercsaládokhoztartoznak
CATH 13938 PDB bej., 34287 domén,1386 szupercsalád,3285 szekvencia család;SSAP; Fél autómatikus, manuális validálás a homológ szupercsaládoknál
DDD 11886 PDB bej., 21493lánc; Dali; telj.autómatikus osztályozás; Dali doménszótár,az ismétlődő protein domének strukturális osztályozása
ENTREZ/MMDB
~15000 PDB bej.,~35000 lánc,~50000 domén;VAST;telj. autóm.;MMDBtartalmaz pre-számítási „pairwise” összehasonlítást minden PDBstruktúráról, beépült az ENTREZ-be
FSSP 2977 szekvencia család, 27946 protein struktúra(lánc); Dali; telj.autóm.;proteinek szekvencia-szekvencia illesztésén alapuló fold osztályozás,integrált szekvencia illesztés
SCOP 14729 PDB bej.,1007szupercs.,35685 domén,1699 család; protein struktúrákhierarchikus osztályozása manuálisan
HOMSTRAD 2898 struktúra,864 család; COMPARER; manuális osztályozás, hagyatkozika SCOP,Pfam,PROSITE és SMART-ra; homológ struktúra illesztésadatbázisa, annotált stuktúrális illesztések adatbázisa a homológ családoknál
• algoritmusok és protokollok
• Néhány osztályozás ráépül más osztályozásra, a saját speciális adatukkal kiegészülve. Pl.HOMSTRAD adatbázis a SCOP osztályozást használja a szupercsaládok azonosítására.
• FSSP-Dali algoritm.többsz. illesztés--van-e lokális v. globális str. hasonlóság
• CATH-többsz. illesztéssel azonosított 900 szupercsaládot
• CAMPASS-többsz. illesztéssel ~1000 szupercsaládot
DaliDD másodl. str.összehas.
CATH -SEA gyors adatbázis-kereső eljárás
CAMPASS-GRATH alkalmazása
HOMSTRAD-COMPARER ams-ams alapú eljárás
CATH - SSAP dinamikus programozási
3Dee -STAMP algoritmus alkalmazása
HOMSTRAD többszörös str. illesztés
DaliDD család,szupcs.ban
CATH konzervált struktúrális
3Dee sajátságok detektálása
Köszönöm a figyelmet!