240 likes | 312 Vues
A proteinek szerkezetének osztályozása. Készítette: Németh Valéria IV. biológus. A proteinek struktúrájának és funkciójának evolúciója. Kérdések: A protein struktúrák közti evolúciós kapcsolatok szekvencia-struktúra-funkció kapcsolatokat
E N D
A proteinek szerkezetének osztályozása Készítette: Németh Valéria IV. biológus
A proteinek struktúrájának és funkciójának evolúciója Kérdések: • A protein struktúrák közti evolúciós kapcsolatokszekvencia-struktúra-funkció kapcsolatokat • Hogyan tükrözi a struktúrában történő változás a szekvencia megváltozását? • Hogyan tudnak különböző szekvenciák hasonló struktúrát létrehozni? • Hol van a szekvenciában és a stuktúrában az evolúciós hely, mely egy proteinnel indul, és hol lehet még egyéb evolúciósan hozzáférhető pont?
Állandóság és változás a protein struktúrák evolúciójában • rokon struktúrák megtartják a másodlagos struktúrájuk legtöbb elemét: hélixek és lemezek Össze lehet hasonlítani és osztályozni a nem rokon proteinek konformációit a másodlagos struktúrájuk és a hajtogatódási mintázatuk alapján. • struktúra magja- a központi hélixek és/v. lemezek összeszerelődése- megtartja a topológiai/hajtogatódási mintáját. A közeli rokon proteinek magja tartalmazza majdnem a teljes struktúrát. A távoli rokon proteineknél a mag az aminosavak felét v. még kevesebb részét tartalmazhatja csak. • perifériás régió, a magon kívül, teljesen megváltoztathatja a hajtogatódási mintáját. • mutációeredményeként a hélixek és a lemezek elmozdulhatnak és elforoghatnak. • konzervált funkciók pl. megtartani az aktív hely integritását Ha az evolúció során változik a funkció, egy új „megkötöttség”lecseréli a korábbit, ami a funkció megtartásához szükséges, a strukturális változás nagyobb lesz.
protein családok osztályozása 70’-es évektől-Dayhoff és munkatársai, szekvencia hasonlóságokon alapult (szekvencia adat sokkal bővebb, mint a strukturális, közel két nagyságrenddel) • struktúra osztályozás később a 90’-es években - protein adatbank(PDB), 1000<struktúrára 2002.16ezer PDB bejegyzés= 30ezer proteinlánc de! néhány ezek közül szintetikus v. modell protein, peptidek és DNS fragment • A proteineket strukturális családokbaevolúciós mechanizmusok analízise pl. strukturális változás tolerálása, kedvező strukturális motívumok ismétlődése, funkciók evolúciója a családokban, megkötések a másodlagos struktúra pakolódásában és kedvező topológiai elrendeződésében • A strukturális mag sokkal konzerváltabb a legtöbb proteincsaládban, de a magban történt jelentős változás egykor néhány családnál funkcionális változáshoz vezetett. • A legtöbb strukturális osztályozás domén szinten történik, könnyebb meghatározni a doménhatárokat a strukturális adatokból, mint a szekvencia adatokból.
Evolúciós rokonság a proteinek között: homológok, ortológok és paralógok • homológok= közös “ancestor”-ból • ortológok =különböző fajok homológjai, melyek egy “ancestrális” proteintől származnak • paralógok =azonos faj homológjainál génduplikáció Ezek utódjai is paralógok. A proteinpár egyik tagja megőrzi az eredeti funkciót, míg a másiknál új funkció alakul ki. ortológoknál könnyebb következtetni a funkcióra a homológiából, mint a paralógoknál. • Pl: globin családEgy “ancestrális” monomerikus gén megkettőződése 450-500 millió éve paralóg - és -láncot erdményezett. További változás: ortológ -lánc és -lánc jött létre különböző fajoknál pl. ló, ember. A különböző génvesztés megnehezíti az ortológok megkülönböztetését a paralógoktól. Embernél az -, míg lónál a -lánc tűnt el. A megmaradt humán - és a ló -lánc egymás ortológjainak tűnnek tévesen!
A proteinek hasonlóságának vizsgálatakor a szekvenciákat illesztjük: • szekvencia illesztés: a közeli rokon homológoknál, kizárólag szekvenciákon alapuló illesztés. l. abcdefg:abzd-fg szubsztitúció(c-z) és deléció A szgépes program a szekvencia-illesztésekből megadja a szekvenciák hasonlóságának mértékét. A hasonlósági index egy optimális illesztésben: % azonos aminosav • többszörös szekvencia illesztés: három v. több szekvencia kölcsönös illesztésetöbb információ !konzervatív mintákat tár fel A régiókat közös inszerciók és deléciók alapján azonosítják =ált. perifériás hurkoknál a struktúrán belül • strukturális illesztés: két protein struktúra szuperpozálása : azonosítják a molekulán belül azonos pozíciókban levő aminosavakat, és ezen alapul az illesztés. Bár a strukturális hasonlóságtól függ, még mindig szekvencia-illesztésről van szó. !!! struktúra sokkal lassabban változik az evolúció során, mint a szekvencia, a strukturális illesztés a nagyon távoli homológ proteinpároknál is sikerül tisztán szekvencián alapuló eljárás, pontos eredményt ad
A strukturális illesztés eredményei: • 1)illesztés: ams-ams egyezés ! illeszkedő és nem illeszkedő régiók elkülönítésekép: vörösréz-megkötő e--transzport proteinek a)nyárfalevél plasztocianin b)azurin távoli homológok hasonló hajtogatódási mintával Mindkettő tartalmaz egy dupla -lemez struktúrát- lemezek szemtől szemben állnak, lemezben a szálak azonos irányban futnak. Mindkét molekulában a Boldali hosszú hurok megváltozott konformációjú, a szekvenciák megfelelő régiói nem illeszkednek. A hosszú hurok a Boldalon tartalmaz egy hélixet mindkét molekulában, de!nem homológok a hélixek • 2)strukturális hasonlóság mértéke: az illeszkedő atomok átlagos eltérése
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései A szulfhidril proteináz enzimcsalád: prokariótákban, állatokban és növényekben is Emberben: cathepszinek- lizoszómális proteinázok, caspázok- apoptózisban, calpainek hasító proteinek - sejt mozgásképességében és az adhézióban kép a-d: papayapapain és 4 homológjának szekvencia illesztése és szuperpozíciójaa közeli rokon kiwi actinidin és az egyre távolabbi rokonok: humán procathepszin L,humán cathepszin B és a Staphylococcus aureus staphopain. Egyre távolabbi rokonságnál a szekvencia és a struktúra is kevésbé hasonló. A növények is tartalmaznak szulfhidril proteinázokat, melyek segítségével a főzéskor sokkal porhanyósabb lesz a hús papaya v. ananászlevet hozzáadva.
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései a)papayapapain- kiwi actinidin b)papayapapain- humán procathepszin L
Távolabbi rokonságban álló proteinpárok szuperpozíciói és illeszkedései d)papayapapain- S. aureus staphopain c)papayapapain- humán máj cathepszin B,Mind az illesztésnél, mind a szuperpozíciónál nagyobb hasonlóság van a szekvenciák elején és végén, mint a középső régióban . e)papaya papain, szekvencia térképezése a struktúrára
A struktúra • szupermásodlagos/motívum: a proteinek ismétlődő kölcsönhatási mintákat mutatnak a hélixek és a lemezek között szorosan együtt a szekvenciában. A rangsorban a szupermásodlagos szerkezet a másodlagos és a domén szerkezetek közé esik. a)hélix-hairpin, b) -hairpin, c)-- egység • elsődleges: egy proteinben a kémiai kötések halmaza • másodlagos: -hélix és a -lemez eloszlása-a fő lánc rendezett hidrogén-kötési mintázata • harmadlagos: a hélixek és a lemezek térbeli összeszerelődése és kölcsönhatása • negyedleges: több monomer alegységből áll össze Az ilyen struktúrák lokálisak, a szekvencia kontigousszegmenseit alkotják. A rövid -hairpin: 6 ams hosszú A szoros turn-höz legalább 1 ams-nak kell eltérnie a standardtól- R v. a -régióban a Ramachandran ábrázolásban- és transz peptid-kötés kell. Ez az ams lehet az L konformációban egy glicin, v. egy prolin előzi meg cisz peptid-kötésként. A -hairpin konformációját előre meg lehet határozni a glicin v. prolin aminosav hurkának pozíciójából.
Domén • Richardson önálló tekeredési egység • Ams-k több belső kontaktust létesítenek a doménen belül, mint a polipeptid maradék részén • kompakt, globuláris, több motívumból összeálló független hajtogatódási egység • evolúciós egységként létezik ez a régió • Rangsorban a szupermásodlagos és a harmadlagos szerkezet közé esik. b) E.coli aszpartát karbamoiltranszferáz Alegységeket képez katalítikus és regulációs lánccal, két-két doménné állnak össze. Összesen 6 katalítikus és 6 regulációs alegységből áll. kép: a) foszfoglicerát kináz aktív helye két domén közti hasítékbanAz enzim a konformációja megváltozik, ha a szubsztrátja bekötődött
A doménhatárok azonosítása Autómata eljárások a doménhatárok azonosítására: DBS: 3 különböző doménhatár program kimenő jelét hasonlítja össze(DETECTIVE, DOMAK, PUU) DETECTIVE: strukturális domének detektálása, azonosítja a domének hidrofób magját DOMAK: domén készítő; algoritmus domének több belső, mint külső összeköttetésekkel Kiszámít egy hasítási értéket, ha tetszőlegesen hasítjuk 2 részre a proteint. STRDL: strukturális domén határok; proteinek aminosav-halmazokba való felosztása DOMS: a modell strukturális elemei változó állapotúak a szomszédaik állapotainak, funkcióinak megfelelően. PUU: a proteinek nem hajtogatódó egységeinek elemzése; algoritmus domének több belső, mint külső összeköttetést csinálnak, harmonikus modellt használnak az inter-domén dinamika megközelítésére DAD: algoritmus domének több belső, mint külső ö. láncokat szétvágják, hogy az inter-domén összeköttetéseket minimálisra csökkentsék DBS=Domain Boundary Suite DETEKTIVE=DETEKTing struktural domains 2002. protein struktúrák 40%-a multidomén de!genom analízisek a gének nagyobb hányada multidomén: ~60% egysejtűek, 80% metazoák, 90% feletti az eukarióták esetében. A krisztallográfia kezdeti időszaka: polipeptidláncok fragmentálása a vélt doménhatároknál a struktúra meghatározására Röntgenkrisztallográfia multidomén proteinek DOMAK=DOMain MAKer STRDL=STRuctural Domain Limits PUU=Parser for Protein Unfolding Units De!távoli homológoknál a szekvencia alapú eljárások megbízhatatlanok a doménhatárok meghatározására. Ha ismert 3D struktúra, akkor a vélt határok finomíthatók manuális ellenőrzéssel grafikus értelmezés felhasználásával. A RASMOL program hozzáférhető és segítségével megkapható a protein struktúrák 3D értelmezése, el is lehet forgatni.
Moduláris proteinek Mi a különbség a modul és a domén között? Csaknem szinonímek, a használatuk nem következetes.Domén - egy egyedi polipeptidlánc struktúrájának kontextusában egy proteinen belül, mint egy tömött alegység működik több motívumból épül fel. Modul - protein alegység, mely együtt marad egy egységként az evolúció során, különböző strukturális kontextusokban vesz részt. • gyakran tartalmaznak több kópiában közeli rokon doméneket Pl. Fibronektin hosszú extracelluláris protein, részt vesz a sejt adhéziójában és migrációjában, 29 domént tartalmaz: F1, F2 és F3 típusú domének többszörös tandem ismétlődéseit. Lineáris sort képez: (F1)6(F2)2(F1)3(F3)15(F1)3. A fibronektin doménjei megjelennek más moduláris proteinekben is. A modulok rekombinációja fontos szerep a proteinek evolúciójában.
A proteinek strukturális osztályozása(SCOP): evolúciós rokonság és a strukturális hasonlóság szerint rendezA hierarchikus szintek:domének,homológokcsaládjai: olyan domének, melyek hasonlóak struktúrában, funkcióban és szekvenciában(ams azonosság 30%) és közös evolúciós eredetűek.szupercsalád: közös funkciójú és struktúrájú családok fold/topológia: közös hajtogatódási topológiát mutató és jelentős részében azonos szekvenciájú szupercsaládok - másodlagos struktúrák fő összeállásának fajtája, !fontos a másodlagos struktúrák orientációja és a köztük levő kapcsolatok architektúra: a másodlagos struktúrák fő összeállásának fajtája, független kapcsolódás osztály -fő osztályok: , , +, / (CATH-bán összevonva 3+4.) és“kis proteinek”, melyeknek gyakran kis másodlagos szerkezetük van, melyeket diszulfid-hidak v. ligandok tartanak együtt. Pl.. búzacsíra agglutinin A protein hajtogatódásának osztályozása A protein struktúrák katalogizálása: katalogizálás+ tartalomjegyzék“Fehér lap”-on a struktúra neve “Sárga lap”-on a bejegyzéseket logikus osztályokba rendezik. Számos adatbázisnál a proteinek osztályozása a hajtogatódási mintáik hasonlóságán alapszik. A web-en hozzáférhetők az adatbankok, hasznos információk: keresés szekvenciára, a struktúra ábrázolására és a kapcsolódó oldalakra pl. irodalmi adatbázisok.
Különböző családok proteinjei gyakran tartalmaznak ismétlődő strukturális motívumokat(szupermásodlagos struktúra) • A három legtágabb osztályozás analízisekor (SCOP, DALIDD, CATH) kiderült: jelentős egyezés van a fold csoport (>75%) és a szupercsalád (>80%) szinteknél. Különbségek: alternatív protokolloknak, különbségek az automatizált küszöbökben, melyeket a strukturális rokonságok felismerésére és ezek fold csoportokba és homológ szupercsaládokba való klaszterezésre használnak. • Az azonosítást nehezíti: a fold csoportok összetettek a különböző protein osztályokban a kedvező strukturális motifok ismétlődése miatt. Ezeket gyakran szupermásodlagos motifokként írják le, két v. több másodlagos struktúrát tartalmaznak(pl. -hairpinek és -kanyarok főleg -osztályban, -hairpinek a főleg -osztályban és - és kapcsolt - motifok az - osztályban). Ezeket strukturális “continuum”okként írják le--sok fold csoport kapcsolódik a közös motifjaik alapján, a strukturális átfedés fokának ismerete szükséges a két protein klaszterezéséhez.
.Hozzávetőleg a homológ szupercsaládok 20%-a kevesebb, mint 10 különböző fold csoportba tartozik. • A fold csoportok száma 500-750 a különböző adatbázisoknál- protokoll, bejegyzések száma. • A homológ szupercsaládok száma 1000-1200 között mozog a SCOP, DDD és CATH osztályozásoknál. kép:két hasonlóan 3-rétegű -szendvics architektúra, de különböző az összeköttetéseik, így ezeket külön fold-ba soroljuk
A CATH osztályozás fő architektúrális csoportjai -patkó Non-bundle -bundle -solenoid -roll -barrel -barrel Clam -sendvics eltorzult szendvics -lóhere Ortogonális prizma Aligned prizma 4-propeller 6-propeller
7-propeller 2-solenoid 8-propeller 3-solenoid complex roll barrel 2rétegű szendvics 3rétegű szendvics 3rétegű szendvics 4rétegű szendvics box patkó complex propeller
A DALI program: általános és szenzitív eljárás a protein struktúrák összehasonlítására. A koordináták két halmazát megadva meghatározható a maximális közös struktúra és illeszti a közös aminosavakat. Az egyik legjobb a programok között, képes felismerni a távoli rokonságot is és a megvalósítás is gyors. Megnézi a PDB-t, a proteinhez hasonló struktúrát keres. Krisztallográfia és az NMR spektroszkópia megfejti az új struktúrát, a DALI rutinszerűen fut a koordinátákon át, a hasonlóságokat keresi az ismert struktúrához viszonyítva. Két osztályozás a DALI program felhasználásával:1.)FSSP(Fold osztályozás a proteinek struktúra-struktúra illesztésén alapulva)Hasonló struktúrájú proteinek illesztése, a struktútálisan azonos aminosavak leközlése. A web helyről a felhasználó többszörös szekvencia illesztést készíthet és egymásra vetítheti a struktúrákat.2.)DALI domén szótár(DDD)-az ismétlődő domének struktúrális osztályozása FSSP és a DALI domén szótár
algoritmusok és protokollok Néhány osztályozás ráépül más osztályozásra, a saját speciális adatukkal kiegészülve. Pl.HOMSTRAD adatbázis a SCOP osztályozást használja a szupercsaládok azonosítására. FSSP-Dali algoritm.többsz. illesztés--van-e lokális v. globális str. hasonlóság CATH-többsz. illesztéssel azonosított 900 szupercsaládot CAMPASS-többsz. illesztéssel ~1000 szupercsaládot DaliDD másodl. str.összehas. CATH -SEA gyors adatbázis-kereső eljárás CAMPASS-GRATH alkalmazása HOMSTRAD-COMPARER ams-ams alapú eljárás CATH - SSAP dinamikus programozási 3Dee-STAMP algoritmus alkalmazása HOMSTRAD többszörös str. illesztés DaliDDcsalád,szupcs.ban CATH konzervált struktúrális 3Dee sajátságok detektálása