500 likes | 788 Vues
Evoluzione Molecolare. Studia le velocità e il tipo di sostituzioni che avvengono nel materiale genetico e nei suoi prodotti. EVOLUZIONE MOLECOLARE. DIMENSIONE TEMPO. pura descrizione. meccanismi evolutivi. DINAMICA. CINEMATICA. OBIETTIVI. individuazione delle costrizioni funzionali
E N D
Evoluzione Molecolare Studia le velocità e il tipo di sostituzioni che avvengono nel materiale genetico e nei suoi prodotti.
EVOLUZIONE MOLECOLARE DIMENSIONE TEMPO pura descrizione meccanismi evolutivi DINAMICA CINEMATICA OBIETTIVI • individuazione delle costrizioni funzionali • comprensione dei processi evolutivi • studi filogenetici, relazioni tassonomiche
EVOLUZIONE MOLECOLARE • Geni • Genomi • Organismi
EVOLUZIONE MOLECOLARE inter taxa inter phyla inter specie intra specie Livelli di analisi
EVOLUZIONE MOLECOLARE geni ortologhi geni paraloghi altre regioni (non codificanti, regolatorie) genomi completi Scelta delle sequenze
a b duplicazione genica speciazione speciazione ortologia e paralogia gene β 1 gene β 2 gene α 1 gene α 2 specie 1 specie 2
Evoluzione della famiglia genica della beta-globina umana Embrionale Fetale Pseudogene Adulta e g1 g2 yh d b 3’ 5’ 0 100 200 duplicazione genica Mya
Mutazioni - transizioni - transversioni • sostituzioni nucleotidiche • delezioni • inserzioni • inversioni A C T G
IPOTESI DELL’ OROLOGIO MOLECOLARE Zuckerkandl and Pauling (1962)
OROLOGIO MOLECOLARE sostituzioni/sito tempo
Alcuni geni (o gruppi di geni) possono evolvere sotto distinte pressioni evolutive dettate da costrizioni funzionali peculiari di un particolare lineage • Geni provenienti da compartimenti distinti (es. mitocondrio, nucleo) possono evolvere secondo differenti pressioni evolutive • I geni possono mostrare un “bias” composizionale in alcuni lineage
A A C C T T G G A A A A C C G G T T A A A A C C G G C C A C T G A Sequenza ancestrale A C G T tempo A A C G C sostituzione singola T sostituzione multipla T A sostituzioni coincidenti G G sostituzione convergente T A Sequenze discendenti A a T G g A C G T A a C G C Confronto delle sequenze attuali t C T G g A C G T A A C G C
Tipi di sostituzioni nucleotidiche sostituzione singola 1 cambio, 1 differenza sostituzione multipla 2 cambi, 1 differenza sostituzione coincidente 2 cambi, 1 differenza A C T A G C C T A C A G A C A C A A A sostituzione parallela 2 cambi, 0 differenze sostituzione convergente 3 cambi, 0 differenze retro-sostituzione 2 cambi, 0 differenze C C T T A A C T C A A C A C A C A T A C A A A
EVOLUZIONE MOLECOLARE deterministici:basati sulla osservazione dei caratteri Modelli stocastici(probabilistici dipendenti dal tempo): basati sulla misura delle diversità
1 50 mouse MTAMEESQSD ISLELPLSQ. ETFSGLWKLL PPEDILP... ..SPHCMDDL rat ...MEDSQSD MSIELPLSQ. ETFSCLWKLL PPDDILPTTA TGSPNSMEDL hamster ...MEEPQSD LSIELPLSQ. ETFSDLWKLL PPNNVLSTLP ..SSDSIEEL g_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDL r_monkey ...MEEPQSD PSIEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAVDDL human ...MEEPQSD PSVEPPLSQ. ETFSDLWKLL PENNVLSPLP ...SQAMDDL cow ...MEESQAE LNVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL sheep ...MEESQAE LGVEPPLSQ. ETFSDLWNLL PENNLLSSEL ...SAPVDDL cat ...MQEPPLE LTIEPPLSQ. ETFSELWNLL PENNVLSSEL ...SSAMNE. chicken ...MAEE... ..MEPLLEPT EVFMDLWSML PY........ .....SMQQ. xenopus ...M.EPSSE TGMDPPLSQ. ETFEDLWSLL PD..PLQTVT ....CRLDNL trout ...MAD.LAE .NVSLPLSQ. ESFEDLWKM. ..NLNLVAVQ .......PPE //////////////////////////////////////////////////////////////// 351 400 mouse GEYFTLKIRG RKRFEMFREL NEALELKDA. HATEESGDSR AHSSYLKTKK rat GEYFTLKIRG RERFEMFREL NEALELKDA. RAAEESGDSR AHSSYPKTKK hamster GEYFTLKIRG QERFKMFQEL NEALELKDA. QALKASEDSG AHSSYLKSKK g_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKK r_monkey GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPAGSR AHSSHLKSKK human GEYFTLQIRG RERFEMFREL NEALELKDA. QAGKEPGGSR AHSSHLKSKK cow GEYFTLQIRG FKRYEMFREL NDALELKDA. LDGREPGESR AHSSHLKSKK sheep GEYFTLQIRG RKRFEMFREL NEALELMDA. QAGREPGESR AHSSHLKSKK cat GEYFTLQIRG RERFEMFREL NEALELKDA. QSGKEPGGSR AHSSHLKAKK chicken NEIFYLQVRG RRRYEMLKEI NEALQL.... ....AEGGSA PRPSKGRRVK xenopus EEIFTLRIKG RSRYEMIKKL NDALELQESL DQQKVTIKCR KCRDEIKPKK trout DEIYTLQIRG KEKYEMLKKF NDSLELSELV PVADADKYRQ KCLTKRVAKR 401 422 mouse ..GQSTSRHK KTMVKKVGPD SD rat ..GQSTSRHK KPMIKKVGPD SD hamster ..GQSASRLK KLMIKREGPD SD g_monkey ..GQSTSRHK KFMFKTEGPD SD r_monkey ..GQSTSRHK KFMFKTEGPD SD human ..GQSTSRHK KLMFKTEGPD SD cow ..RPSPSCHK KPMLKREGPD SD sheep ..GPSPSCHK KPMLKREGPD SD cat ..GQSTSRHK KPMLKREGLD SD chicken VEgPQPSCGK KLLQK....G SD xenopus ........GK KLLVKDEQPD SE trout DFGVGPKKRK KLLVKEEKSD SD p53a.msf MSF: 422 Type: P September 20, 1995 11:41 Check: 5970 .. Name: mouse Len: 422 Check: 3385 Weight: 1.00 Name: rat Len: 422 Check: 877 Weight: 1.00 Name: hamster Len: 422 Check: 2423 Weight: 1.00 Name: g_monkey Len: 422 Check: 6876 Weight: 1.00 Name: r_monkey Len: 422 Check: 7388 Weight: 1.00 Name: human Len: 422 Check: 6515 Weight: 1.00 Name: cow Len: 422 Check: 4340 Weight: 1.00 Name: sheep Len: 422 Check: 9625 Weight: 1.00 Name: cat Len: 422 Check: 496 Weight: 1.00 Name: chicken Len: 422 Check: 6526 Weight: 1.00 Name: xenopus Len: 422 Check: 9659 Weight: 1.00 Name: trout Len: 422 Check: 7860 Weight: 1.00
Modelli Stocastici • Jukes Cantor • Kimura • Markov
( ) ( ) - l @ - l 2 1 q 1 2 q t t ( ) ( ) ( ) ( ) l - l - @ l - 2 / 3 1 1 q 2 / 3 1 q t t Jukes Cantor t t + 1 B 1- l q t C 1- l t t + 1 B l / 3 1- l 1-q t C 1- l l / 3 3 4 æ ö ˆ d = - ln 1 - p è ø 4 3
ˆ d = - Kimura 1 [ ] ( ) - - - ln 1 2 P Q 1 2 Q 2 dove P e Q rappresentano rispettivamente la frequenza osservata delle transizioni e delle transversioni
Modello Stazionario di Markov Nessuna assunzione “a priori” sulla matrice delle distanze ma semplice verifica della condizione di stazionarietà • Proprietà Misura accurata delle fluttuazioni statistiche (Simulazione con il metodo del Bootstrap) C. Saccone, C. Lanave, G. Pesole and G. Preparata Methods in Enzymology (1990). Vol. 183, pp. 570 - 583
Modello Stazionario di Markov test di stazionarietà = i,j = A, C, G, T
Modello Stazionario di Markov • Algoritmo Modello stocastico basato su una catena di Markov che attraverso l’equazione differenziale di Kolmogorov: 4 d Pir (T) Rrk Pik(T) = dT r = i A C calcola la matrice delle velocità 4x4 R, indipendente dal tempo, che descrive il processo di sostituzione nucleotidica G T C. Saccone, C. Lanave, G. Pesole and G. Preparata Methods in Enzymology (1990). Vol. 183, pp. 570 - 583
Alberi filogenetici • Albero <==> Grafo • Topologia: nodi + rami • Un albero descrive le relazioni fra ancestore e discendenti • I nodi sono le unità tassonomiche • Nodo ancestrale e Nodi Intermedi (UT o TU) • Nodi Terminali (UTO o OTU): specie, geni, popolazioni o individui
Alberi filogenetici • Alberi con radice o rooted • ’ ancestore ==> percorso univoco da ancestore a OTU • Alberi senza radice o unrooted • La radice è localizzata all’ interno di un ramo che congiunge le specie in esame con l’outgroup
Esempio di albero Rooted (con radice) UOMO MUCCA TOPO
Alberi filogenetici • Alberi con radice o rooted: Alberi quantitativi La lunghezza dei rami è direttamente proporzionale ai tempi di divergenza fra le UT • » Orologio Molecolare
Esempio di albero Unrooted (senza radice) A D 1 3 E 2 B C 1-3: Nodi dell’albero A-E: OTU
Alberi filogenetici • Alberi senza radice o unrooted: Alberi qualitativi • Descrivono semplicemente le relazioni evolutive fra le UT
Alberi filogenetici • Alberi basati sullo stato dei caratteri - Massima Parsimonia - Massima Verosimiglianza • Alberi basati sulla misura delle distanze - UPGMA - Neighbor - Joining
Alberi filogenetici • Metodi basati sulla Misura delle distanze • - UPGMA (albero con radice applicabile solo se rispettato l’orologio molecolare) • » Lunghezza dei rami proporzionale ai tempi di divergenza • - Neighbor Joining (albero senza radice quando non è rispettato l’orologio molecolare) • » Differente velocità nei diversi rami
Tempo di divergenza fra due specie = tempo impiegato nel processo di speciazione, ovvero tempo dell’isolamento riproduttivo T1 KAC + KBC T1 = 4r T2 KAB T2 = A B C 2r
Metodi Deterministici • Massima Parsimonia Sito 2 Sito Sito 3 Sequenza 1 2 3 4 Sito 5 Sito7 Sito 9
Alberi filogenetici • Alberi fenetici (fenogrammi): descrivono le relazioni fra le specie sulla base delle diversità o somiglianze morfologiche, molecolari e anatomiche • Alberi cladistici (cladogrammi): descrivono le relazioni di discendenza tra un gruppo di specie • Se l’orologio molecolare è rispettato Alberi cladistici<==> Alberi fenetici
Alberi filogenetici • Alberi con radice o rooted NR= (2n-3)!/2 (n-2) (n-2)! • Alberi senza radice o unrooted NV= (2n-5)!/2 (n-3) (n-3)!
Alberi filogenetici • I dati per la costruzione degli alberi filogenetici: un solo gene puo essere sufficiente? Quasi mai Soluzione: – Analizzare piu’ di un gene –Effettuare una stima della significatività statistica degli alberi ottenuti
Alberi filogenetici • Perche’ ? • – Per ricostruire la storia evolutiva delle specie o delle popolazioni in esame • – Tempo di divergenza fra 2 specie = tempo impiegato nel processo di speciazione ovvero dell’isolamento riproduttivo
Alberi filogenetici I dati per la costruzione degli alberi filogenetici: un solo gene può essere sufficiente? Quasi mai Perche’? – Paralogia e ortologia dei geni – Evoluzione concertata (famiglie geniche) – Pressione mutazionale direzionata – Trasferimento orizzontale di un gene (dai batteri alle piante) – Polimorfismo – Fluttuazioni statistiche
metodologie Congruenza tipologie di dati EVOLUZIONE MOLECOLARE
EVOLUZIONE MOLECOLARE approcci molecolari Congruenza metodologica approcci molecolari/non molecolari
EVOLUZIONE MOLECOLARE nucleari molecolari mitocondriali Congruenza sul tipo di dati morfologici resti fossili
EVOLUZIONE MOLECOLARE Genomi completi Congruenza Regioni regolatorie/codificanti
EVOLUZIONE MOLECOLARE sequenziamento Limiti analisi
Sequenziamento: limiti • Studi incentrati su specie ampiamente studiate • Assenza (o scarsa presenza) di sequenze relative a specie rilevanti per gli studi filogenetici
Analisi: limiti • Omoplasia: “rumori di fondo” causati da sostituzioni multiple, processi di sostituzione condizionati (perdita della condizione di stazionarietà), processi selettivi, ecc. • Geni diversi possono seguire differenti storie evolutive nello stesso gruppo di specie • Mancanza di riconoscimento di geni paraloghi nel campione in esame
“A gene tree can be accepted or rejected only in its entirety as an estimate of the species tree, and it is not legitimate to dissect out pieces or a cladogram as support for a favored hypothesis while rejecting the phylogenetic implication of the rest of the tree.” Ruvolo and Koh, Mol. Phyl. Evol 5: 439-440 (1996)
+---------HUMAN +100.0 ! ! +----RHESUS ! +100.0 +-91.0 +----G MONKEY ! ! ! ! +----COW ! ! +100.0 ! +-40.0 +----SHEEP +100.0 ! ! ! +---------CAT ! ! ! ! +----MOUSE +-43.0 ! +100.0 ! ! +------69.0 +----RAT ! ! ! +-66.0 ! +---------HAMSTER ! ! ! ! ! +------------------------CHICKEN ! ! ! +-----------------------------XENOPUS ! +----------------------------------TROUT bootstrap