630 likes | 1.05k Vues
Viaggio nel tumultuoso mondo dei genomi. Alice Fulgido & Giuseppe Cazzato. Indice . Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint. Concetti base. GENOMA :
E N D
Viaggio nel tumultuoso mondo dei genomi Alice Fulgido & Giuseppe Cazzato
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Concetti base • GENOMA: Intero patrimonio genetico di una specie. Esso però non comprende solo l’insieme di tutti i geni necessari alla vita di un organismo, ma anche tutto il DNA “non genico” • CROMOSOMI: molecole di DNA organizzate in unità strutturali e funzionali in cui è suddiviso il genoma • GENE: unità ereditaria fondamentale degli organismi viventi contiene le informazioni genetiche che codificano per funzioni specifiche all’interno della cellula
Confronto tra sequenze genomiche • METODI: - Mapping, determinare la posizione dei geni su un cromosoma e la distanza che li separa- Sequencing , identificare l’ordine delle unità chimiche base del Dna (sequenze nucleotidiche) • BENEFICI: - diagnosi e cura di malattie oggi incurabili - migliori selezioni di prodotti di agricoltura e allevamento - miglioramento nelle tecniche di investigazione criminale
Riproduzione del DNA • Processo molecolare di REPLICAZIONE DEL DNA comprende: - formazione di legami idrogeno fra le basi complementari (A, T, C, G) - formazione di un legame covalente fosfodiesterico • Processo di RIPARTIZIONE DEI CROMOSOMI nelle cellule figlie
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Cos’è una mutazione? Il risultato del cambiamento di una o più basi del DNA Cause : - Cambiamenti accidentali(durante i processi di replicazione e ricombinazione) - Mutageni (fisici o chimici)
Mutazioni • GENICHE: interessano un singolo gene(consistono in sottrazione, aggiunta o sostituzione di uno o più nucleotidi) • CROMOSOMICHE: estese della struttura dei cromosomi, dipendono da una rottura e da una ristrutturazione anomala degli stessi cromosomi. • GENOMICHE: consistono in alterazioni non della struttura ma del numero dei cromosomi.
Conseguenze delle mutazioni • perdita di funzione del gene • Misappaiamenti (appaiamenti errati)se non rimossi rapidamente si propagheranno nelle duplicazioni successive Ma anche • “Differenze migliorative” (che permettono l’evoluzione della specie)
Riarrangiamenti • Modifiche della disposizione dei geni sui cromosomi. • Svolgono un ruolo molto importante nell’evoluzione della specie • Hanno origine da uno o più DSB • Avvengono quando i meccanismi di riparazione falliscono o quando si presentano errori Tipi: delezione, inserzione, inversione, traslocazione, etc…
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Double Strand Break (DSB) • Più frequenti rotture del DNA • Interessa entrambi i filamenti complementari di DNA • Conseguenza dell'esposizione del DNA ad agenti genotossici o di normali processi cellulari • Se non riparata prontamente dalla cellula può causare gravi problemi di instabilità genomica • Strategie: HR (SSA), NHEJ, NAHR
HomologousRecombination (HR) • Ricombinazione omologa • Cromosoma omologo al danneggiato è usato come stampo per la riparazione (error free) • Conservativo • Single Strand Annealing (SSA): variante di HR. - Si attiva se il DSB si realizza tra sequenze ripetute - Eliminazione di estremità non omologhe e allineamento di sequenze omologhe
Non-Homologous End Joining (NHEJ) • Ricongiungimento delle estremità non omologhe • Non considera l’informazione iniziale del DNA • Può portare a delezioni o mutazioni
Non-Allelic Homologous Recombination (NAHR) • Responsabile di parecchi disordini genomici umani • Comporta il cosiddetto riarrangiamento non equilibrato: acquisizione o perdita di DNA
Fasi della ricombinazione • Rottura e successiva riunione di due cromatidi (M e F) • Produzione di due cromatidi riarrangiati (C1 e C2)
Ricombinazione: CROSSING-OVER • Meccanismo di ricombinazione del materiale geneticoproveniente dai duegenitori • Risutato: il figlio eredita una mescolanza casuale degli alleli dei due genitori per i diversi caratteri.
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Cariotipo Costituzione del patrimonio cromosomico di una specie dal punto di vista morfologico Analisi del cariotipo: rappresentazione ordinata del corredo cromosomico di un individuo
Studio di cariotipi • Confronto fra cariotipi • Bandeggio cromosomico (1970) • FISH (1990) • CGH-array • Mappa genetica
Bandeggio cromosomico • Tecnica di colorazione con sostanze fluorescenti Vantaggi: • ricostruzione della mappa di tutti i cromosomi (morfologia) e messa in evidenza di eventuali mutazioni • confronto fra cariotipi di differenti specie basandosi su tali modelli • rilevazione di molteplici patologie pre e post-natali • Limitazione: bassa sensibilità diagnostica
Fluorescent In Situ Hybridization (FISH) • Ibridazione: processo molecolare che unisce due singoli filamenti complementari di molecole di DNA per formare molecole con doppio filamento di DNA • Utilizza sonde a fluorescenza che si legano in modo estremamente selettivo ad alcune specifiche regioni del cromosoma Possibili usi: • mappare la sequenze di uno specifico cromosoma • colorare i cromosomi per raffrontare due specie o varietà utilizzando il DNA di interi cromosomi • scoprire se un paziente è stato infettato da un agente patogeno (studi clinici)
Comparative Genomic Hybridization (CGH) Strumento diagnostico per la rilevazione di sbilanciamenti cromosomici • Principio della tecnica: si basa su una competizione per il legame di 2 DNA genomici (marcati con fluorocromi diversi) a cromosomi in metafase (non marcati e provenienti da un soggetto sano). • Risultato: rapporto delle 2 fluorescenze. In caso di numero di copie normali avrò 2 copie di DNA da testare e 2 copie del DNA di controllo genomico, per cui il rapporto tra i 2 fluorocromi 2/2 è pari a 1. • Limite: la variabilità della morfologia dei cromosomi che ne limitano la risoluzione a circa 3-7 Mb per le delezioni e 2 Mb per le amplificazioni
Array-CGH • Il principio: coibridazione del DNA in esame e del DNA di controllo, marcati con fluorocromi diversi, su un microarray di cloni genomici. • Sostituzione cromosomi delle metafasi di riferimento con una matrice su cui sono spottati cloni YAC, BAC o PAC corrispondenti a loci specifici del cromosoma. • Vantaggi: -immediata correlazione tra l’eventuale alterazione e una precisa posizione nel genoma -standardizzazione della tecnica, ripetibilità e affidabilità del risultato
Mappa Genetica • Basata sui dati di ricombinazione genetica • Processo che determina la posizione relativa dei geni sui cromosomi a partire da un loco preso come riferimento • Realizzata per mezzo di due tecniche principali: - Analisi di linkage(analisi degli alleli di diversi marcatori all’interno di una famiglia di individui) - Mappa di radiazione ibrida (l’irradiazione di cellule umane con dosi elevate di raggi X e la successiva fusione delle cellule irradiate con cellule di Hamster, consente di ottenere linee cellulari nelle quali frammenti di cromosomi umani risultano integrati nel genoma di Hamster)
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Allineamento genomico • Scopo: mettere a confronto sequenze di genomi della stessa specie o di specie differenti, con l’intento di trovare la percentuale di DNA comune(=conservato), rispetto alla percentuale di DNA che ha subito modificazioni(riarrangiamenti) nel corso dell’evoluzione o a causa di errori all’interno dell’organismo. • Tipi di algoritmi di allineamento: locali e globali
Esempio di allineamento genomico Date due sequenze nucleotidiche,determinare se sono sufficientemente simili da farci ritenere che siano derivate da un progenitore comune attraverso processi di mutazione.
Quale è l’allineamento (statisticamente) migliore ? Per confrontare quantitativamente gli allineamenti è necessario definire uno score:
Algoritmi globali e locali • Globali: - gestiscono l’allineamento di sequenze intere -svantaggio: i segmenti delle sequenze devono essere ordinati e non presentare cambiamenti. • Locali: -si allineano sottosequenze delle sequenze di partenza (ad esempio l’algoritmo di Smith-Waterman) -privilegiati rispetto a quelli globali
Metodo seed-extend • Strategia di allineamento • Si basa su: - trovare la parte di segmenti conservati(definiti “ancore”) - allineare attorno alle ancore i segmenti riarrangiati
Step • ANCHORING: Individuare le potenziali regioni di omologhi (ancore) • Filtrarle (ossia eliminare i falsi positivi e fare una scelta fra le differenti copie di elementi duplicati) • Allineare le regioni omologhe identificate (tenendo conto di eventuali gap)
Indice Concetti base Mutazioni e riarrangiamenti Processi di riparazione del DNA Metodi di studio dei cariotipi Allineamenti genomici Analisi delle regioni di breakpoint
Individuazione dei breakpoint(tramite metodi di allineamento genomico) Lo scopo non è presentare un metodo specifico (ve ne sono molti, con scopi diversi) ma dare le idee base. Nella discussione utilizzeremo le idee presentate in • GRIMM-SYNTENY • CHAINNET • Couronne & Patcher (CP) • MAUVE
BLAST(BasicLocalAlignmentSearchTool) Strumenti per la ricerca rapida di sequenze di similarità in banche dati di DNA e proteine. • Perchè? I programmi dinamici (Smith-Waterman) sono stati ideati per allineare due sequenze in modo esatto ma sono troppo lenti per fare ricerche in banche dati. • Come? Sfruttando l’indicizzazione delle sequenze nel DB
BLAST - funzionamento • Crea un elenco di parole di lunghezza W a partire dalla sequenza query.(W=3 per le proteine, W=11 per il DNA)
BLAST - funzionamento • Per ogni parola crea un elenco di parole affini(W-mers) con score maggiore di una soglia T
BLAST - funzionamento • Analizza tutte le sequenze del DB cercando un match con un W-mers Cerca di estendere ciascun hit in entrambe le direzioni (senza gap) e mantiene gli HSP che superano una certa soglia S
Anchoring [1/2] Individua la similarità locale tra due genomi • GRIMM-SYNTENY esegue PatternHunter (gapped) e prende allineamenti unici e non sovrapposti • CHAINNET esegue BLASTZ (gapped)e prende solo gli allineamenti non interrotti • CP BLAT match quasi esatto (+ veloce) • MAUVE Solo allineamenti con match esatto e unico Num. di basi trovate
Anchoring (variante) Problema: Due specie “distanti” DNA intergenico è mal conservato Sol.1: allineamento più lasco più falsi positivi Proposta: utilizzare il DNA codificante (meglio conservato)ed effettuare l’allineamento a livello di proteine(le ancore saranno i geni) Secondo gli studi di Bourque (confronto mammiferi/polli)i risultati con i due tipi di ancore sono consistenti.
Filtering Idea: basarsi sul contesto. • Raggruppare le ancore • GRIMM-SYNTENY: • Manhattan distance < soglia • Gruppi con almeno C coppie di basi • CP • Raggruppa senza tenere conto dell’orientamento delle ancore • Allineamento globale dei gruppi
Filtering • Collegare le ancore (considerando ordine e orientazione delle ancore) • Chainnet Usa un albero a k-dimensioniUn’ancora potrebbe appartenere a più cateneNon butta via niente ma assegna un punteggio • Mauve Ripete i passi precedenti con parametri sempre più stringenti Conserva le catene con più di X elementi