Local Sequence Alignment Variants: Finding Optimal Segment Pairs
Discover the significance and applications of local sequence alignment, particularly in database searches using BLAST. Learn about high scoring segment pairs (HSPs) and the concept of PSI-BLAST for iterative improvements.
Local Sequence Alignment Variants: Finding Optimal Segment Pairs
E N D
Presentation Transcript
Paarweises Sequenz-Alignment Variante: Lokales Alignment. Sinnvoll, wenn Sequenzen nur lokale Homologie haben. Seq1CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGACCATGA
Paarweises Sequenz-Alignment Variante: Lokales Alignment. Sinnvoll, wenn Sequenzen nur lokale Homologie haben. Seq1 CTAATTAATG-CACAGTTAGGAATTAGAAATGA Seq2GGGAC ATGGCA--GTGACTGACCATGA Aligne Paar von Segmenten der Sequenzen; ignoriere den Rest.
Paarweises Sequenz-Alignment Ziel beim lokalen Alignment: Finde Paar von Segmenten, so dass Alignment der Segmente maximalen Score hat. Wichtigste Anwendung: Datenbank suche: Finde Sequenzen in der Datenbank, die zu gegebener Sequenz (Anfrage-Sequenz, query sequence) ähnlich sind.
Paarweises Sequenz-Alignment Exaktes lokales Alignment zu zeitaufwendig. Schnelles Datenbank-Suchprogramm: BLAST - Basic Local Alignment Search Tool Stephen Altschul et al, JMB, 1990 21.778 Zitate in der Literatur ! Wichtigstes Werkzeug in der Bioinformatik!
Paarweises Sequenz-Alignment NCBI – National Center of Biotechnological Information
Paarweises Sequenz-Alignment BLAST - Basic Local Alignment Search Tool Idee: Finde lokale Alignments ohne Gaps (HSPs – high scoring segment pairs). • Suche kurze Wort-Paare (feste Länge) • Dehne Wort-Paare aus, bis Score abfällt • Berechne Wahrscheinlichkeit, HSP per Zufall zu finden: e-value, p-value
Paarweises Sequenz-Alignment Suche nach Wort-Paaren: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA
Paarweises Sequenz-Alignment Suche nach Wort-Paaren: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA
Paarweises Sequenz-Alignment Ausdehnung gefundener Wort-Paare: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA
Paarweises Sequenz-Alignment Ausdehnung gefundener Wort-Paare: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA
Paarweises Sequenz-Alignment Ausdehnung gefundener Wort-Paare: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA
Paarweises Sequenz-Alignment Ausdehnung gefundener Wort-Paare: Seq1 CTAATTAATGCACAGTTAGGAATTAGAAATGA Seq2 GGGACATGGCAGTGACTGAATACACACCATGA TTAATGCACA TGAATACACA High-scoring segment pair (HSP)
Paarweises Sequenz-Alignment Verbesserung: PSI-BLAST – Position Specific Iterative BLAST: (18.708 Zitate in der Literatur!)
Paarweises Sequenz-Alignment PSI-BLAST – Position Specific Iterative BLAST: • “normale” DB-Suche mit BLAST • Bilde Positions-Gewichts-Matrix (PWM) aus “Treffern” • Suche mit PWM nach neuen “Treffern” • Bilde verbesserte PWM … u.s.w.