1 / 106

ALINEAMIENTOS SIMPLE Y MÚLTIPLE

ALINEAMIENTOS SIMPLE Y MÚLTIPLE. Juan José Nieto Lunes, 11 de Julio de 2005. ALINEAMIENTO SIMPLE. Consiste en establecer un segmento entre dos secuencias biológicas donde el número de coincidencias sea máximo. INDELS. Inserción: IN SERT Se asigna una base demasiado pronto

maren
Télécharger la présentation

ALINEAMIENTOS SIMPLE Y MÚLTIPLE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005

  2. ALINEAMIENTO SIMPLE Consiste en establecer un segmento entre dos secuencias biológicas donde el número de coincidencias sea máximo

  3. INDELS • Inserción: INSERT • Se asigna una base demasiado pronto • Eliminación: DELETED • Queda sin asignar una base • Se introduce una nueva letra en el alfabeto DNA: El “hueco” (gap) -

  4. Comparación • Secuencia 1: M A R I A • Secuencia 2: M I R I A M • Secuencia 3: M A R I O • Secuencia 4: A R I A D N A

  5. Comparación • Secuencia 1: M A R I A • Secuencia 2: M I R I A M 4 coincidencias

  6. Comparación • Secuencia 1: MAR I A • Secuencia 3: MAR I O 3 coincidencias

  7. Comparación • Secuencia 1: M A R I A • Secuencia 4: A R I A D N A 0 Coincidencias

  8. Comparación • Secuencia 1: M A R I A • Secuencia 4: - A R I A D N A 4 Coincidencias

  9. Comparación • Secuencia 5: J O S E • Secuencia 6: P E P E

  10. Comparación • Secuencia 5: J O S E • Secuencia 6: P E P E 1 coincidencia

  11. Comparación DNA - Leucina • Secuencia : T T A • Secuencia : C T G 1 coincidencia

  12. SIMILITUD  Cuantitativo HOMOLOGÍA  Cualitativo ALINEAMIENTO

  13. Clasificación Alineamientos

  14. Por número de secuencias • Simple • Múltiple

  15. Por nivel de análisis • Global • Local

  16. Programas • BLAST (Basic Local Alignment Search Tool) http://www.ncbi.nlm.nih.gov • FASTA http://www.ebi.ac.uk

  17. BLAST • blastp • blastn • blastx • tblastn • tblastx

  18. Ejemplo • g c t g a a c g • c t a t a a t c

  19. 2 coincidencias

  20. Otro alineamiento (Muy malo)

  21. Otro alineamiento(1 coincidencia)

  22. Otro alineamiento (malo)

  23. Otro alineamiento (bueno)5 coincidencias

  24. ¿Cuántos alineamientos posibles hay? • Problema combinatorio • No se permite alinear dos huecos • Hay un número finito de alineamientos

  25. Número de alineamientos • Primera secuencia: 8 letras • Segunda secuencia: 8 letras • Hay 265 729 alineamientos posibles

  26. ¿Cómo elegir el mejor alineamiento? • Hay que dar un valor a cada alineamiento • Elegiremos el (los) que tengan mayor puntuación. • Por ej.: Coincidencia  +1 puntos No coincidencia  0 puntos Nos da el número de coincidencias

  27. Otra puntuación • Por ej.: Coincidencia  +2 puntos No coincidencia  -1 punto

  28. 2 coincidenciasPuntuación: -2 puntos

  29. Otro alineamiento-10 puntos

  30. Otro alineamiento- 11 puntos

  31. Otro alineamiento5 puntos

  32. Algoritmo (teórico) • Paso 1 : Considerar todos los alineamientos posibles • Paso 2 :Determinar un valor para ese alineamiento • Paso 3 :Guardar el valor máximo

  33. Problema • El número de operaciones crece e una forma “exagerada”

  34. Número de alineamientos de dos secuencias de longitudn ,m • n = m = 8  265 729 alineamientos • n = m = 10  8 097 453 alineamientos

  35. Fórmula del número de alineamientos posibles para dos secuencias de longitud n y m:f(n,m)

  36. Fórmula de recurrencia f(n+1 , m+1) = f(n,m+1) + f(n+1,m) + f(n,m)

  37. Demostración • Se basa en que el final de un alineamiento es: (- , letra) , (letra , - ) ó (letra , letra) • A. Torres, A. Cabada, J.J. Nieto “An exact formula for the number of alignments between two DNA sequences” DNA SEQUENCE (2003)

  38. Consecuencias • f(n+1,n+1) > 3n • f (107 , 107 ) > 1080 • Una secuencia “pequeña” tiene 200-500 nucleótidos • Una proteína sobre 200-400 aminoácidos

  39. Alineamiento global:Algoritmo de Neddleman&Wunsch (1970)

  40. Ejemplo

  41. ¿Cómo se puede determinar el alineamiento óptimo? • Aunque no tengamos ni idea, sabemos una cosa: El alineamiento tiene que tener una de las tres terminaciones siguientes • g-g • -cc

  42. Terminación • cg • c-

  43. Simplificación del problema original • Secuencia 1: g c t g a a Longitud 6 • Secuencia 2: c t a t a a t Longitud 7

  44. Posibles terminaciones • a-a • -tt

  45. Terminación • a- • at

More Related