1 / 26

WAGNER

MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN. WAGNER. LINNEO. Optimización de Caracteres. 0. 0. 1. 1. 0. A. B. C. D. E. paralelismo 2 orígenes independientes 0 => 1 (DELTRAN). =. *. 1 => 0. =. origen y reversión (ACCTRAN). *. 0 => 1.

jill
Télécharger la présentation

WAGNER

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN WAGNER LINNEO

  2. Optimización de Caracteres 0 0 1 1 0 A B C D E paralelismo 2 orígenes independientes 0 => 1(DELTRAN) = * 1 => 0 = origen y reversión (ACCTRAN) * 0 => 1

  3. Búsqueda de arboles óptimos: Soluciones exactas • Soluciones exactas solo pueden ser usadas para un pequeño número de taxa. • Búsqueda exhaustiva examina todos los arboles posibles. • Típicamente usados para grupos problemas menores a 10 OTUs.

  4. Búsqueda exhaustiva B C Arbol de partida, 3 taxa 1 A Añada un cuarto taxón (D) en cada una de los tres combinaciones posibles -> tres árboles E B D C C D B E B D C 2a 2b 2c E A A A E E Añada un quinto taxon (E) en cada una de las cinco posibles posiciones en cada uno de los tres arboles -> 15 arboles……….

  5. Arbol 1 Arbol 2 Arbol 3 A C A B A B D D C D B C Hay tres posibles arboles no enraizados para cuatro taxa (A, B, C, D) Inferencia Filogenética: Búsqueda del “arbol verdadero o único” Computacionalmente intensivo ( “hard problem”)

  6. A B A C C D B C D A E B C A D E B F Número de árboles incrementa de manera exponencial con el numero de taxa (2N - 5)!! = # arboles no enraizados para N taxa

  7. Búsqueda de arboles óptimos: Soluciones exactas • Branch and bound ahorra tiempo descartando familias de arboles durante la construcción del arbol. Elimina aquellos combinaciones que involucran un mayor numero de pasos. • Típicamente usado en problemas que involucran menos de 18 taxa.

  8. Búsqueda de arboles óptimos: Soluciones exactas: Branch and Bound C2.1 B C C C3.1 D B C A1 C2.2 B C3.2 D C2.3 C3.3 A C2.4 C3.4 B2 B3 A A C2.5 C3.5 B E E B D B D C E E C D C B1 C1.1 C1.5 A A E A E E B D B D E D E C B C1.3 C C1.2 E C1.4 C A A A

  9. Búsqueda de arboles óptimos: Búsqueda heurística • Métodos heurísticos son usados para buscar en el espacio de arboles aquél más parsimonioso seleccionando un árbol inicial e intercambiando ramas buscando las mejores combinaciones. • Problema: “No garantiza encontrar el más parsimonioso” (“se hace lo que se puede").

  10. Búsqueda de arboles óptimos: Búsqueda heurística • Stepwise addition • Asis – El orden en la matriz de datos. • Closest –Comienza con el árbol más corto de • 3-taxa añadiendo otros taxa en un orden que produce el menor incremento en el largo del árbol. • Simple – El primer taxón en la matriz es tomado como referencia (taxa son añadidos considerando un orden decreciente de similaridad a la referencia). • Random - taxa son añadidos en una secuencia al azar, muchas secuencias distintas son usadas. Se recomienda usar Random cuando son muchas OTUs (10-100).

  11. Búsqueda heurística • Branch Swapping (intercambiando ramas): • Nearest neighbor interchange (NNI) • Subtree pruning and regrafting (SPR) (corte e injerto) • Tree bisection and reconnection (TBR)

  12. C D E A F B G D C C D E A E A F B F B G G Búsqueda heurística • Nearest neighbor interchange (NNI)

  13. C D E A F B G E C D F E G C A F B D B A G Búsqueda heurística • Subtree pruning and regrafting (SPR) (corte e injerto) PAUP permite 2 cortes NONA hasta 10 cortes

  14. Búsqueda heurística • Tree bisection and reconnection (TBR) PAUP permite 2 cortes NONA hasta 10 cortes

  15. Búsqueda heurística • Branch Swapping • Nearest neighbor interchange (NNI) • Subtree pruning and regrafting (SPR) • Tree bisection and reconnection (TBR) • Por la naturaleza de búsqueda heurística no podemos saber cual método es mejor..es decir cual método encontrará el árbol más parsimonioso ( o los arboles MP). • Consejo, TBR ( el más intensivo) usada junto con Random addition debería funcionar mejor.

  16. El Espacio de arboles puede ser “habitado” por minimos locales e islas de arboles SECUENCIA DE RÉPLICAS DE RANDOM ADDITION EQUIVOCA EQUIVOCA CORRECTA Branch Largo del árbol Swapping Branch Swapping Branch Swapping MÍNIMO LOCAL MÍNIMO GLOBAL MÍNIMO LOCAL

  17. BUSCANDO CON RESTRICCIONES TOPOLOGICAS (topological constraints) • “Topological constraints” son hipótesis filogenéticas definidas por el usuario. • Pueden ser usadas para encontrar arboles óptimos cuando: • 1. Se incluye un clado específico o un set de relaciones específicas. • 2. Se excluye un clado especifico o un set de relaciones específicas. (reverse constraint)

  18. Buscando usando “topological constraints” A B C D E F G CONSTRAINT TREE ((A,B,C,D)(E,F,G)) EFG ABCD A B C E D F G A B C D E F G EFG ABCD Compatible con reverse constraint tree Incompatible con constraint tree Compatible con constraint tree Incompatible con reverse constraint tree

  19. Buscando usando “topological constraints” “backbone constraints” • “Backbone constraints” especifica relaciones entre un subgrupo de taxa BACKBONE CONSTRAINT B E A D ((A,B)(D,E)) Relaciones de taxon C no son especificadas B E A D D E A B Incompatible con backbone constraint Posiciones posibles de taxon C Compatible con reverse constraint Compatible con backbone constraint Incompatible con reverse constraint

  20. Datos faltantes (“missing data”) • “Missing data” son ignorados en la construcción de un árbol pero pueden llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en ausencia de homoplasía. 1 ? ? 0 0 Muchos datos faltantes en la matriz pueden llevar a multiples arboles igualmente parsimoniosos. (Problema más serio cuando se analizan datos morfológicos que datos moleculares) A B C D E * Origen único 0 => 1 En cualquiera de las tres ramas * *

  21. Arboles Optimos • La mayoría de los métodos nos llevan a encontrar múltiples árboles igualmente parsimoniosos . • Podemos seleccionar entre ellos usando criterios adicionales…. • Es una práctica común utilizar árboles de consenso.

  22. Métodos de Consenso • Arbol de Consenso: resumen del acuerdo entre los arboles encontrados. • Los Métodos de Consenso puedens ser usados en: a) Múltiples arboles de un análisis. b) Múltiples análisis SUPERTREES (debate!!)

  23. Método de Consenso Estricto B E F G A C D A B C D E F G B D F G A C E

  24. Método de Consenso de Mayoría B E F G A C D A B C D E F G B E D G A C F A B C E D F G 66 100 66 66 66

  25. Método de Consenso reducido (Reduced consensus) B D F G A C E A G B C D E F A G D E C B F B D F A C E Consenso Estricto NO Resuelve STRICT REDUCED CONSENSUS TREE Programa RadCon Taxon G es excluído

  26. Método de Consenso • Use Consenso Estricto para identificar aquellas relaciones que se sostiene en forma inambigua para una interpretación por parsimonia de los datos. • Use Métodos del Consenso Reducido donde arboles de consenso tiene poca resolución. • Use Método de mayoría cuando haga bootstraps.

More Related