1 / 15

Sesi n 2 Programaci n Din mica Probabil stica

01 feb 2007. Programaci?n Din?mica Probabil?stica. P?gina 2. Contenido. Introducci?nUn juego de azarReferencias. 01 feb 2007. Programaci?n Din?mica Probabil?stica. P?gina 3. Introducci?n. La programaci?n din?mica probabil?stica (PDP) difiere de la programaci?n din?mica determin?stica (PDD) en que

alayna
Télécharger la présentation

Sesi n 2 Programaci n Din mica Probabil stica

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Sesión 2 – Programación Dinámica Probabilística Ing. en Sistemas Computacionales Modelos Probabilísticos Paul Ramírez De la Cruz 01 feb 2007

    2. 01 feb 2007 Programación Dinámica Probabilística Página 2 Contenido Introducción Un juego de azar Referencias

    3. 01 feb 2007 Programación Dinámica Probabilística Página 3 Introducción La programación dinámica probabilística (PDP) difiere de la programación dinámica determinística (PDD) en que Las condiciones y resultados en cada etapa no son fijos, sino que tienen un componente de aleatoriedad Se hace uso de conceptos de probabilidad en la obtención de su solución Presentaremos la PDP mediante algunos problemas prototipo

    4. 01 feb 2007 Programación Dinámica Probabilística Página 4 Un juego de azar Una variante del juego de ruleta requiere que se gire una rueda marcada con los números de 1 a n La probabilidad de que la rueda se detenga en un número i después de hacerla girar es pi Un jugador paga $x para tener derecho a girar la rueda hasta m veces El jugador obtiene como ganancia el doble del número que obtiene cuando gira por última vez Suponiendo que el juego se repite un número grande de veces, queremos diseñar una estrategia óptima para el jugador

    5. 01 feb 2007 Programación Dinámica Probabilística Página 5 Planteamiento general Para poner el problema en términos de PD, consideremos lo siguiente: La etapa i corresponde a la i-ésima vuelta de la rueda, i = 1, 2, …, m En cada etapa hay dos alternativas: se gira la rueda una vez más o se termina el juego El estado j del sistema en la etapa i es el número que se obtuvo la última vez que se giró la rueda, el cual está entre 1 y n

    6. 01 feb 2007 Programación Dinámica Probabilística Página 6 Planteamiento general Sea fi(j) = Ganancia máxima esperada dado que el juego está en la etapa i y que el resultado de la última vuelta fue j, entonces

    7. 01 feb 2007 Programación Dinámica Probabilística Página 7 Planteamiento general La ecuación recursiva es entonces

    8. 01 feb 2007 Programación Dinámica Probabilística Página 8 Planteamiento general Los cálculos comienzan con fm+1 y terminan con f1, de modo que hay m+1 etapas f1(0) representa el rendimiento esperado de las m vueltas, así que el rendimiento esperado neto, Rn, es

    9. 01 feb 2007 Programación Dinámica Probabilística Página 9 Ejemplo Supongamos que la ruleta está marcada con los números 1 a 5 y que las probabilidades de que se detenga en cada número son p1 = 0.30, p2 = 0.25, p3 = 0.20, p4 = 0.15, p5 = 0.10 El jugador paga $5 por un máximo de cuatro vueltas Determine la estrategia óptima para cada una de las cuatro vueltas y encuentre el rendimiento esperado neto asociado

    10. 01 feb 2007 Programación Dinámica Probabilística Página 10 Ejemplo

    11. 01 feb 2007 Programación Dinámica Probabilística Página 11 Ejemplo

    12. 01 feb 2007 Programación Dinámica Probabilística Página 12 Ejemplo

    13. 01 feb 2007 Programación Dinámica Probabilística Página 13 Ejemplo En la etapa 1 debe girar. Su ganancia esperada es de 7.31

    14. 01 feb 2007 Programación Dinámica Probabilística Página 14 Ejemplo

    15. 01 feb 2007 Programación Dinámica Probabilística Página 15 Referencias Taha, Hamdy A. Investigación de operaciones. Una introducción. Pearson Educación. 6ª edición. México, 1997

More Related