1 / 59

Lenguajes regulares

Lenguajes regulares. Teoría del Autómata. LENGUAJES REGULARES. Lenguajes sobre alfabetos Para un alfabeto S = { a 1 , a 2 ,…, a n } se pueden numerar las palabras de S * de la siguiente manera: e 0 a 1 1 a 2 2 . . a n n a 1 a 1 n +1 a 1 a 2 n +2.

MikeCarlo
Télécharger la présentation

Lenguajes regulares

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Lenguajes regulares Teoría del Autómata

  2. LENGUAJES REGULARES Lenguajes sobre alfabetos Para un alfabeto S = {a1,a2,…,an} se pueden numerar las palabras de S* de la siguiente manera: e 0a1 1a2 2. .anna1a1n+1a1a2n+2

  3. para S = {a, b}, podemos numerar sus cadenas con dígitos binarios 1 y 2 en vez de 0 y 1. Sea a el 1 y b el 2, entonces se obtiene e 0 a 1b 2aa 11 = 3ab 12 = 4abaa 1211 = 19 de esta manera se representa cada cadena como un entero único. Y cualquier número podemos representarlo como una secuencia de a’s y b’s, por ejemplo el 32 se convierte a 11112 y luego a aaaab.

  4. Teorema 1. Para todo alfabeto S, S* es infinito enumerable. Teorema 2. El conjunto de todos los lenguajes sobre S no es numerable. Demostración. Llamemos L al conjunto de todos los lenguajes sobre S, si L es numerable, por tanto podemos enumerarlo como A0, A1, A2, … S* puede numerarse como w0, w1, w2, … Sea B = {wi | wiÏAi}. B contiene las palabras que no pertenecen al lenguaje que tienen el mismo índice que las mismas. Pero como B es un lenguaje B = Ak para algún k. Si wkÎB, entonces wkÏAk = B. Y por lo tanto wk esta y no esta en Ak. Lo mismo sucede si suponemos wkÏB. Por lo tanto L no es numerable.

  5. El teorema 2 estipula que hay una cantidad innumerable de lenguajes sobre un alfabeto particular. Por tanto, no existe ningún método de especificación de lenguajes que sea capaz de definir todos los lenguajes sobre un alfabeto.

  6. Lenguajes regulares y expresiones regulares • Sea S un alfabeto. El conjunto de los lenguajes regulares sobre S se define recursivamente como sigue: •  es un lenguaje regular • {e} es un lenguaje regular • Para todo aÎS {a} es un lenguaje regular • Si A y B son lenguajes regulares, entonces AÈB, A · B , A* son lenguajes regulares • Ningún otro lenguaje sobre S es regular.

  7. ejemplo Por ejemplo. El lenguaje de todas las cadenas sobre {a, b, c} que no tienen ninguna subcadena ac es un lenguaje regular, y puede expresarse por A = {c}* ({a} È {b}{c}*)*

  8. Simplificación Se puede simplificar la notación mediante el uso de expresiones regulares. Las equivalencias son: aÈb denota {a} È {b} ab denota {ab} a* denota {a}* a+ denota {a}+ Ejemplo: A = {c}* ({a} È {b}{c}*)* = c* (aÈbc*)*

  9. Expresiones regulares • Los operadores tienen precedencia (*, · , È). Entonces, una expresión regular sobre el alfabeto S, es • Æ y e son expresiones regulares. • a es una expresión regular para todo aÎS. • Si r y s son expresiones regulares, entonces rÈs, r · s , r* también lo son. • Ninguna otra secuencia de símbolos es una expresión regular.

  10. Equivalencia de expresiones regulares Dos expresiones regulares pueden ser equivalentes, es decir, generan el mismo lenguaje. La expresión (a*b)* es equivalente a  (ab)*b. Ambos generan  o cadenas de aes y bes terminadas en b. La expresión ab   (ab)*b Es equivalente a ab  (a*b)*

  11. Reglas para expresiones regulares • rÈ s = sÈ r. • rÈ Æ = r = ÆÈ r. • rÈ r = r. • (rÈ s) È t = rÈ (sÈ t). • er = re = r. • Ær = rÆ = Æ. • (rs)t = r(st). • r(sÈ t) = rsÈ rt y (rÈ s)t = rtÈ st. • r* = r** = r*r* = (eÈ r)* = r*(rÈ e) = (rÈ e)r* = eÈ rr*. • (rÈ s)* = (r*È s*)* = (r*s*)* = (r*s)*r* = r*(sr*)* . • r(sr)* = (rs)*r. • (r*s)* = eÈ (rÈ s)*s. • (rs*)* = eÈ r(rÈ s)*. • s(rÈ e)*(rÈ e) È s = sr*. • rr* = r*r.

  12. Autómata finito determinista Podemos usar un diagrama de transición para ayudar a determinar si una cadena pertenece o no a un lenguaje. Los nodos del diagrama se denominan estados y se utilizan para señalar hasta donde se ha analizado la cadena. Las aristas se denominan transiciones y se etiquetan con los símbolos del alfabeto. Existe un estado, llamado estado inicial, que es de donde parte el análisis de toda cadena. Algunos estados se marcan como estados de aceptación para determinar si una cadena es legal o no. La cadena es legal si se termina su análisis en un estado de aceptación. Los estados de aceptación se representan encerrados en un círculo.

  13. El siguiente diagrama acepta cadenas de la forma akb. a a,b b a,b El siguiente diagrama acepta el lenguaje A = {(ab)i | i³ 1}. a,b b b a b a a

  14. El siguiente diagrama acepta cadenas de la forma (ab)*. El mismo autómata con estados etiquetados q0, q1, q2 b q0 q1 a b a q2 a,b

  15. Autómata Finito Determinista Definimos un autómata finito deterministaM como una colección de cinco elementos: 1. Un alfabeto de entrada S. 2. Una colección finita de estados Q. 3. Un estado inicial s. 4. Una colección F de estados de aceptación o finales. 5. Una función d: QS®Q que determina el único estado siguiente para el par (qi, s) correspondiente al estado actual y la entrada. Se usará la notación M = (S, Q, s, F, d) para indicar un AFD (autómata finito determinista) M.

  16. Ejemplo Por ejemplo, el AFD del diagrama anterior se representa mediante M = (S, Q, s, F, d) donde b Q = {q0, q1, q2} S = {a, b} s = q0 F = {q0} q0 q1 a b a q2 a,b y d se define por la tabla

  17. Construcción de diagramas de transición Para construir un diagrama de transiciones a partir de una descripción de un autómata, se procede como sigue. Se dibujan nodos para cada estado del autómata, luego se trazan flechas desde cada estado qi hacia el qj etiquetándolas con el símbolo de entrada correspondiente, se marca el estado inicial y los estados de aceptación.

  18. Ejercicio Obtener la expresión regular que representa el lenguaje formado por todas las cadenas sobre {a, b} que tienen un número par de bes. Construir el diagrama de transición para este lenguaje.

  19. Ejercicio Construir el diagrama de transición para el lenguaje dado por c*(a  bc*)*. Convertir el diagrama en una tabla de transición de estados.

  20. AFD y lenguajes Definimos el lenguaje aceptado por un AFD M como L(M) = {wÎS* | w es aceptada por M} Por tanto, L(M) es el conjunto de las cadenas que hacen que M pase del estado inicial a un estado de aceptación. Por ejemplo, el siguiente AFD M = (S, Q, s, F, d) donde Q = {q0, q1, q2, q3} S = {a, b} s = q0 F = {q0, q1, q2} y d definida por la tabla

  21. Tiene el siguiente diagrama de transición a a b q0 q1 b a a, b q3 q2 b acepta el lenguaje L(M) = {wÎ {a, b}* | w no contiene tres bes consecutivas}

  22. Se puede aplicar recursivamente una serie de caracteres de una cadena dada al AFD. Por ejemplo, la aplicación de la cadena bbab en el caso anterior dará d(d(d(d(q0,b),b),a),b) = q1. Esto puede abreviarse como d(q0,bbab). Diremos que dos AFD M1 y M2 son equivalentes si L(M1) = L(M2).

  23. Autómata finito no determinista Un autómata finito es no determinista si se permite que desde un estado se realicen cero, una o más transiciones para el mismo símbolo de entrada.

  24. El lenguaje a*bÈab* tiene el siguiente AFD asociado. b q1 q0 a,b a a a,b a b q2 q3 q4 q5 a,b b a q6 b

  25. Consideremos ahora el siguiente diagrama de transición, este reconoce las mismas cadena, sin embargo es mucho más simple. Note que el diagrama de transiciones no representa una función de Q´S en Q. a a b q1 q2 q0 b a q3 q4 b

  26. Definición Definimos un autómata finito no deterministaM como una colección de cinco elementos: • Un alfabeto de entrada S. • Una colección finita de estados Q. • Un estado inicial s. • Una colección F de estados de aceptación o finales. • Una relación D sobre (QS) Q y se llama relación de transición.

  27. Por ejemplo, el AFN anterior se describe por medio de a a b Q = {q0, q1, q2, q3, q4} F = {q2, q3, q4} s = q0 S = {a, b} y D dada por la tabla q1 q2 q0 b a q3 q4 b

  28. Por ejemplo, el AFN siguiente reconoce (ababa)* b a Q = {q0, q1, q2} F = {q0} s = q0 S = {a, b} y D dada por la tabla q1 q0 b a q2

  29. Lenguaje aceptado por un AFN Si M es un AFN, el lenguaje aceptado por M se define como L(M) = {wÎS* | w es aceptada por M} Para poder decidir si una cadena no es aceptada por un AFN deben recorrerse todas las rutas posibles en el AFN para esa cadena, y determinar que ninguna de estas lo lleva al algún estado de aceptación.

  30. Ejemplo Si XÍQ, vamos a interpretar D(X, s) como el conjunto {p | qÎX y pÎD(q, s)}. Para el autómata de la figura que reconoce el lenguaje (a*b*)* (aaÈbb) (a*b*)* . OBTENER LA TABLA DE TRANSICIÓN

  31. Para este ejemplo D({q0, q2, q3}, b) = {q0, q1} È {q2} ÈÆ = {q0, q1, q2}. Para una secuencia de símbolos, por ejemplo abaab, se puede escribir D(q0, abaab) = D(D(D(D(D(q0, a)b)a)a)b) = {q0, q1, q4}.

  32. Equivalencia de AFD y AFN La definición de equivalencia se extiende a los AFN, es decir, dos autómatas (AFD o AFN) M1 y M2 son equivalentes si L(M1) = L(M2). a,b a,b a a b a,b

  33. Consideremos el AFN D(q0, a) = {q1, q2} D(q0, b) = Æ D({q1, q2}, a) = Æ D({q1, q2}, b) = {q3} D(Æ, a) = D(Æ, b) = Æ D(q3, a) = {q2} D(q3, b) = Æ D(q2, a) = Æ D(q2, b) = {q3}

  34. AFD equivalente b {q1,q2} {q0} {q3} {q2} a b a a b a b f a,b

  35. e-transiciones Una e-transición es una transición entre dos estados que no consume ningún símbolo. q0 q1 a q1 q0 e a,e b a q2 Acepta: a*

  36. e-cerradura Si un AFN tiene e-transiciones, la relación de transición D asocia pares de Q (SÈ {e})  Q con subconjuntos de Q. Para todo estado qÎQ definimos la e-cerradura de q como e-c(q) = {p | p es accesible desde q sin consumir nada en la entrada} Ampliaremos esta definición para todo estado del conjunto de estados de la siguiente manera

  37. Estados que siguen a q Para qÎQ y sÎS se define d(q, s) = {p | hay una transición de p a q etiquetada con s} Ampliaremos esta definición para todo estado del conjunto de estados de la siguiente manera A partir de un AFN M = (S, Q, s, F, D) con e-transiciones, se puede construir una AFN sin e-transiciones que acepte el mismo lenguaje. Se define M = (S, Q, s, F', D') como F' = FÈ {q | e-c(q) ÇF¹Æ} y D(q, s) = e-c(d(e-c(q), s)).

  38. q2 q0 q1 e b a e a b e q3 q4 q5 Ejemplo: eliminación de e-transiciones

  39. Ejemplo: eliminación de e-transiciones b q1 q2 a b a a a a b a,b q3 q4 q5 a,b

  40. Autómatas finitos y expresiones regulares Para un alfabeto S se pueden construir AFN (o AFD) que acepten palabras unitarias y el lenguaje vacío como se muestra en la figura q1 q1 q2 a Sean M1 = (S1, Q1, s1, F1, D1) y M2 = (S2, Q2, s2, F2, D2) dos AFN. Podemos unir M1 y M2 para que acepte L(M1) ÈL(M2), añadiendo un nuevo estado inicial s y dos e-transiciones una de s a s1, y otra de s a s2. La construcción formal del nuevo AFN M = (S, Q, s, F, D) esta dada por S = S1ÈS2, F = F1ÈF2 y Q = Q1ÈQ2È {s}.

  41. Autómatas finitos y expresiones regulares Se pueden considerar las transiciones D1 y D2 como ternas ordenadas de Q1SQ1 y Q2SQ2, donde (q, s, p) significa que existe una transición de q a p mediante el carácter s. De aquí D = D1ÈD2È {(s, e, s1),(s, e, s2)} Para los autómatas anteriores, se puede formar un AFN que acepte L(M1)L(M2). Para esto, se agregan e-transiciones entre cada estado de aceptación de M1 y el estado inicial de M2. El autómata que se obtiene es • Q = Q1ÈQ2 • s = s1 • F = F2 • = D1ÈD2È {F1 {e}  {s2}} • s2ÎD(q, e) para todo qÎF1

  42. Autómatas finitos y expresiones regulares Es posible obtener L(M2)* de la siguiente forma. Primero se añade un estado inicial de aceptación s’. Se agrega una e-transición de este estado a s. Se agrega además, una e-transición entre todos los estados de aceptación y el estado inicial s’. El autómata resultante será M' = (Q', S, s', F', D'), donde Q = Q1È {s’} s = s1 F = {s’} D'= D1È {(s’, e, s)} È (F1´ {e} ´ {s’})

  43. Teorema 5 El conjunto de lenguajes aceptados por un autómata finito sobre el alfabeto S contiene Æ y los lenguajes unitarios {a} para todo aÎS. Este conjunto es cerrado con respecto a la unión, concatenación y la cerradura de estrella.

  44. Consideremos un autómata finito M = (S, Q, s, F, D) y supongamos que s = q0 es el estado inicial. Para todo estado qi sea Ai = {wÎS* | D(qi, w) ÇF¹Æ} Es decir, Ai es el conjunto de las cadenas sobre S que hacen que M pase desde qi hasta un estado de aceptación.Obsérvese que A0 = L(M). q2 q0 q1 para el autómata de la figura. se tiene A5 = Æ, A2 = e A4 = e, A1 = b A3 = a, A0 = ab È ba b a a a,b b b a,b q5 a q3 q4

  45. Supongamos que qjÎD(qi, s). Entonces Ai contiene a sAj. De hecho, se tiene que Ai = È {sAj | qjÎD(qi, s)} Por ejemplo, el anterior autómata A0 = aA1È bA2, A3 = aA4È bA5 A1 = bA2È aA5, A4 = eÈaA5È bA5 A2 = eÈaA5È bA5, A5 = Æ Sustituyendo se obtiene que L(M) = ab È ba.

  46. Lema de Arden Una ecuación de la forma X = AXÈB, donde eÏA, tiene una solución única X = A*B. Demostración. A*B = (AÈe)B = A+BÈB = A(A*B) ÈB, entonces A*B es solución. Sea X = A*BÈC solución donde CÇA*B=Æ. Sustituyendo A*BÈC = A(A*BÈC) ÈB = A+BÈACÈB = A+BÈBÈAC = (A+Èe)BÈAC = A*BÈAC Realizando la intersección con C en ambos lados nos da C = ACÇC. Por tanto CÍAC. Pero eÏA, por tanto la cadena más corta de AC debe ser más larga que la cadena más corta de C. Esto solo se cumple si C = Æ. Por tanto A*B es la única solución.

  47. Lema 2. Sea M un autómata finito. Entonces existe una expresión regular r para la cual L(r) = L(M). Teorema 6 (Teorema de Kleene). Un lenguaje es regular si y sólo si es aceptado por un autómata finito.

  48. Ejemplo b q3 q4 q0 q1 q2 a a a b a b b A4 = b* A3 = aA2 Èb+ È e = a*b* A2 = a+b*Èbb* A1 = a(a+b*Èb+)Èb+ = aa+b*Èab+Èb+ A0 = a2a+b*Èa2b+Èab+ A0 = aA1 A1 = aA2 ÈbA4 A2 = aA3ÈbA4 A3 = e ÈaA3ÈbA4

  49. Propiedades de los lenguajes regulares Sea un AFD M = (S, Q, s, F, d), donde Q contiene n estados. Si L(M) es infinito, podemos encontrar w = a1, a2, …, an+1, que pertenezca a L(M). Si q1 = d(s, a1) q2 = d(q1, a2) y así sucesivamente, obtendríamos los n+1 estados, q1, q2, …, qn+1 . Como Q tiene n estados, los qi no serán todos distintos. Para algunos índices j y k, con 1 £j<k£n+1, se tendrá que qj = qk. Por lo tanto, habrá un ciclo para llegar al estado de aceptación. Como se muestra en la figura qj+1 q0 q1 qj = qk qk+1 qn+1 El lazo tiene longitud de al menos 1. Las cadenas w = a1, a2, …, aj, (aj+1,…, ak)mak+1,…, an+1 estarán en L(M) para m³ 0.

  50. Lema del bombeo Sea L un lenguaje regular infinito. Entonces hay una constante n de forma que, si w es una cadena de L cuya longitud es mayor o igual a n, se tiene que w = uvx, siendo uvixÎL para todo i³ 0, con | v | ³ 1 y | ux | £n. Este lema es utilizado para probar si un lenguaje es o no regular. Ejemplo: sea Toda cadena de L debe tener una longitud que sea un cuadrado perfecto. Supongamos que cumple el lema del bombeo, entonces Se cumple que n2 = |uvx| < |uv2x| <= n2 + n < (n+1)2 Es decir, |uv2x| se encuentra entre dos cuadrados perfectos consecutivos y por tanto no es un cuadrado perfecto. En consecuencia no pertenece al lenguaje L.

More Related