1 / 33

שיעור 10 – דקדוק חסר הקשר לאנגלית

שיעור 10 – דקדוק חסר הקשר לאנגלית. יעל נצר מדעי המחשב. נושא חדש: דקדוק חסר הקשר לאנגלית. Constituency – צירוף מלים לרכיבים בעלי תפקיד אחיד. צירוף יכול להיות מילה יחידה me, Michael או the house . דקדוק חסר הקשר הוא כלי המאפשר ייצוג צירופים.

aaralyn
Télécharger la présentation

שיעור 10 – דקדוק חסר הקשר לאנגלית

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. שיעור 10 – דקדוק חסר הקשר לאנגלית יעל נצר מדעי המחשב

  2. נושא חדש: דקדוק חסר הקשר לאנגלית • Constituency – צירוף מלים לרכיבים בעלי תפקיד אחיד. צירוף יכול להיות מילה יחידה me, Michael או the house. דקדוק חסר הקשר הוא כלי המאפשר ייצוג צירופים. • Grammatical relations – מתייחס לתפקידים תחביריים כגון נושא או מושא. • Subcategorization – ויחסי תלות מתייחס לקשר בין מילים ובין צירופים. • למשל: אחרי פועל want יכול לבוא infinitive כלומר: I want to fly to Detroit.

  3. Constituency • צירופים שמניים: • Three parties from Brooklyn • A high class spot such as Mindy’s • The Broadway coppers • They • Harry the horse. • The reason he comes into the Hot Box.

  4. איך יודעים שקבוצת מילים היא צירוף? • יכולים להופיע בתפקידים תחביריים דומים: • למשל – כנושא של משפט subject • Three parties from Brooklyn arrive.. • A high class spot such as Mindy’s attracts.. • The Broadway coppers love.. • They sit • בעוד צירופים אחרים הם בלתי אפשריים: • *from arrive .. • *the is…

  5. חוקים חסרי הקשר ועצים • דקדוק חסר הקשר – שקול ל-Backus Naur Form BNF • דקדוק מורכב • מקבוצת חוקים, לצירוף ביטויים בשפה • לקסיקון למילים/סמלים • לדוגמא – צירוף שמניים noun phrases • NP -> Det Nominal • NP -> ProperNoun • Nominal -> Noun | Noun Nominal • Det -> a | the • Noun -> flight סמלים לא טרמינליים סמלים טרמינליים

  6. דקדוק חסר הקשר • משמש כמייצר generator – פירוש החץ -> הוא ‘rewrite the symbol on the left with the string on the right’ • כך שהחל בסמל NP ממשיכים בחוק Det Nominal ומשם ל-DetNoun ומשם ל-a flight. • כלומר: a flight נגזר מהסמל הלא טרמינלי NP. • שימוש ב-S של sentence כסמל התחלתי. • ניתן לייצג גזירה בעזרת עץ.

  7. עץ גזירה ל- a flight NP Det Nom Noun flight a

  8. דקדוק לדוגמא – L0 • S -> NP VP I prefer a morning flight • NP -> Pronoun I • NP -> ProperNoun Los Angeles • NP -> Det Nominal a + flight • Nominal -> Noun Nominal morning flight • VP -> Verb NP prefer a morning flight • VP -> Verb NP PP leave Boston in the morning • VP -> Verb PP leaving on Thursday • VP -> Verb do • PP -> Preposition NP from Los Angeles

  9. לקסיקון לדקדוק L0 • Noun -> flights | breeze | trip | morning … • Verb -> is | prefer| like | need | want | fly • Adjective -> cheapest | non-stop | first | latest | other | direct… • Pronoun -> me | I | you | it| … • ProperNoun -> Alaska | NY | Chicago • Det -> the | a | an | this | these | that | … • Preposition -> from | to | on | near | .. • Conjunction -> and | or | but |…

  10. [S [NP [pro I]][VP [V prefer][NP [Det a] [Nom [N morning] [ N flight]]]]]] S VP NP NP Nom Det Noun Noun Pronoun Verb I prefer a morning flight

  11. דקדוקים פורמליים ושפות טבעיות • דקדוקים פורמליים מגדירים שפה. משפט הוא "דקדוקי" אם הוא נגזר מחוקי השפה הפורמלית, או "לא דקדוקי" אחרת. • בשפה טבעי – קצת יותר מורכב – מהו משפט דקדוקי? נקבע הרבה פעמים על פי הקשר. • שימוש בשפה פורמלית לייצוג שפה טבעית נקרא “generative grammar”, מכיוון שהשפה מוגדרת על פי אוסף המשפטים שיכולים להיווצר מהדקדוק. • הגדרה כללית: Lg=W|w is in * and S*w

  12. מבנה המשפט באנגלית • 4 סוגי משפטים עיקריים: • Declerative חיווי – נושא (NP) ואחרי צירוף פעלי • The return flight should leave at around 11 am • Imperative ציווי, מתחיל בד"כ בצירוף פעלי, ללא נושא • Show the lowest fare. • S -> VP • Yes-no questions – בד"כ לשאלות, מתחיל ב-auxiliary, אחריו הנושא, אחריו הפועל • Can you give me the same information for United? • S -> Aux NP VP

  13. המשך – סוגי משפטים • Wh-questions – מכילים מילות wh (what which why). שני סוגים: • wh-subject-question • Which flights serve breakfast? • S -> Wh-NP VP • wh-non-subject-question • What flights do you have from Burbank toTacoma? • S -> Wh-NP Aux NP VP • סוגים נוספים – כגון fronting • On Tuesday, I’d like to fly from Detroit to NY

  14. הצירוף השמני Noun Phrase • הצירוף השמני עיקרו הוא הגרעין head, שבאנגלית מלווה ב- preו-post-nominal modifiers. • לפני הגרעין: • המיידעים determiners; לעיתים הם אופציונליים (במקרה של ריבוי (flights), שם עצם לא ספיר (snow), שמות עצם אבסטרקטיים (music) למשל). • a stop; the flights; those flights; some flights; flights • Predeterminers – מילים המופיעות לפני המיידעים • all flights; all the flights; • Cardinals, ordinals and quantifiers – מופיעים גם אחרי המיידעים – • The first day; any other day; many fares • חלק מופיעים רק עם שם עצם בריבוי many, וחלק רק עם שמות עצם ספירים much.

  15. המשך – pre-nominal modifiers • שמות תואר adjectives או צירופי תואר AP יכולים להופיע בין הכמתים ולפני הגרעין השמני. • צירוף תארי יכול להיות מורכב מ-adverbs כלוואי התואר • The least expensive fare • כל אלה יוצרים את החוק: • NP -> (Det) (Card) (Ord) (Quant) (AP) Nominal • השימוש בסגריים מעיד על רכיב אופציונלי • זוהי הפשטה של מבנה הצירוף השמני.

  16. Post-nominal modifiers • שלושה סוגי postmodifiers: • צירופי יחס • all flights from Cleveland • Nominal -> Nominal PP (PP)* • Non-finite clauses – • Gerundive (-ing)- יוצר צירוף פעלי (שיכולים להיות לו משלימים מסוגים שונים). • any flights arriving after 11 a.m. • Nominal -> Nominal GerundVP • GerundVP -> GerundV NP GerundV PP GerundV GerundV NP VP GerundV -> being | preferring | arriving …

  17. Post-nominal modifiers - המשך • משפטי זיקה relative clause הוא משפט שמתחיל עם מילת זיקה that, who, • המשמשת כנושא של המשפט המקנן, כמו בדוגמא הבאה: • – a flight that serves breakfast. • Nominal -> Nominal RelClause • RelClause -> (who | that) VP • או בתפקיד ה-object במשפט המקונן • the earliest American Airlines flight that I can get. • ניתן כמובן לשלב בין ה-postmodifiers השונים: • A flight from Phoenix to Detroit leaving Monday evening.

  18. Coordination - איחוי • צירופים יכולים להיות מאוחים אם מאחים כגון and, or, but. • Please repeat [NP [NPthe flights] and [NP the costs]] • NP -> NP and NP • What flights do you have [VP [VPleaving Denver] and [VParriving in San Francisco]] • VP -> VP and VP • S -> S and S

  19. התאם agreement • מה שהתעלמנו ממנו עד עכשיו זה ההטייה שיש לגופים בפועל – • What flights leave in the morning? • What flight leaves from Pittsburgh? • איך ניתן לשנות את הדקדוק כדי שיטפל במקרים כאלה? • אפשרות אחת היא להרחיב את הדקדוק באוסף כפול של חוקים – למשל • S -> Aux NP VP נחליף ב- • S -> 3sgAux 3sgNP VP • S -> Non3sgAux Non3sgNP VP • 3sgAux -> does | has | can .. • Non3sgAux -> do | have | can ..

  20. המשך -- agreement • באותו אופן – נזדקק לחוקים יעודיים לכל אחד מחוקי ה-NP, למשל בהגדרת כפל חוקים ליחיד ולרבים: • 3sgNP -> (Det) (Card)(Ord) (Quant) (AP) SgNominal • Non3sgNP -> (Det) (Card)(Ord) (Quant) (AP) PlNominal • SgNominal -> SgNoun | SgNoun SgNoun • PlNominal -> PlNoun | SgNoun PlNoun • SgNoun -> flight | fare | dollar … • PlNoun -> flights | fares | dollars … • הבעייה היא, שזה לא עוצר כאן.. יש עוד תכונה לשמות עצם שנקראת case – יחסה – למשל – למילות גוף יש יחסת nominative/subjective שזה I, she, he,theyויחסת accusative/objective - me, him, her, them. צריך חוק חדש לכל אפשרות! ו- gender... • בהמשך נראה שימוש ב-feature structure ו-parameterizing של חוקים אלה כדי לאפשר הכללות.

  21. Verb phrase – הצירוף הפעלי • VP -> Verb NP prefer a morning flight • VP -> Verb NP PP leave Boston in the morning • VP -> Verb PP leaving on Thursday • VP -> Verb do יש גם משלימים מסוג אחר – למשל – משלימים של משפט sentential complements • VP -> Verb S You said there were two flights that were the cheapest. • VPs can be followed by other VPs • I want to fly from Milwaukee to Orlando כמו כן יש לפעלים מילים כמו ה-particles – take off. בדרך כלל נחשבים כחלק מן הפועל.

  22. Subcategorization • לא כל פועל יכול להופיע עם כל המבנים שראינו של צירופים פעליים. • want [NP complement] – want a flight • want [VP complement] – want to fly to NY • find אין משלים כזה *I find to fly … • באופן מסורתי, פעלים חולקו לפעלים טרנזיטיביים (יוצאים) שלהם משלים שמני, למשל (I found a flight), או פעלים לא טרנזיטיביים (עומדים) שלא יכולים לקבל משלים כלשהו (*I disappeared a flight). • דיקדוקים חדשים משתמשים בצורות אחרות ל-subcategorization ויש כ- 100 צורות, למשל ב-Comlex.

  23. Subcategorization cont. • אומרים שהפועל find, למשל, subcategorizes for NP , בעוד הפועל want, subcategorizes for either an NP or a non-finite VP. • רכיבים אלה נקראים ה'משלימים' complements של פועל – ל-wantמשלים VP. • משלימים אפשריים אלה נקראים subcat(egorization) frame של פועל. • ניתן לראות את הפועל כפרדיקט ואת המשלימים שלו כארגומנטים – find(I, a flight), want(I, to fly).

  24. ייצוג עובדות אלה ב-CFG • כיצד ניתן ליצג את היחס שבין הפועל לבין המשלימים שלו בדקדוק חסר הקשר? • ניתן לחלק תתי טיפוסים לכל אחד מהחוקים, למשל • Verb-with-NP-Complement -> find | leave | repeat… • Verb-with-S-Complement -> think | believe | say .. • וכולי.. וכל חוק VP להתאים לקטגוריה הלקסיקלית: • VP -> Verb-with-no-complement • VP -> Verb-with-NP-complement NP Etc..

  25. Auxiliaries • ארבעה סוגים -כל אחד מהנ"ל מכניס אילוץ על צורת הפועל העוקב, ולכל אחד מהם מקום מסודר. • modals - can, could, may, might, must, will, would, shall , should • פעלים אלה subcategorize ל-VP שהוא bare stem, למשל: can go in the morningץ • perfect - have • פועל זה subcategorize ל-VP שהפועל שלו הוא past participle – have booked 3 flights. • progressive – be • Subcategorizesל-VP שהפועל שלו הוא gerundive participle -- I am going from Atlanta • passive - be • VPשהפועל שלו הוא ב-past participle – was delayed by the inclement weather.

  26. Auxiliaries - המשך • במשפט יכול להופיע יותר מ-auxiliary אחד, אך הסדר הוא קבוע: • modal < perfect < progressive < passive • modal perfect could have been a man • perfect progressive have been feasting • modal perfect passive might have been prevented • על פי התכונות הנ"ל ניתן להתייחס לפעלים אלה כמו לכל פועל אחר למשל, עבור הפועל can – קטגוריה של verb-with bare-stem-VP. • אילוצי סדר – ניתן לפתור בדרכו של Halliday 1985 - systemic grammar – המגדיר verb group שבו ה-auxiliaries הם רכיבים כמו הפועל הראשי.

  27. תחביר השפה המדוברת • בהתייחסות לשפה המדוברת, מדברים על מבע “utterance” ולא משפט “sentence”. • [mm], i’d like to leave i guess between [um] . [smack] . Five o’clock no, five o’clock and [uh], seven o’clock. P M • הפסיק מייצג הפסקה קצרה, הנקודה הפסקה ארוכה, וסוגריים מרובעות מציינים "אירוע לא מילולי" • הבדלים בין שפה מדוברת לשפה כתובה: בשפה מדוברת יש שימוש רב יותר בכינויי גוף pronouns, יש אי רציפויות (חזרות, תיקונים, היסוסים), ולעיתים רק מחלקים של משפט (כמו בשיחה – one way; around four p.m). • בשיחה יש גם את האלמנטים של ה-prosody, הטון, עליות הקול. מהירות הדיבור.

  28. תחביר שפה מדוברת – חוסר רציפות • חוסר רציפות כולל את ההמהומים, חזרה על מילים, והתחלות שגויות (false start – reparandum). • מילים כמו uh, mm במודלים של שפה – מתייחסים אליהם כאל כניסות לקסיקליות Does TWA offer any one-way flights uh one-way fares for 160$? Interruption point Editing phase Repair Reparandum

  29. הבנה של דיבור • להבנה של דיבור, כשהמטרה היא לבנות משמעות מתוך משפט הקלט, צריך או חשוב להיות מסוגלים לזהות false starts, למשל, ולנסות למצוא את הרצף ה'נכון' של המילים. • Hindle 1983 הראה שלתיקונים בד"כ אותו מבנה תחבירי כשל ההתחלות השגויות: כך שאם ניתן לזהות התחלה שגויה, קל יותר למצוא את התיקון.

  30. תחביר ואופן העיבוד האנושי • בניסויים שנעשו Levelt, 1970 עם בני אדם, נמצא כי אנשים שהתבקשו לקבץ במשפט "מילים קשורות" עשו זאת באופן דומה לחלוקה לרכיבים התחביריים. • אבל בדרך כלל יש קשר הדוק בין המבנה התחבירי ובין היחידות הסמנטיות: a single odd blockהוא גם יחידה תחבירית NP וגם יחידה סמנטית. לכן – אפשרי שהזיהוי האנושי נעשה דווקא על פי הסמנטיקה. • גישה נוספת לתיאור התחביר מבוססת על קשרים בין מילים – קשרים לקסיקוגרפים. לכן, הוכחה לעיבוד אנושי בעזרת חוקים חסרי הקשר צריכה לא להיות מבוססת על קשרים לקסיקליים.

  31. שפה וסיבוכיות חשוב להבין מהי סיבוכיות של שפה כדי לדעת באיזה כלים חישוביים ניתן לתאר אותה. òåîø ואתא מיה וכבה לנורה דשרף לחותרא דהכה לכלבא דנשך לשונרא דאכל לגדיא דזבין אבא בתרי זוזי חד גדיא!!!

  32. ההיררכיה של חומסקי • Generative power- לדקדוק כוח חישובי גדול יותר מדקדוק אחר אם הוא יכול להגדיר שפה שדקדוק אחר לא יכול להגדיר. • אחת הדרכים לתאר היררכיה כזו בין שפות היא ההיררכיה של חומסקי 1959- 4 סוגים: Type 0 languages Context Sensitive languages Context-free langs. Regular Langs.

More Related