1 / 26

12 月 08 日 構文解析

12 月 08 日 構文解析. 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする. 構文木 (一郎が速いボールを軽々と投げた). 文. 動詞句. 後置詞句. 後置詞句    名詞句         動詞句. 名詞 助詞 形容詞 名詞  助詞 副詞   動詞. 一郎  が  速い  ボール  を  軽々と  投げた. CYK アルゴリズム. チョムスキーの標準形の文脈自由文法を対象とした構文解析法 チョムスキーの標準形 A→BC  ( A,B,C∈Vn) A→a (A∈Vn, a∈V t).

Télécharger la présentation

12 月 08 日 構文解析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 12月08日構文解析 • 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする

  2. 構文木(一郎が速いボールを軽々と投げた) 文 動詞句 後置詞句 後置詞句    名詞句         動詞句 名詞 助詞 形容詞 名詞  助詞 副詞   動詞 一郎  が  速い  ボール  を  軽々と  投げた

  3. CYKアルゴリズム • チョムスキーの標準形の文脈自由文法を対象とした構文解析法 • チョムスキーの標準形 • A→BC (A,B,C∈Vn) • A→a (A∈Vn, a∈Vt) X→aBはチョムスキーの標準形ではないが X→AB, A→aに分解できる X→ABCはチョムスキーの標準形ではないが X→AY, Y→BCに分解できる

  4. チョムスキーの標準形の例「急いで走る一郎を見る」チョムスキーの標準形の例「急いで走る一郎を見る」 • (9) adv→急いで • (10) n→一郎 • (11) p→を • (12) v→走る • (13) v→見る • (1) s→pp v • (2) s→adv vp • (3) vp→pp v • (4) vp→adv v • (5) np→vp n • (6) np→v n • (7) np→np p • (8) pp→n p

  5. T1,5 T2,5 T1,4 T1,3 T2,4 T3,5 T1,2 T2,3 T4,5 T3,4 T1,1 T2,2 T3,3 T4,4 T5,5 急いで 走る 一郎 を 見た CYK構文解析の概要 T2,5: 走る一郎を見た T2,2: 走る| T3,5: 一郎を見た 1.急いで 2.走る 3.一郎 4.を 5.見た T2,3: 走る一郎| T4,5 を見た T2,4: 走る一郎を| T5,5 見た 1.急いで 2.走る T2,2 T2,3 T2,4 T2,5 3.一郎 T3,5 T4,5 4.を 5.見た T5,5

  6. T2,5までの部分木 T2,5: 走る一郎を見た T1,5 T1,5 T2,5 T2,5 T1,4 T1,4 T1,3 T2,4 T1,3 T2,4 T3,5 T3,5 T1,2 T2,3 T1,2 T2,3 T4,5 T4,5 T3,4 T3,4 T1,1 T1,1 T2,2 T2,2 T3,3 T4,4 T5,5 T3,3 T4,4 T5,5 急いで 走る 一郎 を 見た 急いで 走る 一郎 を 見た T2,2: 走る| T3,5: 一郎を見た T1,5 T2,3: 走る一郎| T4,5 を見た T2,5 T1,4 T1,3 T2,4 T3,5 T1,2 T2,3 T4,5 T3,4 T1,1 T2,2 T3,3 T4,4 T5,5 急いで 走る 一郎 を 見た T2,4: 走る一郎を| T5,5 見た

  7. CYKアルゴリズム • A→aの形の規則を用いて主対角線上の要素を求める. • for i=1 to N • Ti,i={A|A→wi} • A→BCの形の規則を用いて2番目以降の対角線上の要素を求める • for k=1 to N-1 • for i=1 to N-k • であれば, は開始記号Sから導出可能

  8. CYK構文解析表 1.急いで 2.走る  3.一郎 4.を  5.見た vp→pp v s→pp v s→adv vp adv→急いで vp→adv v np→vp n pp→np p 1.急いで v→走る np→v n pp→np p vp→pp v s→pp v 2.走る n→一郎 pp→n p vp→pp v s→pp v 3.一郎 p→を 4.を v→見た 5.見た

  9. 文脈自由文法に基づく構文木 s s pp vp np pp vp np adv v n p vadv v n p v 急いで 走る 一郎 を 見た  急いで 走る 一郎 を 見た

  10. 意味解析 • 与えられた文から,妥当な語の意味と意味関係を明らかにし,意味構造を生成する • 意味構造 • 意味解析に用いる知識 • 意味解析手法 • コーパスによる訳語選択

  11. 意味構造 • 格構造 • 格:文を構成する要素(語や句)が述語に対して果たす役割 • 表層格(構文的) • 構文木から表層的に決まる格 • ガ格,ヲ格,ニ格 • 深層格(意味的) • 表層だけでは決まらない • Fillmoreの深層格 • 動作主格,経験者格,道具格,対象格,源泉格,目標格,場所格,時間格

  12. 格構造の例 open open open 動作主格 対象格 対象格 道具格 対象格 John the door the door the key the door The door opened. John opened the door. The key opened the door. open open 動作主格 対象格 動作主格 道具格 対象格 John the door John the door the key The door was opened by John. John opened the door with the key.

  13. 述語論理式 • 一階述語論理 • John opened the door.

  14. 概念依存構造 John gave the man a book. 過去時制 受益者の関係 man 対象 P O R John ATRANS book 抽象的なものの移動 John

  15. 意味解析に用いる知識 • 選択制限 • スクリプト • 電子化辞書

  16. 選択制限 • 文の意味的妥当性を規定するため辞書中に記述された,単語間の共起関係に関する意味的制約 • 例:目の下にくまが出来た.     「くま」の意味→動物の熊,目の下の陰     動物は目の下には出来ないので     目の下に「熊」が出来たわけではない

  17. スクリプト • 典型的な事象例を一つの枠の中にまとめた記憶構造.人間が日常行っている定型化された行動を,時間の流れに沿った事象の連鎖で表現したもの • 例:レストランスクリプト • 客がレストランに入り,料理を注文し,食事をし,支払いをして,レストランをでる間の行動を記述する • レストランで 「誤って皿を割ってしまった」の皿はひざの皿ではなくて料理を盛り付ける皿であると推測できる

  18. 電子化辞書 • 意味解析には体系的かつ網羅的に語彙の上位・下位関係や制約を記述した知識ベースが必要 • 既存の辞書を電子化 • 対訳辞書,英英辞書,シソーラス,類語辞典,分類語彙表 • 利用例:語釈文中に現れる単語を利用する語の曖昧性解消法 • 言語処理用に構築された辞書 • EDRの辞書,オントロジー辞書,WordNet • 利用例:語と語の関係(上位・下位関係などを利用)

  19. 意味解析手法

  20. コーパスによる訳語選択 • ある言語における単語を別の言語のどの単語で表現するか • 例:paper→紙,新聞,論文 • DMAX訳語選択法 • GDMAX訳語選択法

  21. 訳語選択用コーパス • パラレルコーパス • ある言語の文(原文)と他言語の対訳文から構成されるコーパス • 例:Unixのman page,天声人語とその対訳 • 大量収集:困難 • コンパラブルコーパス • 分野やトピックを共有しているある言語のコーパスと他言語のコーパス • 例:各国の新聞記事 • 大量収集:比較的容易

  22. コンパラブルコーパスを用いた訳語選択 • DMAX訳語選択法(Double MAXimize法) • GDMAX訳語選択法(Generalized Double MAXimize法)

  23. DMAX訳語選択法(Double MAXimize法) • アイディア:ある言語コーパスにおいて最大の共起頻度をもつ二つの単語に着目し,その二つの単語の訳語候補が複数ある場合,正しい訳語はコンパラブルなコーパスにおいても最大の共起頻度を有する

  24. 訳語選択例:裁判官のコートとネクタイ 日英対訳辞書 ネクタイ コート 裁判官 tie coat court judge 50 10 50 10 10 80 10 10 日本語コーパス 単語共起頻度 英語コーパス 単語共起頻度

  25. GDMAX訳語選択法(Generalized Double MAXimize法) • クロス言語情報検索で検索要求の単語から適切な訳語を得るための手法

  26. 第2回 レポート締め切り 12月15日10:30 • CYKアルゴリズムを使って 「急いで走る一郎を見た」を構文解析するプログラムを作成せよ • 説明つきプログラム • 結果 • 考察

More Related