1 / 56

自然言語処理 2007

自然言語処理 2007. 平成 20 年 1 月 7 日 ( 月) 東京工科大学 コンピュータサイエンス学部 亀田弘之. 今までやってきたこと. 今までやってきたこと. 自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(文法獲得). 自然言語処理とは. 自然言語 (Natural Languages) 言語 思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具 言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語 処理=理解+生成

nitesh
Télécharger la présentation

自然言語処理 2007

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 自然言語処理2007 平成20年1月7日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之

  2. 今までやってきたこと

  3. 今までやってきたこと • 自然言語処理とは • 自然言語処理(理解)過程の概要 • 形態素解析(各種手法とツール) • 構文解析 • 言語獲得(文法獲得)

  4. 自然言語処理とは • 自然言語 (Natural Languages) • 言語 • 思考のための道具 • 情報・知識を記述・蓄積するための道具 • コミュニケーションのための道具 • 言語=自然言語+人工言語 • 自然言語=文字言語+音声言語+視覚言語 処理=理解+生成 • 処理の主体(機械 or 人間) 本授業は主として「文字言語+理解」を取り扱う

  5. 自然言語処理(理解)過程の概要 • 形態素解析 (Morpheme analysis) • 構文解析 (Syntactic analysis) • 意味解析 (Semantic analysis) • 談話解析 (Discourse analysis) • 状況解析 (Situation analysis)

  6. 形態素解析の手法 • 文字種法 • 最長一致法 • 文節数最少法 • 接続表を利用する方法 • 遷移確率を用いる方法 • コスト最小法(Juman) • 隠れマルコフモデル法(Chasen) • その他(Kabocha等はSVMを利用) SVM: Support Vector Machine(機械学習法の1つ)

  7. 形態素解析のツール • Juman • Chasen(茶筌) • Kobako/J • その他いろいろあります(Internetなどで調べてみましょう.) • 自作のソフトウェア

  8. 統語解析 • 言語・文法言語=文法的に適格な文の集合文法=<Vn, Vt, s, P> Vn:非終端記号の集合Vt:非終端記号の集合s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠)

  9. 統語解析 • 言語・文法言語=文法的に適格な文の集合文法=<Vn, Vt, s, P> Vn:非終端記号の集合 (構文構造記述用文法用語集)Vt:終端記号の集合(語彙)s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠)

  10. Tom broke the cup with the hammer.

  11. 言語獲得(文法獲得) • 未知語獲得(Vtの拡張) • 統語規則獲得(VnおよびPの拡張)

  12. 未知語獲得 • 定義 • 分類

  13. 未知語の定義 • 人間にとっての未知語:初見の単語?(定義困難?) • 機械にとっての未知語:システム辞書に登録されていない単語(未登録語)

  14. 未知語の分類(概要) • 第1種の未知語(異表記未知語) • 第2種の未知語(未知複合語) • 第3種の未知語(その他)

  15. 第1種(異表記未知語) • 東京大学付属病院  東京大學附属病院 • 組合せ 組み合せ 組み合わせ 組み合わせ • 飛び込む  飛びこむ • コンピュータ コンピューター etc.

  16. 第2種(未知複合語) • 数学辞典 • 見学旅行 • 個人旅行 • 月旅行 • 温泉旅行 • 積み立て旅行 etc. これらの単語を辞書で調べてみよう. このうちの幾つかは通常の辞書には載っていない. そのような語は他にもあり得る.どうすればいいのだろうか?

  17. 第3種 • その他 • のだめ • rlgg • モー娘

  18. 未知語処理 • 要素プロセス • 処理モード • 処理方略

  19. 未知語処理の要素プロセス • 未知語存在の検出 • 未知語候補の切り出し • 内部構造の解析 • 品詞推定 • 意味推定 • 意味整合性の確認 • 辞書処理(追加・削除・更新 など)

  20. 未知語処理の処理モード

  21. 今日の内容 • より深い自然言語処理 • 他者理解感情・意図理解(・社会認知?) • 心のモデル(・認知機能モデル?)

  22. 心のモデルとそれに基づく感情・意図推測方法心のモデルとそれに基づく感情・意図推測方法 2006年10月20日 東京工科大学 亀田弘之・小澤朋之・難波創 電子情報通信学会思考と言語研究会 平成19年10月20日発表資料 於 NHK基礎研究所

  23. いじめ 引きこもり はじめに(1/5) 社会の高度化・複雑化 心の問題 「癒し」を切実に求めている

  24. はじめに(2/5) 癒し 心理的効果 人を元気づけることや動機づける 生理的効果 ストレスを低減し血圧や脈拍を正常にさせる 現代社会に必要とされている

  25. はじめに(3/5) 人との共存を目的として開発されているロボット PaPeRo ifbot 人に安らぎや癒しを与えることができる

  26. ふれあい 癒される~ はじめに(4/5) 円滑で自然な意思疎通が必要不可欠

  27. PDDINです よろしく~♪ はじめに(5/5) コミュニケーションによる癒しの実現 人とふれあう癒し系ロボット PDDIN

  28. 従来の心・感情モデル(1/5) 心のモデル “人の心”という概念を扱う場合に,まさに その心自体を記述・表現するためのものである 心のモデルに関するさまざまな提案がされている

  29. 従来の心・感情モデル(2/5) 図1:心の計算機モデル(岡田直之)

  30. 従来の心・感情モデル(3/5) 図2:意識の外にある無意識の自律分散計算結果に ボトムアップに注意を払う受動的な意識を仮定する心のモデル(前野隆司)

  31. 従来の心・感情モデル(4/5) 図3:感情の立体モデル(P.Plutchik)

  32. The Theory of Mind(心の理論) • Premack & Wooddruff(1978) • Baron-Cohen(1995)

  33. 心の理論とは

  34. The Theory of Mind • ID (Intentionality Detector)意図検出器 • EDD (Eye-Direction Detector)視線方向検出器 • SAM (Shared Attention Mechanism)共有注意の機構 • ToMM (Theory of Mind Mechanism)心の理論の機構

  35. 従来の心・感情モデル(5/5) 従来のモデルの問題点 1.処理のためのデータ構造やアルゴリズムが明確に示してはいない 2.工学的に応用するまでに至っていない 人とふれあう癒し系ロボットPDDINの 研究・開発による心のモデルの考案

  36. PDDIN 2002年度から開発されている 研究内容 1.感情モデルの提案 2.感情モデルをもちいた,感情システムの構築 3.対話処理システムの構築 4.ロボット本体の作製

  37. PDDIN2005 デモムービー

  38. 考察 • モデルの意義の一つは「システムの設計図」である。 • 従来の心・感情のモデルは設計図としては不十分。 • というのも…

  39. ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計 • 人間の心(脳)も同様ではないのか?

  40. ユースケース図 クラス図 オブジェクト図 シーケンス図 ステートマシン図(ステートチャート図) アクティビティ図 コンポーネント図 コミュニケーション図(コラボレーション図) 配置図 コンポジット図 タイミング図 相互作用概念図 ソフトウェア工学で使用する図(UML) こんなにたくさんある!

  41. UMLでの各種ビュー 論理ビュー ユースケースビュー クラス図 オブジェクト図 シーケンス図 アクティビティ図 ユースケース図 ステートマシン図 (ステートチャート) コミュニケーション図 (コラボレーション図) コンポーネント図 配置図 コンポーネントビュー 並行性ビュー 配置ビュー こんなにたくさんの視点がある!

  42. 人間の心(脳)に対しても、UMLを参考にしてモデルを記述するべきであろう。(今後の方針)人間の心(脳)に対しても、UMLを参考にしてモデルを記述するべきであろう。(今後の方針)

  43. 心のモデル • 計算論的なモデルが必要(今回の基本的主張)

  44. 銘記 感覚貯蔵庫 保持 短期記憶 想起 長期記憶 記憶のモデル(従来のモデルの例)

  45. 心のモデル • データ構造+アルゴリズム • 知識表現+プログラム(オブジェクト指向)

  46. 心のモデルの概要図

  47. 心のモデルの知識表現

  48. 心のモデルのプログラム

  49. 心のモデルのプログラム • 理解と生成 • 生成はシステム設計者依存 • 理解は相手がある->この解決方法は?

  50. 心のモデルのプログラム • 理解と生成 • 生成:生成関数Fを利用 • 理解:生成関数Fの逆関数で推定 • 逆関数の存在は? • 逆関数の同定(作成)方法は? • 逆関数の計算は?解決すべき問題はたくさんある!どうすればいいのか!?

More Related