1 / 61

自然言語処理 2013

自然言語処理 2013. 平成 25 年 12 月 9 日 ( 月) 東京工科大学 コンピュータサイエンス学部 亀田弘之. 今までやってきたこと. 思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。. 今までやってきたこと. 思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。. 今日の課題  思いつく キーワードを10個ほど 書き出してみてください。. 今までやってきたこと. 自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析

selma
Télécharger la présentation

自然言語処理 2013

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 自然言語処理2013 平成25年12月9日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之

  2. 今までやってきたこと • 思い出して見てください。 • キーワードだけでもいいですので! • たくさんのことを学びましたよね。 Tokyo University of Technology (思考と言語研究室)

  3. 今までやってきたこと • 思い出して見てください。 • キーワードだけでもいいですので! • たくさんのことを学びましたよね。 今日の課題  思いつくキーワードを10個ほど書き出してみてください。 Tokyo University of Technology (思考と言語研究室)

  4. 今までやってきたこと • 自然言語処理とは • 自然言語処理(理解)過程の概要 • 形態素解析(各種手法とツール) • 構文解析 • 言語獲得(未知語獲得・文法獲得) Tokyo University of Technology (思考と言語研究室)

  5. 自然言語処理とは • 自然言語 (Natural Languages) • 言語 • 思考のための道具 • 情報・知識を記述・蓄積するための道具 • コミュニケーションのための道具 • 言語=自然言語+人工言語 • 自然言語=文字言語+音声言語+視覚言語 • 処理=理解+生成 • 処理の主体(機械 or 人間) 本授業は主として「文字言語+理解」を取り扱う Tokyo University of Technology (思考と言語研究室)

  6. 自然言語処理(理解)過程の概要 • 形態素解析 (Morpheme analysis) • 構文解析 (Syntactic analysis) • 意味解析 (Semantic analysis) • 談話解析 (Discourse analysis) • 状況解析 (Situation analysis) など Tokyo University of Technology (思考と言語研究室)

  7. 形態素解析の手法 • 文字種法 • 最長一致法 • 文節数最少法 • 接続表を利用する方法 • 遷移確率を用いる方法 • コスト最小法(Juman) • 隠れマルコフモデル法(Chasen) • その他(Kabocha等はSVMを利用) SVM: Support Vector Machine(機械学習法の1つ) Tokyo University of Technology (思考と言語研究室)

  8. 形態素解析のツール • Juman • Chasen(茶筌) • MeCab • Kobako/J • その他いろいろあります(Internetなどで調べてみましょう。) • 自作のソフトウェア Tokyo University of Technology (思考と言語研究室)

  9. 統語解析(構文解析) • 言語と文法(Language and Grammar)言語=文法的に適格な文の集合文法=<Vn, Vt, s, P> Vn:非終端記号の集合Vt:非終端記号の集合s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠) Tokyo University of Technology (思考と言語研究室)

  10. 統語解析 • 言語と文法(Language and Grammar) 言語=文法的に適格な文の集合文法=<Vn, Vt, s, P> Vn:非終端記号の集合 (構文構造記述用文法用語集)Vt:終端記号の集合(語彙)s: 開始記号 P:書き換え規則群 (チョムスキーの文法理論に準拠) Tokyo University of Technology (思考と言語研究室)

  11. Tom broke the cup with the hammer. • この例文で構文解析の話しをしました。 • 他の例ではどうなるか挑戦してみてください。 • その結果として、自力で構文解析システムを作るために必要な知識や技術が何であるか理解できればOKです。 • 後は、挑戦あるのみです。Good Luck! Tokyo University of Technology (思考と言語研究室)

  12. 言語獲得(文法獲得) • 未知語獲得(Vtの拡張) • 統語規則獲得(VnおよびPの拡張) Tokyo University of Technology (思考と言語研究室)

  13. 未知語獲得 • 定義(コメント:研究を進める上での前提) • 分類(コメント:研究目的に応じて決まるもの) Tokyo University of Technology (思考と言語研究室)

  14. 未知語の定義 • 人間にとっての未知語:初見の単語?(定義困難?) • 機械にとっての未知語:システム辞書に登録されていない単語(未登録語) Tokyo University of Technology (思考と言語研究室)

  15. 未知語の分類(概要) • 第1種の未知語(異表記未知語) • 第2種の未知語(未知複合語) • 第3種の未知語(その他) Tokyo University of Technology (思考と言語研究室)

  16. 第1種(異表記未知語) • 東京大学付属病院 東京大學附属病院 • 組合せ  組み合せ 組み合わせ 組み合わせ • 飛び込む 飛びこむ • コンピュータ コンピューター etc. Tokyo University of Technology (思考と言語研究室)

  17. 第2種(未知複合語) • 数学辞典 • 見学旅行 • 個人旅行 • 月旅行 • 温泉旅行 • 積み立て旅行 etc. これらの単語を辞書で調べてみよう. このうちの幾つかは通常の辞書には載っていない. そのような語は他にもあり得る.どうすればいいのだろうか? Tokyo University of Technology (思考と言語研究室)

  18. 第3種(本当の未知語) • 例: • のだめ • rlgg (専門用語) • モー娘 • りあじゅう (若者語) Tokyo University of Technology (思考と言語研究室)

  19. 未知語処理 • 処理プロセス • 処理モード • 処理方略 (strategy) Tokyo University of Technology (思考と言語研究室)

  20. 未知語処理の処理プロセス • 未知語存在の検出 • 未知語候補の切り出し • 内部構造の解析 • 品詞推定 • 意味推定 • 意味整合性の確認 • 辞書処理(追加・削除・更新 など) Tokyo University of Technology (思考と言語研究室)

  21. 未知語処理の処理モード Tokyo University of Technology (思考と言語研究室)

  22. 今日の内容 • より深い自然言語処理 • 他者理解感情・意図理解(・社会認知) • 心のモデル(・認知機能モデル) など (Theory of Mind) Tokyo University of Technology (思考と言語研究室)

  23. 今日の内容(再) • より深い自然言語処理 • 他者理解感情・意図理解(・社会認知) • 心のモデル(・認知機能モデル) など (Theory of Mind) それでは始めましょう! Tokyo University of Technology (思考と言語研究室)

  24. 心のモデルとそれに基づく感情・意図推測方法心のモデルとそれに基づく感情・意図推測方法 2006年10月20日 東京工科大学 亀田弘之・小澤朋之・難波創 電子情報通信学会思考と言語研究会 平成19年10月20日発表資料 於 NHK基礎研究所

  25. いじめ 引きこもり はじめに(1/5) 社会の高度化・複雑化 心の問題 「癒し」を切実に求めている Tokyo University of Technology (思考と言語研究室)

  26. はじめに(2/5) 癒し 心理的効果 人を元気づけることや動機づける 生理的効果 ストレスを低減し血圧や脈拍を正常にさせる 現代社会に必要とされている Tokyo University of Technology (思考と言語研究室)

  27. はじめに(3/5) 人との共存を目的として開発されているロボット PaPeRo ifbot 人に安らぎや癒しを与えることができる Tokyo University of Technology (思考と言語研究室)

  28. ふれあい 癒される~ はじめに(4/5) 円滑で自然な意思疎通が必要不可欠 Tokyo University of Technology (思考と言語研究室)

  29. PDDINです よろしく~♪ はじめに(5/5) コミュニケーションによる癒しの実現 人とふれあう癒し系ロボット PDDIN Tokyo University of Technology (思考と言語研究室)

  30. 従来の心・感情モデル(1/5) 心のモデル “人の心”という概念を扱う場合に,まさに その心自体を記述・表現するためのものである 心のモデルに関するさまざまな提案がされている Tokyo University of Technology (思考と言語研究室)

  31. 従来の心・感情モデル(2/5) 効果器 図1:心の計算機モデル(岡田直之) Tokyo University of Technology (思考と言語研究室)

  32. 従来の心・感情モデル(3/5) 図2:意識の外にある無意識の自律分散計算結果にボトムアップに注意を払う受動的な意識を仮定する心のモデル(前野隆司) Tokyo University of Technology (思考と言語研究室)

  33. 従来の心・感情モデル(4/5) 図3:感情の立体モデル(P.Plutchik) Tokyo University of Technology (思考と言語研究室)

  34. The Theory of Mind(心の理論) • Premack & Wooddruff(1978) • Baron-Cohen(1995) Tokyo University of Technology (思考と言語研究室)

  35. 心の理論とは Tokyo University of Technology (思考と言語研究室)

  36. The Theory of Mind • ID (Intentionality Detector)意図検出器 • EDD (Eye-Direction Detector)視線方向検出器 • SAM (Shared Attention Mechanism)共有注意の機構 • ToMM (Theory of Mind Mechanism)心の理論の機構 Tokyo University of Technology (思考と言語研究室)

  37. 従来の心・感情モデル(5/5) 従来のモデルの問題点 1.処理のためのデータ構造やアルゴリズムが明確に示してはいない 2.工学的に応用するまでに至っていない 人とふれあう癒し系ロボットPDDINの 研究・開発による心のモデルの考案 Tokyo University of Technology (思考と言語研究室)

  38. <参考情報>感性情報科学の研究室 • 東京工科大学で感情関連の研究をしている研究室はいろいろとあります。 • 亀田研究室(癒し系ロボット・認知機能モデル) • 大野研究室(感情音声の認識・合成) • 長名研究室(感情のニューラルネットモデル) • 岩下研究室(音声対話システム) • 千種研究室(感性語検索) • 菊池研究室(感性科学・精神物理学) など • 飯田研究室(メディア学部・感情音声) Tokyo University of Technology (思考と言語研究室)

  39. PDDIN 2002年度から開発されている 研究内容 1.感情モデルの提案 2.感情モデルをもちいた,感情システムの構築 3.対話処理システムの構築 4.ロボット本体の作製 Tokyo University of Technology (思考と言語研究室)

  40. PDDIN2005 デモムービー Tokyo University of Technology (思考と言語研究室)

  41. 考察 • モデルの意義の一つは「システムの設計図」である。 • 従来の心・感情のモデルは設計図としては不十分。 • というのも… Tokyo University of Technology (思考と言語研究室)

  42. ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計 • 人間の心(脳)も同様ではないのか? Tokyo University of Technology (思考と言語研究室)

  43. ユースケース図 クラス図 オブジェクト図 シーケンス図 ステートマシン図(ステートチャート図) アクティビティ図 コンポーネント図 コミュニケーション図(コラボレーション図) 配置図 コンポジット図 タイミング図 相互作用概念図 ソフトウェア工学で使用する図(UML) こんなにたくさんある! Tokyo University of Technology (思考と言語研究室)

  44. UMLでの各種ビュー こんなにたくさんの視点がある! 論理ビュー ユースケースビュー クラス図 オブジェクト図 シーケンス図 アクティビティ図 ユースケース図 ステートマシン図 (ステートチャート) コミュニケーション図 (コラボレーション図) コンポーネント図 配置図 コンポーネントビュー 配置ビュー 並行性ビュー Tokyo University of Technology (思考と言語研究室)

  45. 人間の心(脳)に対しても、UML (Unified Modeling Language) を参考にしてモデルを記述するべきであろう。(1つの方針) (もしかしたら、SysML の方がいいかも...) Tokyo University of Technology (思考と言語研究室)

  46. 心のモデル • 計算論的なモデル (computational model) が必要 (基本的主張) Tokyo University of Technology (思考と言語研究室)

  47. 銘記 感覚貯蔵庫 保持 短期記憶 想起 長期記憶 記憶のモデル(従来のモデルの例) Baddeleyのworking memory理論も計算論的ではない Tokyo University of Technology (思考と言語研究室)

  48. 心のモデル • データ構造+アルゴリズム • 知識表現+プログラム(オブジェクト指向) Tokyo University of Technology (思考と言語研究室)

  49. 心のモデルの概要図 Tokyo University of Technology (思考と言語研究室) (次ページ参照)

  50. Tokyo University of Technology (思考と言語研究室)

More Related