330 likes | 508 Vues
1 月 12 日 前回の続き 談話解析. プラン認識に基づく理解. 個々の発話 相手の心的状態(信念や意図)を変化させる行為 対話 世界に作用し何らかの目的(ゴール)を達成するための計画(プラン). 発話の理解. 駅の案内所での客と駅員の会話 客:モントリオール行きの列車は何時に出発しますか. 駅員 A : 3 時 15 分です 駅員 B : 3 時 15 分に 7 番ゲート からです. ウィンザー行きの列車は何時に発車するかご存知ですか. 駅員 A :はい 駅員 B : 3 時 15 分 に出発します.. 行為の記述. 乗車 ( 行為者,列車,駅)
E N D
プラン認識に基づく理解 • 個々の発話 • 相手の心的状態(信念や意図)を変化させる行為 • 対話 • 世界に作用し何らかの目的(ゴール)を達成するための計画(プラン)
発話の理解 • 駅の案内所での客と駅員の会話 • 客:モントリオール行きの列車は何時に出発しますか. • 駅員A:3時15分です • 駅員B:3時15分に7番ゲートからです. • ウィンザー行きの列車は何時に発車するかご存知ですか. • 駅員A:はい • 駅員B:3時15分に出発します.
行為の記述 • 乗車(行為者,列車,駅) • 制約:発車駅(列車,駅) • 出発場所(列車,場所) • 出発時間(列車,時間) • 前提条件: いる(行為者,場所,時間) • 効果:乗車状態(行為者,列車)
「モントリオール行きの列車は何時に発車しますか」 駅員の答え「モントリオール行きの列車は何時に発車しますか」 駅員の答え • 客はモントリオール行きの列車の発車時刻を知りたがっている • 客はモントリオール行きの列車に乗りたいらしい • 列車に乗るには客は下の前提条件を満たさなければならない. • いる(行為者,場所,時間) • 前提条件の制約 • 発車駅,場所,時間 • 当駅は発車駅である.時間は聞かれたので答える.乗車ゲートも答える必要がある. • 「3時15分に7番ゲートからです.
1月12日文章生成 • 文章生成 • 対話システム • 翻訳システムの出力 • 要約システムの出力 • 質問応答システムの出力
文書生成システム • 概念化された伝達内容を入力とするシステム • 中間言語方式の機械翻訳 • 非記号的データを入力とするシステム • 株式市場レポート,天気予報,スポーツの試合のレポート • 伝達意図を入力とするシステム • 領域知識に関する質問応答システム
自然言語生成に必要な種々の作業と資源 非記号的データ 話し手の意図 領域知識 概念化/ 命題化 伝達内容 の選択 伝達内容 の構成 談話構造に関する知識 領域に関する聞き手の モデル 深層生成 テキストプラン 談話関係 の表出 文法的 選択 文境界 の決定 語彙・文法知識 言語に関する聞き手 のモデル 表層生成 参照表現 の選択 命題の 集約 語選択 テキスト
深層生成 • 話し手の意図を入力とし,それを達成するテキストの伝達内容を選択する
Lispプログラムについてアドバイスするエキスパートシステムとユーザの対話Lispプログラムについてアドバイスするエキスパートシステムとユーザの対話 • S1: どのような内容のアドバイスがほしいですか? • u1: プログラムの保守性を向上させるためのアドバイスをください. • s2: (setq x 1) は (setf x 1)に変更したほうがいいです. • u2: なぜ? • システムのゴール:setqからsetfへの書換えを実行するようにユーザを説得する • s3: • 私は今, • 保守性向上の書換えを適用することによって, • プログラムの保守性を高めようとしています. • setqからsetfへの書換えは保守性向上の書換えの一つなのです.
表層生成 • 深層生成で生成された伝達内容(テキストプラン)をテキストに変換する作業 • 文境界の決定 • 構文の選択 • 語の選択
参照表現の選択参照対象を特定するのに必要な情報参照表現の選択参照対象を特定するのに必要な情報 • 矢印で指している三角を言葉で指定するには?
参照表現の選択基本語彙レベル 動物 • 動物にかまれた • 獣にかまれた • 犬にかまれた • ラブラドールにかまれた • 隣の家のナナにかまれた 獣 犬 ラブラドール 隣の家のナナ
参照表現の選択聞き手のモデルの考慮 • 聞き手が良く知っていると推定できる語を優先する. • それに該当する適当な語がないときは,説明的な定義で言い換える. • 説明的定義についても,聞き手が知っていると推測される情報を優先する.
参照表現の選択文脈の影響1 • 参照対象が未出の実体である場合 • 初めて談話に現れる実態を参照する場合 • 参照対象を特定するための情報を付加して表出する. • 「昨日山田さんと行ったレストラン」 • 聞き手が既に知っていると推定できる実体を参照する場合 • 固有名詞または定名詞句で参照する • 参照対象と同じクラスの実体が先行文脈に現れている場合 • 二つの実体を区別する属性を用いて代用詞を修飾する. • 先行文脈には現れていないが,既出の実体から聞き手がその存在を推論できる実体を参照する場合 • 定名詞句で参照する. • 「次にキュウリを用意します.皮はきれいにむいてしましましょう」
参照表現の選択文脈の影響2 • 参照対象が既出の実体である場合 • 参照対象が前文と現在の文でともに焦点になっている,又は参照対象が既に先行文脈に現れていて,前文と現在の文でともに焦点になっている対象が現在の文で省略されている場合 • ゼロ代名詞又は指示詞が使える. • 「山田さんはその日の朝ようやく八ヶ岳の絵を完成させました.さっそく幸子さんにφ見せました. • それ以外の場合 • 「音量を調節するつまみ」,「先ほど切ったタマネギ」,「最初の曲がり角」 • 大域的文脈(談話状況)から特定される実体 • 話し手・聞き手はそれぞれ一人称・二人称の呼称を用いて参照できる. • 談話状況に存在する対象は「これ,それ,あれ」などの直示的参照表現で参照する
修辞的関係の表出と文境界の決定 • <原因>(主部)太郎は今朝寝坊してしまった • (従属部)太郎は,昨晩夜ふかしをした • 太郎は,昨晩夜ふかしをしたので,今朝寝坊してしまった. • <目的>「~するために」 • <原因>「~する/したので」
修辞的関係表現の難しさ接続表現の選択 • <条件>という修辞的関係を表す英語の接続表現 • if • when • after • only if
修辞的関係表現の難しさ文境界の決定 • 二つの命題が何らかの修辞的関係にあるとき,それらの命題は適当な接続表現を使って一つの文にまとめることが出来る. • しかし,さまざまな命題を無制限に一つの文に詰め込むと,極端に読みにくい文ができる可能性がある. • 例 新規書類が開いたら,文書をつくったあとに用紙設定をしようとすると余白がずれる可能性があるので,文書をつくる前に用紙設定をします. • 例 新規書類が開いたら,文書をつくる前に用紙設定をします.文書をつくったあとに用紙設定をしようとすると余白がずれる可能性があります.
修辞的関係表現の難しさ接続表現の省略 • 新規書類が開いたら,文書をつくる前に余白調整などの用紙設定をします.(<動機づけ>)文書をつくったあとに用紙設定をしようとすると余白などがずれる可能性があります.
伝達内容の集約(集約規則) • 複数の命題が同一の主語をもつとき,それらを一つの命題に集約することができる. • 金丸は大学院生だ.金丸は頭が良い.→金丸は頭の良い大学院生だ. • 複数の命題が同一の述語をもつとき,それらを一つの命題に集約することができる.得られる命題は,もとの命題に対する複数の主語を持つ • 太郎は大学生だ.次郎は大学生だ.→太郎も次郎も大学生だ
センテンスプラン 選択によって得られる一文当たりの内部表現 センテンスプラン 文法制約 表層文字列
「山田さんは昨年八ヶ岳の絵を描いた」に相当するセンテンスプラン「山田さんは昨年八ヶ岳の絵を描いた」に相当するセンテンスプラン 描く 動作主:[1] 人&目上 名前:山田 動作対象:[2] 絵 クラス限定:山 名前:八ヶ岳 時間位置:[3] 昨年 発話行為:断定 接続関係:なし 主題:[1] 情報量:[3]<[2]
単一化文法の例 • (0) s’/Sem→s( )Sem. • (1) s(Subcat)/Sem→Comp1, s([Comp1|Subcat])/Sem • (2) pp/Sem→np/NP, p(NP)/Sem • (3) s([pp/o(O), pp/ga(S)])/draw(S,O)→ ‘描く’ • (4) np/y 山田さん • (5) np/p 絵 • (6) p(NP)/ga(NP)→が • (7) p(NP)/o(NP)→を
意味主辞駆動生成の流れ s’/draw(y,p) (0) (0) s([])/draw(y,p) (1) s([pp/ga(y)])/draw(y,p) pp/ga(y) pp/o(p) (1) (2) (2) np/y p(y)/ga(y) np/p p(p)/o(p) s([pp/o(p), pp/ga(y)])/draw(y,p) (4) (6) (5) (7) (3) 山田さん が 絵 を 描く
合成のための生成:要約システム • 出力の可読性を向上する機会を提供する.表やテンプレートはかなり不明瞭で読みにくい. • 生成を使えばグラフィックスよりもコンパクトな要約となる場合もある.グラフィックスでも,画像の状況説明をし,はっきりさせるにはテキストが必要なことは多い • 生成では,さまざまなテキストプランニング戦略や語彙選択戦略を用い,テキストを一貫性のあるものにする. • 生成の過程で,自然言語表現やそれらの組み合わせ方を選択することで,さまざまな集約や一般化操作を合成中に行うことができる.
生成モジュールの構造 内容決定 何を伝えるのか の決定 合成 文書構造化 どう伝えるのか の決定 文プランニング 表層的表出
内容決定 • 伝達する情報の選択 • 情報をメッセージの系列で表す
文書構造化 • 出力の全体的な構造の決定 • 要約の修辞構造をプランニング • 一貫性表現
文プランニング • メッセージ集約 • メッセージから文への写像 • 複数メッセージ → 単一文 • 単一メッセージ → 複数文 • 語彙選択 • 意味表現中の特定の概念を表す語句を選択 • 固有名詞,定名詞句,不定名詞句,代名詞などの参照表現のタイプを選択
表層的表出 • 注釈づけされた表現を受け取り,文を生成
文章生成の応用 • 文書作成 • 技術文書 • 特許申請書 • マニュアル • 健康管理レポート • 対話システム • 要約システム
今後の課題 • 知識の獲得 • 人手 → コーパスからの自動獲得 • 知識ベースやモジュールの再利用 • 領域依存性 • 評価基準,評価 • 主観的な評価(人間による) • 客観的な評価(計算機による)