1 / 27

音声・音響信号を対象とした ブラインド音源分離

音声・音響信号を対象とした ブラインド音源分離. 奈良先端科学技術大学院大学 猿渡 洋 sawatari@is.aist-nara.ac.jp. 本日の発表内容. ブラインド音源分離( BSS )研究の背景 独立成分分析( ICA )に基づく BSS の説明 時間領域 ICA 周波数領域 ICA 各領域 ICA の適用限界を実証 周波数領域 ICA と時間領域 ICA を統合した多段 ICA に基づく音源分離手法の提案 実環境下における分離実験結果および考察 まとめ. ?. 干渉音. ユーザ以外の干渉音がマイクロホンに混入. 音声認識精度の劣化. 背景.

walden
Télécharger la présentation

音声・音響信号を対象とした ブラインド音源分離

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 音声・音響信号を対象としたブラインド音源分離音声・音響信号を対象としたブラインド音源分離 奈良先端科学技術大学院大学 猿渡 洋 sawatari@is.aist-nara.ac.jp

  2. 本日の発表内容 • ブラインド音源分離(BSS)研究の背景 • 独立成分分析(ICA)に基づくBSSの説明 • 時間領域ICA • 周波数領域ICA • 各領域ICAの適用限界を実証 • 周波数領域ICAと時間領域ICAを統合した多段ICAに基づく音源分離手法の提案 • 実環境下における分離実験結果および考察 • まとめ

  3. 干渉音 ユーザ以外の干渉音がマイクロホンに混入 音声認識精度の劣化 背景 ハンズフリー音声通信・認識システム 今日の 天気は何? マイクロホン 音声認識システム ユーザ

  4. 背景(Cont’d) • 研究の目標 • 雑音に頑健なハンズフリー音声処理システム の実現 • マイクロホンアレー • 複数のマイクロホン素子から構成される受音器 • 目的信号の強調,雑音抑圧が可能 • マイクロホンアレー処理の欠点 • 音源の到来方位推定が必要 • 適応のために無音区間の推定が必要

  5. ブラインド音源分離 • 複数の音源信号が混在して観測される場合,観測信号のみから音源信号を推定する技術 • 独立成分分析(ICA)に基づく手法が主流

  6. 互いに 独立 既知  音源信号を推定 ICAに基づくブラインド音源分離 事前情報が不要(教師無し適応) おはよう 話者1 音源1 観測信号1 マイクロホン1 マイクロホン2 観測信号2 こんにちは 音源2 話者2

  7. <音声応用における課題> 残響に頑健なブラインド音源分離 アルゴリズムの構築 ブラインド音源分離 • 複数の音源信号が混在して観測される場合,観測信号のみから音源信号を推定する技術 • 独立成分分析(ICA)に基づく手法が主流 高残響(実)環境下では十分な性能が得られない (残響時間=0.3秒 ←2400 taps FIRフィルタ)

  8. 時間領域ICA(TDICA) 時間領域においてFIR型の音源分離フィルタを 推定 周波数領域ICA(FDICA) 周波数領域において各周波数帯域毎に音源分離フィルタを推定 従来のアプローチ

  9. <利点> • 信号自身が有する独立性を評価可能 • 最適点近傍での収束性に優れている TDICAに基づく音源分離手法

  10. TDICAの適用 • 一般の残響抑圧信号処理においては,フィルタ長を長くすることにより残響抑圧性能が向上する <仮説> TDICAにおいても,分離フィルタ長を長くする  ことにより,残響に頑健な音源分離が可能か? フィルタ長と分離性能の関係を調査

  11. 実験条件 素子間隔: 4 cm 残響時間: 300 ms • 原音声: 男女各2名による2短文 12通りの組み合わせ • 音源分離性能の尺度: 干渉音の抑圧量 [dB]

  12. <欠点> • 反復学習規則が複雑 • 残響環境下では収束性が悪い • 直接音,初期反射音成分の分離しかできない フィルタ長を長くしても 分離性能は向上しない フィルタ長と分離性能の関係

  13. f <利点> • 周波数変換することにより混合問題を簡単化 • 分離フィルタの最適化を安定かつ高い収束性で実現 FDICAに基づく音源分離手法

  14. FDICAの適用 • 一般の残響抑圧信号処理においては,帯域分割数(フィルタ長)を増やすことにより残響抑圧性能が向上 <仮説> FDICAにおいても,分離フィルタの帯域分割数を 増やすことにより,残響に頑健な音源分離が可能か?  帯域分割数と分離性能の関係を調査

  15. 過度に分割数を増やすと分離性能劣化 <新たな仮説> 帯域分割数を過度に増やすと狭帯域信号間の 独立性の仮定が成立しなくなる? 狭帯域信号間の独立性を定量的に評価するために, 帯域分割数と狭帯域信号間の相関値の関係を調査 帯域分割数と分離性能の関係

  16. <欠点> 帯域分割数を過度に増やすと狭帯域信号間の 相関が強くなり,独立性の仮定が成立しなくなる 帯域分割数と狭帯域信号間の相関値の関係 過度に分割数を増やすと相関が強くなる

  17. <欠点> FDICAでは帯域分割処理により十分な分離性能 に達しない段階で性能が飽和する 帯域分割数と分離性能の関係 相関低い 残響に強い 相関強い 残響に弱い 音源分離性能 帯域分割数 少ない 多い

  18. 利点 周波数変換により 混合問題を簡単化 反復学習における安定性,高速収束性 欠点 帯域分割処理により独立性の仮定が崩壊 分離性能が飽和 補う  補う  前段 後段 利点を共に有効利用 FDICAとTDICAを統合した 多段ICA(MSICA) by 西川 他, 2001 各領域ICAの利点・欠点 周波数領域ICA(FDICA) 時間領域ICA(TDICA) • 利点 • 信号自身が有する 独立性を評価可能 • 最適点近傍での収束性に優れている • 欠点 • 反復学習規則が複雑 • 残響環境下では収束性が悪い

  19. MSICAの分離過程 周波数領域ICA (FDICA) 時間領域ICA (TDICA) 混合システム • 混合問題を簡単化 • 反復学習における安定性,   高速収束性 • 信号自身が有する独立性を 評価可能 • 最適点近傍での高収束性

  20. 提案手法の有効性検証 • MSICAにおけるTDICA部のフィルタ長と分離 性能の関係を調査 • TDICA,FDICA,及びMSICAの分離性能比較

  21. MSICAのTDICA部では長いフィルタによる学習が可能MSICAのTDICA部では長いフィルタによる学習が可能 フィルタ長と分離性能の関係 9.4

  22. 提案手法の有効性検証 • MSICAにおけるTDICA部のフィルタ長と分離 性能の関係を調査 • TDICA,FDICA,及びMSICAの分離性能比較

  23. 各ICAの分離性能比較 12通りの平均: TDICA: 5.9 dB,FDICA: 9.4 dB,MSICA:12.1 dB

  24. 考察 • FDICAでは帯域分割処理により十分な分離性能に達しない段階で性能が飽和 • TDICAでは反復学習規則が複雑であるため長いフィルタによる分離が困難 • MSICAを用いることでTDICA,FDICAを上回る分離性能が得られた • MSICAは本質的にTDICA,FDICAの問題点を解決したといえる

  25. MSICAによる分離音声の一例 • 残響時間 300 ms • 混合音声(女性,男性) • 分離音声(女性) • 分離音声(男性) 女声 男声 -30° 40° 2素子 4cm間隔

  26. まとめ • 残響環境下における時間領域ICA(TDICA), 周波数領域ICA(FDICA)の適用限界を実証 • FDICAとTDICAを統合した多段ICA(MSICA)に基づくブラインド音源分離手法を提案 • TDICA,FDICA,及びMSICAの分離性能比較 • MSICAにおけるTDICA部では長いフィルタの学習が可能であることを確認 • MSICAの性能はTDICA,FDICAの性能を上回ることを確認

  27. 今後の課題 現在のICAではまだまだ長い残響に対応できない  ⇒音響信号処理の知見を有効に利用       空間情報(音源の方位,位置など)の利用 • 音声認識による性能評価 • さらに複雑な混合の分離問題に関する検討 • 雑音が付加された混合 • 3個以上の複数音源が存在する混合

More Related