220 likes | 534 Vues
動的再構成可能プロセッサを 用いた画像処理. 情報工学科 阿部研究室 0411115 渡辺 良亮. 発表の流れ. はじめに 動的再構成プロセッサ 画像フィルタ 評価実験と考察 まとめ. はじめに. ディジタル画像は様々な要因により劣化してしまう。 劣化要因等の不要な情報を抑制し、有用な情報を強調する処理などの修正が必要になる。 このような処理は計算に時間がかかる。 近年ではモバイル機器などで画像処理を行うようになり、処理を低コストで高速に行いたいという欲求がある。. はじめに.
E N D
動的再構成可能プロセッサを 用いた画像処理動的再構成可能プロセッサを 用いた画像処理 情報工学科 阿部研究室 0411115 渡辺 良亮
発表の流れ • はじめに • 動的再構成プロセッサ • 画像フィルタ • 評価実験と考察 • まとめ
はじめに • ディジタル画像は様々な要因により劣化してしまう。 • 劣化要因等の不要な情報を抑制し、有用な情報を強調する処理などの修正が必要になる。 • このような処理は計算に時間がかかる。 • 近年ではモバイル機器などで画像処理を行うようになり、処理を低コストで高速に行いたいという欲求がある。
はじめに 低速 , 低コスト • 汎用プロセッサ • 動的再構成可能プロセッサ • FPGA • ASIC 高速 , 高コスト
はじめに • ノイズ除去にはメディアンフィルタと呼ばれる方法があるが、この手法を画像へ施すとぼやけてしまう。 • ぼやけた画像に対してラプラシアンフィルタを施し、エッジ強調を行う。 • 2種類のフィルタを動的再構成可能プロセッサへ実装し、速度とコストの評価を行う。
動的再構成可能プロセッサ • 動的再構成可能プロセッサ (Dynamically Reconfigurable Processor, DRP) デバイス内部に複数のハードウェアの構成情報を保持し、それを高速に切り替えることで動的に再構成させる技術。 • 実行中の回路を短時間に切り替えることができる。 • 二種類の画像フィルタを切り替えて実装する。
DAPDNA-2 • DAPDNA-2 IPFLEX社の開発したDRP。 RISCプロセッサDAPと並列処理エンジンDNAから構成される。 • DAP(Digital ApplicationProcessor) DAPは5段のパイプライン構成をとり、周波数は166MHz である。 • DNA(Distributed Network Architecture) 構成を動的に変更可能なPE(プロセッシングエレメント) マトリックスとその構成情報を記憶するDNAコンフィギュ レーションメモリから構成される。
動的再構成 1クロックで 再構成可能 バンク を選択 フォアグラウンド・バンクは実際に回路が構成される場所 PEマトリックスに マッピングされる バックグラウンドバンク から回路データをロード
メディアンフィルタ(1) • メディアンフィルタは目的画像の輪郭をなるべくぼかさないようにノイズを除去するよう考えられた手法。 • しかしこの手法はエッジの集中している部分に施すとぼやけてしまうという欠点がある。
メディアンフィルタ(2) 数値はピクセル値。 この場合「10」というピクセル値だけが他のピクセル値 よりかなり大きい。これはノイズと考えられる。 9つの値の中央値をピクセルの真ん中の値に上書きする。
ラプラシアンフィルタ • ラプラシアンフィルタは画像の先鋭化に使用されるフィルタである。 • 微分演算により画像の輪郭抽出を行いそれを画像に付与する。
ラプラシアン演算 3×3のピクセル値を取り出し下図のフィルタ値を中心画素および近傍画素に対して係数として乗算し、和を求め、中心画素に上書きしてやる。 フィルタ値 ピクセル値 出力値 -1×3 -1×3 -1×4 -1×4 +5×6 = 16
実験方法 • 256×256画素のノイズ入り画像へフィルタリング処理を行う。 • 開発ツールDNA Designerを用いて回路を描く。 • それぞれのフィルタ、また動的に切り替えて処理を行ったものの実行時間を計測する。比較として汎用プロセッサCore2Duo(周波数2.67GHz,メモリ4GB)に同様の処理を実行させ時間を計測する。
実験方法:フィルタの動的切り替え 回路1 回路2
考察:処理速度について • DAPDNA-2の実行時間を見ると、動的再構成させたものは2つのフィルタ処理の時間を足し合わせたもの。動的再構成の時間は1μsecの精度で無視できることがわかる。 • メディアンフィルタは汎用プロセッサに対して83.8倍と高速になった。ソート部で差が出ると考えられる。 • 対してラプラシアンフィルタは4.51倍程度であり、それほど速度向上は見られなかった。
考察:入出力処理について • DNAは入力を行っている際に演算や出力を並列的におこなう。 どちらの処理においても入力がほぼ全体の時間を占めていることが実験からわかった。両アプリケーションとも入力数が同じであるため、両フィルタとも実行時間が同程度となった。
考察:面積と消費電力について • FPGAなどに実装する従来法では、それぞれの処理A,Bに回路面積SA,SB、計SA+SBが必要。 一方動的再構成することによる面積は max{SA,SB}でよいので面積コストが削減できる。 • 動的に再構成する場合は実行中の回路以外からのリーク電流が存在しない。
まとめと今後の課題 • ノイズ入り画像にメディアンフィルタとラプラシアンフィルタを逐次的に適用することでノイズ除去を行いかつ画像の先鋭化を行った。 • DRPにそれぞれの処理を行う専用回路を実装し、PEを再構成することで回路を切り替えて処理を行わせた。 • 汎用プロセッサに比べ大きな速度向上が得られた。 • 面積削減、消費電力についても考察した。 • データの入力が実行時間のほぼ全体を占めているため、今後は入出力ポートを増やすなどの改善が考えられる。