氏名: 村上則明 (089831780)

論文題目: 組み込みシステム向きリップリーディング回路の設計


論文概要

近年、携帯電話、携帯端末、カーナビゲーションシステム などの組み込みシステム の普及により、キーボードやマウスのような 従来のヒューマンインタフェースに代 わる音声や画像による インタフェースが求められている。 このような組み込みシ ステムにおいては、低消費電力化、小型化などの 強い要望のため、高性能で消費電 力の小さい専用回路が必要である。

本研究ではユーザフレンドリな インタフェースとしてリップリーディング(読唇) に着目し、リアルタイムでリップリーディングを行う 専用回路の設計と試作を行っ た。 このリップリーディング回路は、サイズ256×256ピクセル、8ビットグレース ケール、 28フレーム/秒の 口唇映像から発話単語を最大8種類 認識する。 この回路 では、まず唇画像の輪郭抽出により特徴ベクトルを求める。 次に、特徴ベクトルを 量子化し、HMM(隠れマルコフモデル) の入力シンボルを生成する。 生成され た43個のシンボル系列に対してHMMに基づく認識処理を行い、 認識した単語に対 応するコードを出力する。 唇画像からの特徴抽出に、加減算のみによる濃度解析を 行い 輪郭を取得する手法を導入することで、 処理時間を短縮した。

また、本リップリーディング手法をC言語レベルの記述 で機能検証後、 Verilog-HDLで設計を行い、東京大学VDECの試作サービス を用いてローム0.35μm プロセス、4.9mm角のLSIと して試作を行った。 本LSIは40MHz動作でリアルタイム にリップリーディングを 行うことができ、同クロック周波数換算の Sun Blade 1000(UltraSPARC III 900MHz, Main memory 1024MB)と比較して、 約1.5倍高速であ る。

図:唇輪郭点抽出の結果

目次に戻る


提出時刻:2002/02/08 11:51:35