つぎに,シーンから得られる情報量を定義し,情報量の大きい部分を注視するシ ステムを実現する.従来のシステムでは,シーンの注目領域を表すsaliency mapをヒューリスティックに決定していた.その代わりに,本システムでは,情 報理論に基づいたinformation mapを用いている.このように,情報理論を基礎 にしている点が,本システムの特徴であるといえる.
移動物体の追跡システムは,防犯装置やテレビジョン放送の分野で幅広い応用が 考えられる.また,シーン内の情報量の大きい部分を注視するシステムは,距離 の離れた,あるいは,危険な場所で働くロボットの視覚として有用である.また, 背景テクスチャの撮影など,コンピュータビジョンだけでなくコンピュータグラ フィクスの分野にも応用が考えられる.
人間の視覚が不均一な解像度を持っているため,人間がシーンを観測する時,高 解像度の中心視野を有効に活用するために注視位置を移動し,シーンから必要な 部分を順に選択し詳細な観測を行なう.このとき視点の移動は,興味のある対象 に向けられると言われている.また,被験者に与えられた観察のタスクによって, 注視点の分布が変化することも知られている.さらに,被験者は,観察シーン中 の情報量の大きい部分を注視することも知られている.
人間の視覚は色,視差,動きといったさまざまな特徴を統合し,眼球を回転する ことによって,環境と相互作用し,環境の認識などのタスクを達成している.ア クティブビジョンの重要な問題点の一つに,どの部分に注視点を移動するかとい うことが挙げられる.本研究では,まず,移動物体に着目し,移動物体の追跡機 能を実現する.さらに,静止したシーンにおいて,定量的な尺度であるシーンの 情報量を提案し,情報量の大きい部分を選択し,注視するシステムを実現する.
実現したシステムを評価するため,実環境で追跡実験を行なった.図1に,人間 を追跡した結果を示す.その結果,移動物体を視野から見失うことなく追跡が成 功した.また,予測制御を用いて遅れのない追跡を行なう実験を行なった.移動 物体は,小型の電動模型自動車を用い,軌道レールに沿って走らせることによっ て,運動を規則的にすることができる.図2に,その追跡結果を示す.図中,赤 線は,移動物体の位置を表し,青線は,カメラの位置を表す.規則的な運動をす る移動物体は,予測制御を行なうことで遅れのない追跡が可能である.
図1 歩いている人間の追跡結果
図2 規則的な運動の追跡結果
システムを性能の面から評価すると,システムは実環境を移動する1つの不特定 の物体を追跡することができる.実験から200deg/sの速度までの物体を追跡する ことができることを示した.また,移動物体が1フレームの時間(33ms)に1ピクセ ル以上移動すると,その物体を検出することができることから,移動物体の検出 可能な最低速度は,2.4deg/sである.
そこで本研究では,特徴に理論的な裏付けを与えるため,シャノンの情報量によっ て,特徴を定量的に表現する手法を提案した.その情報量をさまざまな画像につ いて計算し,その特徴について考察した.その結果,シーンに多くの物体が含ま れると情報量が大きくなる傾向があることがわかった.さらに,特徴間の確率的 な従属性として存在する相互情報量についても実験により考察した.その結果, グラデーションのように複数の特徴が従属しているときに,相互情報量が大きく なる傾向にあることがわかった.
提案した情報量を用い,シーンの情報量の大きい部分を注視するシステムを実現 した.システムは,入力された画像を部分領域に分割し,その領域ごとの情報量 を計算し,情報量マップを作成する.これは,シーンのどの部分にどれくらいの 情報量が含まれているかを示す.システムは,情報量マップの大きい順番に,そ の部分をズームによって拡大して探索する.探索によって得られた画像は,解像 度を調節して,1枚の画像に合成される.
屋外,屋内のシーンを対象にし,明度,彩度,色相の情報量を切り換えて実験を 行った.図3に 屋内のシーンで明度の情報量を用いて合成した画像を示す.実験 結果から,システムは,シーンのより複雑な部分を選択的に注視し,システムが 扱う情報量を変更することによって,システムに異なったふるまいを持たせるこ とができることを示した.また,明度の情報量の場合,人間の視覚探索でのふる まいとある程度相関があることがわかった.
図3 合成結果(明度の情報量を使用)