ナイトセッション(3件並列) 10/30 19:00-21:00
■セッション1
タイトル「KTAソフトウェアの手引き」
講演者: 中條健(東芝)
概要
KTA Softwareは、ITU-T SG16/Q.6 VCEGで、次世代の動画像符号化検討に向
けてKTA(Key Technical Area)の符号化技術として集められた動画像符号化
/復号化ソフトウェアである。このソフトウェアは、H,264/MPEG-4 AVCの参
照ソフトウェアであるJM Softwareから派生していて、C言語で記述されて
いる。このナイトセッションでは、新しい動画像符号化技術の研究開発に
挑戦したい方を対象に、KTA Softwareを実際にどのように使いこなせばよ
いかの手引きをする。具体的には、ソフトウェア及び関連情報の入手方法、
テスト条件、性能の評価手法、実際にソースコードに手を入れるにあたっ
ての技術的な注意点等について述べるとともに、KTA Softwareに実装され
ている新しい符号化技術やその性能について紹介する。
■セッション2
タイトル「視覚認知の脳機能メカニズム」
講演者: 安藤広志(NICT)
概要
人間は、我々を取り巻く視環境を過去の経験・学習に基づき素早く理解し、
聴覚や体性感覚からの情報も統合して、的確な状況判断と行動を可能にする
極めて優れた知覚認知システムを有している。人の脳の知覚認知メカニズム
の解明は、脳科学・認知科学において重要な課題であるばかりでなく、高度
な人工知覚システムの開発やシステムに対する人の認知・感性特性のより客
観的・定量的な測定評価技術の確立に役立つと考えられる。本講演では、視
覚認知の脳機能メカニズムを探るための心理物理実験、神経計算モデル、fMRI
脳活動分析等のアプローチを概説するとともに、我々の研究チームが進めて
いる、3次元物体認知、視覚・聴覚・体性感覚(触覚)統合、3次元動体予測、
質感(光沢感)知覚等の脳メカニズム解明とその技術的応用に向けた研究に
ついて紹介する。
■セッション3
タイトル「一般物体認識のための局所特徴量(SIFTとHOG)」
講演者: 藤吉弘亘(中部大)
概要:
一般物体認識問題として画像分類や物体検出の研究が盛んに取り組まれている。
画像分類で用いられているBag-of-Keypointsというアプローチでは、局所特徴
量として勾配情報から算出されるSIFT(Scale Invariant Feature Transform)
が用いられている。SIFTは、スケール変化、回転変化に不変な特徴量を記述す
ることができるため、特定物体認識だけでなく画像分類の特徴量として有効で
ある。一方、歩行者認識等の物体検出においても、局所特徴量として勾配情報
から算出する勾配方向ヒストグラムHOG(Histogram of Oriented Gradients)が
用いられている。本チュートリアルでは、勾配情報から得られる局所特徴量と
してSIFTとHOGのアルゴリズムについて紹介し、一般物体認識への利用方法につ
いて講演する。