画像・映像を中心としたマルチメディア認識技術 (情報学科 植木 一也)

画像・映像を中心としたマルチメディア認識技術

整理番号:2019-001


研究者名: 植木 一也(Kazuya Ueki)
所  属: 情報学部 情報学科 准教授
専門分野:人工知能、深層学習、機械学習、画像認識
キーワード:人工知能、深層学習、機械学習、画像認識、画像処理、映像検索

研究概要

画像・映像の取得,処理,出力に関する基礎研究から、人工知能分野の深層学習(ディープラーニング)など機械学習を用いたシステム応用まで幅広く扱う研究を遂行しています。

研究開発中のテーマ例 (一部)

大量映像データベースからの検索技術

現在、インターネット上の映像共有サイトには莫大な映像が存在しています。その中から必要となる映像を即座に検索するため、単にキーワードを利用した検索ではなく、クエリ文を使用した映像の詳細に検索する技術を研究しています(図1)。当研究室で開発したシステムは、米国国立標準技術研究所(NIST)主催の映像検索・評価ベンチマーク(TRECVID)において2年連続で世界1の検索精度を達成しました。

図1.クエリ文を使用した映像の詳細検索

セマンティックセグメンテーション技術の実応用

近年、ディープラーニングを使うことで、画像中のピクセルがどのクラスのオブジェクトに属しているかをラベリングする技術が大きく発展しています。この技術を用いて、様々な応用システムを検討しています。現在、航空写真からの災害地の復興状況の可視化、車載カメラ映像を用いて動物の急な飛び出しを検出するシステム、車の傷や凹みの検出、精密機器の欠陥検出に関する研究を実施しています(図2)。

図2.セマンティックセグメンテーション技術の実応用

少量データを用いた画像認識

現在、大量の画像サンプルをディープラーニングで学習することで、高精度な画像認識が実現できています。しかしながら、実際の場面において必ずしもデータが大量に収集できるとは限りません。そこで例えば、植物/動物等の図鑑に載っている画像のように、認識したい対象のカテゴリ数は多く、各カテゴリには1枚の画像しかないという環境下でも、撮影された画像がどのカテゴリかを認識できる手法について研究をしています。

応用例・用途

  • 画像認識を代表とする人工知能の分野の研究成果から製品開発のお役に立てることを期待しています。

特記事項

  • 研究・論文の詳細は研究室のホームページをご覧下さい。
    https://kenkyu.hino.meisei-u.ac.jp/ueki-lab/