ディープラーニングの研究/物体認識①

物体を背景から切り出してクラス認識を行う「一般物体認識」について。

目次

AI・ディープラーニングの全体像

  • 人工知能
  • 機械学習
  • ディープラーニングの基本・応用
  • ディープラーニングの研究
  • AIプロジェクト
  • AI社会実装に伴う法律・倫理

一般物体認識とは

  • 画像認識→画像や動画から特徴をピックアップし、対象物を識別する技術
  • 人間:対象物を視覚で捉え、経験から理解し、判断
  • AI:画像をピクセルごとの色合い・明るさなどの集合体として捉え、大量の画像データで学習を行い、画像の被写体を認識するための特徴量を抽出する
  • 「一般物体認識(Generic Object Recognition)」→画像中の複数の物体に対して予測する技術
    複数の物体と背景とが画像にある場合、モデルは何を手がかりとし、どのような値を予測すればよいのか

一般物体認識のプロセス

  • 「物体検出/同定(Object Detection/Localization)」
    →画像の中で物体がどこにあるのか?、この領域は物体なのか背景なのか?
  • 「物体認識/分類(Classification)」
    →どのクラスに属する物体なのか?
  • 物体候補をウィンドウで囲み、各ウィンドウ中の物体を、クラス予測用の分類器に渡し、画像認識を行う
  • 物体でない場合は背景と認識する

物体検出

  • 「物体検出」画像に写っている物体の位置とカテゴリ(クラス)を検出する手法の1つ
  • 「関心領域(ROI;Region of Interest)」→物体が存在しうる候補領域
  • 各物体を、「バウンディングボックス(Bounding Box)」という長方形で囲み、位置(関心領域)を切り出す
  • 入力された画像において、すべての候補領域を洗い出す候補領域を画像分類器に入力する
R-CNN・物体候補領域の検出に、「Selective Search」を用いる
Fast R-CNN・R-CNNを高速化した改良版
・全体に対して一度のみCNNを適用する
Faster R-CNN・領域の切り出しと物体認識を同時に行うことで高速化を実現する
SSD
YOLO

この記事が気に入ったら
いいね または フォローしてね!

  • URLをコピーしました!
目次