物体を背景から切り出してクラス認識を行う「一般物体認識」について。
目次
AI・ディープラーニングの全体像
- 人工知能
- 機械学習
- ディープラーニングの基本・応用
- ディープラーニングの研究
- AIプロジェクト
- AI社会実装に伴う法律・倫理
一般物体認識とは
- 画像認識→画像や動画から特徴をピックアップし、対象物を識別する技術
- 人間:対象物を視覚で捉え、経験から理解し、判断
- AI:画像をピクセルごとの色合い・明るさなどの集合体として捉え、大量の画像データで学習を行い、画像の被写体を認識するための特徴量を抽出する
- 「一般物体認識(Generic Object Recognition)」→画像中の複数の物体に対して予測する技術
※複数の物体と背景とが画像にある場合、モデルは何を手がかりとし、どのような値を予測すればよいのか
一般物体認識のプロセス
- 「物体検出/同定(Object Detection/Localization)」
→画像の中で物体がどこにあるのか?、この領域は物体なのか背景なのか? - 「物体認識/分類(Classification)」
→どのクラスに属する物体なのか?
- 物体候補をウィンドウで囲み、各ウィンドウ中の物体を、クラス予測用の分類器に渡し、画像認識を行う
- 物体でない場合は背景と認識する
物体検出
- 「物体検出」→画像に写っている物体の位置とカテゴリ(クラス)を検出する手法の1つ
- 「関心領域(ROI;Region of Interest)」→物体が存在しうる候補領域
- 各物体を、「バウンディングボックス(Bounding Box)」という長方形で囲み、位置(関心領域)を切り出す
- 入力された画像において、すべての候補領域を洗い出す→候補領域を画像分類器に入力する
R-CNN | ・物体候補領域の検出に、「Selective Search」を用いる |
---|---|
Fast R-CNN | ・R-CNNを高速化した改良版 ・全体に対して一度のみCNNを適用する |
Faster R-CNN | ・領域の切り出しと物体認識を同時に行うことで高速化を実現する |
SSD | |
YOLO |