概要
物体検知やセグメンテーションは今まで学習した画像認識より複雑なタスクになる
モデルの精度を測定するためには適したデータセットを選択する必要がある
また性能を評価する指標も理解する必要がある
物体検知のフレームワークは色色あるため用途によって選択する
この章では以下の項目を学んだ
・物体検知・セグメンテーションの基本
・代表的なデータセット
・評価指標
・物体検知のフレームワーク
・SSD
・その他の工夫
物体検知・セグメンテーションの基本
物体認知タスクは以下のように4つに分けることができる。
また、一般的な物体認知における出力では「物体の位置」+「その物体が何%であるかの確率」を表現する
代表的なデータセット
代表的なデータセットは以下のようなものがある
評価指標
物体検出においてはクラスラベルだけでなく物体位置の予測精度お評価する必要がある
評価指標としてはIntersection over Union(以下、IoU)、Average Precison(以下、AP)があり以下のように評価できる
IoU
AP
課題としては5枚の写真があり、すべてに1台の写真が写っているとする。APの計算は以下のようになる
11点で代表点をとると以下のような計算になる
これは「人」に対するAPなので全ての対象に対するAPの平均mAPは全対象のAPを足してクラス数でわる
物体検知のフレームワーク
SSD(Single Shot Detector)
VGG-16をベースネットワークにしており、ベースネットワークから全結合層を取り切り、畳み込み層を追加したもの
デフォルトボックスをたくさん用意してデフォルトボックスで予測したスコアと位置を正解ボックスの位置とラベルを比較しながらデフォルトボックスを修正して正解ボックスに近づけていく
特徴マップのサイズを変更していくことで、サイズの異なる物体を検出することができる
その他の工夫
Non-Maximum supprssion
Hard Negative Mining