モノを認識する(物体認識)
モノを認識する(物体認識)
AIを活用した動画・画像解析によるモノを認識する物体認識技術が注目されています。人の目の代わりとなり、例えば自動運転における障害物の発見や点検・検査作業の手間を軽減する、精度をあげる、ひいては作業を機械に代替させるなど業務の効率化・自動化に貢献しています。
従来の技術では検出したい物体のパターンを事前に準備する必要があり、汎用性と精度を兼ねた実用化が難しいものでした。しかし、近年ではAI技術の発展によりより汎用的に、高い精度で検出が可能となってきました。
具体的にモノを認識する(物体認識)とはどのようなものでしょうか?
物体認識とは
物体認識とは、画像の中から何らかの物体が映っていると思われる領域を切り抜き、その領域に映っている物体が何であるのかを説明することです。
具体的にはどういうことでしょうか?例えば、写真の中から鳥が映っている領域を抽出することで3羽の鳥がいることが分かります。
図1. 物体認識のイメージ [1]
物体認識の活用例
物体認識の具体的な活用例にはどのようなものがあるでしょうか?
業種・分野別での活用として、いくつかの例を挙げてみましょう。
・製造現場
- 課題:検査員の人手不足
- 活用:出来上がった物体の写真の中から不純物を検出
- 結果:検査にかかる手間を低減
図2. 製品検査のイメージ
・小売業
- 課題:商品の欠品のタイミングが分からない
- 活用:商品棚の画像の中から商品を検出してカウント
- 結果:商品が欠品になるタイミングが分かり、補充が容易に
図3. 小売業のイメージ
・施設管理
- 課題:施設への侵入などの異常事態を検知したい
- 活用:監視カメラ画像から物体を検出
- 結果:あるべきでないものが映っていないか確認
図4. 施設管理のイメージ
・清掃現場
- 課題:収集されたゴミの中から金属ゴミを見つけ出して排除したい
- 活用:収集されたゴミの中から金属ゴミを検出
- 結果:検出された金属ゴミを排除
図5. 清掃現場のイメージ
AIはどのように物体認識を行うのか?
ここまで、物体認識の用途を見てきたところで、それを実現するAIについて触れていきましょう。
AIがどのようにして物体認識を行うのでしょうか?
「学習」「入力」「処理」の3点からAIの仕組みを理解していきましょう。
- 入力
物体を認識するためには、対象の物体がどのようなモノであるかを知っておく必要があります。事前に用意した教師データ(画像)から検出したい物体がどのような特徴を持っているか学習させます。
- 処理
AIは入力された画像を以下のように処理します。
1. 入力された画像を処理し、「画像に写っている物体を囲う四角い領域」 (BoundingBoxと呼びます)を取り出します。(領域提案)
2. 取り出したBoundigBoxを画像から切抜き、写っている物体がどの物体であるか推論します。(クラス分類)
※推論した結果が学習した物体ではなかった場合、何も映っていないものとします。
このようにして、AIは物体が映っている領域と何が写っているかを認識しています。
昨今では領域提案とクラス分類を同時に行うことによって、高速化し精度を高めた手法も提案されており動画の処理などリアルタイムに近い処理も実現可能となってきました。
図6.画像内の物体認識を行っている例 [1]
まとめ
物体認識によって、機械が画像の中から物体を見つけ出すことができます。機械が自律的に業務をおこなうためには、どのような物体が視界内に存在するのか認識することが重要な要素であるといえるでしょう。
物体認識から他のAIに結果を渡すなど技術の組み合わせによって、今後新たなサービスの展開が期待できます。
■参考文献
[1]Ross Girshick, Jeff Donahue, et al, "Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5)", arXiv:1311.2524, 2014.