AIによる行動認識
AIによる行動認識
AIを活用した動画解析で人の動きを捉える行動認識技術が注目されています。商業施設における不審者の発見、点検作業者の動作確認やスポーツ育成支援など、さまざまな場面でAIの活用が進んでいます。
従来の技術では、これらを実現するために多種多量の情報を高度かつ複雑に処理する必要があり、汎用性と高精度が求められる実用には多くの課題がありました。しかし、近年ではAI技術の進化に伴い少しずつ実用化されてきています。
具体的に、行動認識(人の動きを捉える)とはどのようなものでしょうか?
行動認識とは
行動認識とは、映像(動画)から人など動く物体の行動を認識することを示します。
具体的には、一つ一つの動作を認識し、その情報を元に姿勢、領域、背景などの推定を行うことで、それらの組み合わせから行動を予測することです。人は、歩いたり、走ったり、転んだりしますが、例えば、人が転ぶと歩いている状態から足の向きが変わり、腰や頭の位置が低くなり、地面に手を付いたりします。その時の手の動きにフォーカスすると、体の横にあった腕や手が体から離れて、曲がっていき地面に付くまでを(それ以外に頭や腰の位置が低くなり、体の向きが変わるなど)認識することで、動作の領域や、一連の動作の組み合わせを推定することでどのような行動であるかを推定できます。
図1. 動作推定のイメージ [1]
AI 行動認識の活用例
それではAIによる行動認識の具体的な活用例はどのようなものがあるでしょうか?
業種・分野別での活用としていくつかの例を挙げてみましょう。
・製造現場
- 課題:生産計画通りに仕上がらない
- 活用:作業者別の作業工程を認識し、それぞれの所要時間を比較
- 結果:作業に要する工程ごとの遅延時間を見える化
図2. 製造現場のイメージ
・作業現場 - 身体負荷の大きい動作を検出(労災管理)
- 課題:労働災害を減らしたい
- 活用:作業時の身体負荷の大きい動作を検出
- 結果:作業負荷の大きい工程と労災との関連を比較
図3. 作業現場のイメージ
・スポーツ - プロスポーツ選手の動作を検出(育成支援)
- 課題:アスリートの育成を支援したい
- 活用:プロスポーツ選手の骨格および詳細な動作を検出
- 結果:選手のフォームや姿勢などを分析し、育成を支援
図4. スポーツのイメージ
これらはほんの一部の例ですが、今後増々多くの業種や分野での応用が期待できそうです。
次にAIはどのように行動認識を実現しているのか、具体的に見ていきましょう。
AIはどのように行動認識を行うのか?
AIの行動認識では、AIがどのような情報を、どのように処理して、それぞれの動作を推定するのでしょうか?
ここでは、「入力」と「(内部)処理」の2点から行動認識におけるAIの仕組みを理解していきましょう。
- 入力
AIで行動認識を行うのに必要なのは動画(映像)データです。動画は、秒など時間単位のフレームで構成される画像です。AIが受け取った画像は、後述の内部処理である「学習」「推論」において利用されます。行動認識は、さまざまな個々の動作を認識することによって成立しますが、画像からいろいろな動作を学習し、それによって何の行動かを推論してもらうためにAIによる行動認識では動画、画像データが非常に重要となります。倉庫での作業現場を例とした場合、荷下ろし、積み上げなどの各作業において手足、体のさまざまな部位の動きを捉えた一連の画像(動画)を準備し、AIに取り込んでいくことにより、個々の部位や動作の特徴を学習すると、これは倉庫での荷下ろし(積み上げ)を行っているということがわかる(推論できる)とうになります。
- 内部処理
人もAIもモノを認識して識別するには学習を行う必要があります。行動認識におけるAIの学習とは、それぞれの動作を覚えることです。画像認識系のモデル(CNN:畳み込みニューラルネットワーク)をベースに構築されたネットワークアーキテクチャ(簡単に言うとAIの設計思想のようなもの)を用いて、人間の骨格から関節など部位の位置推定や部位同士の関係性を算出し動作を学習します。また昨今では、これらの問題点を緩和するOpenPose―人間の骨格や部位などを覚えた学習モデル(知識集のようなもの)―という技術が汎用的に公開され、ゼロから学習させなくてもいいAIの学習モデルが利用できるようになりました。OpenPoseがなかったときには、人の姿勢、大きさや人数によっては学習や識別のための計算負荷が大きくなりリアルタイムで処理することが難しいケースもありました。
図5. Open Poseを用いてさまざまな人物の姿勢を推定している例 [1]
AIの行動認識技術はさまざまな産業や分野で活用されてきています。産業への応用を考える際は、AIからの認識、識別結果を出力するためにさまざまな機器、装置との連携が重要なテーマとなります。
さらに今後、5Gの普及によるサービス革新や発展の著しいIoT技術と併用するなど、AIとの技術の組み合わせによりビジネスや生活におけるさまざまなシーンが大きく変わることが期待されます。
■参考文献
[1] Zhe Cao, Gines Hidalgo, et al , “OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields”, arXiv: 1812.08008, 2019.