「教師データなし」で異常検知は可能か?

 2021.07.21  株式会社システムインテグレータ

教師データなしで異常検知は可能でしょうか。これはディープラーニングの課題の一つです。教師データがあると、それをもとに正しさを判定することや、異常検知をすることが可能です。しかし「教師データがない」場合にも異常検知は可能でしょうか。 

今回は教師データあり・なし学習と、教師データなしで異常検知が可能かどうかについて詳細に解説します。

機械学習における学習方法の種類

教師あり学習とは

AIは機械学習を行うことによって、様々な判断を行うことが可能となっています。顔認証しかり、画像判定しかり、物事の「正解」や「間違い」のデータを人間が事前にラベリングして、そのデータを学習させることで、AIは学習を行うことができます。すなわち、教師あり学習とは、「正解」「間違い」などのラベリングされたデータを与えて学習させることにつきます。 

教師なし学習とは

AIにおける教師なし学習とは、「正解」データなしで学習し、正常・以上の判断をする学習法です。正解データなしでも学習を行えることが、教師なし学習の大きな利点です。違いについて順番に解説していきます。 

ここまでの話から分かるように、人間がラベリングした「正解」「間違い」などのラベリングされた膨大なデータがない状態で、学習を行うことができるのが「教師なし学習」です。 

なぜ教師なし学習が求められるのか

「教師なし学習」を求められるのは、そもそも人の手で正しいデータを用意することが難しい場合や、極端に「正解」「間違い」のデータが少ない場合、「正解」と「間違い」の判断基準があいまいな場合などが挙げられます。

例えば1000万人に1人しかならない病気を発見するためにはどうすれば良いのでしょうか。従来の「教師あり学習」で判別しようとする場合は大量のデータが必要となってきます。しかし、そのような稀有な例に対して、比較するための十分なデータが集まるとは限りません。つまり、教師なし学習ができるようになれば正解がない課題に対して課題を発見できる可能性があるといえます。また、導入に関していえば、正解を準備する手間が省けるのは人間にとっても都合が良いといえます。 

教師なし学習ができるようになることで類似性や特徴の抽出などが容易にできることが想像可能です。そのため、AIには教師なし学習ができることが求められているのです。 

異常検知で教師なし学習が重要な理由

さて、実際に異常検知において、「教師なし学習」が重要なのはなぜでしょうか。

製造業を例において考えてみましょう。製造業では当然ですが、不良品を極力出さないように厳しく品質のチェックを行っています。不良品を出荷してしまうと、信頼の損失や取引の縮小につながるからです。 

不良品が出ないようにものづくりを行っているということは、一方でAIに学習させるための「異常」のデータを判定できるほど十分に集めることが難しい環境にあるとも言えます。そのような業界に対して「教師あり学習」のAIを持ち込んだところで、異常検出の精度が高くなるとは決していえないでしょう。 

AIを導入しても異常検出ができなければ、そこにかかったコストや実際の異常の精度もたかが知れています。つまり教師なし学習ができなければ、異常検知するための十分な学習を行うことができなくなってしまうのです。 

製造業などのものづくりの現場では、対象製品に異常がないかを検査するための人員が存在しますが、それらすべての人が完璧な異常検知をすることができるとも限りませんし、コストもかかります。このような課題に対し、教師なし学習は重要なファクターといえるでしょう。 

「教師データなし」で異常検知は可能か

では「教師データなし」の状態で、異常検知は可能でしょうか。結論からいうと、可能です。

今まで「異常」にばかり目を向けていましたが製造業では異常な製品を極力出さないことが重要であると述べました。つまり、これは「正常品」のデータは大量に存在していると考えることができます。 

GANというディープラーニングの技術によって、2つのニューラルネットワークは別々の仕事をこなすことができます。片方は正常データを学習し、識別が可能となっている状態、片方はデータを生成し、提供する役割を持っています。この状態で、まず正常データを大量に学習させることが大切です。 

これによって、正常データのクラスタリングが可能となり、人間の手で「正常」「異常」というラベリングは行う必要がありますが、正常以外のデータがきた場合には正しいデータを知っている識別ネットワークは異常を検知することができます。 

ただし、問題は最初から高精度・高信頼性を担保することができないという点です。これは正しいデータを持っていても微細な違いや異常データに関する学習が浅いため、結果的には人間による判定で微調整を行う必要があるためです。しかし学習が進んでいくことでなにが正常なのか、なにが異常なのかがはっきりと学習されることによって、精度や信頼性を上げることが可能となるでしょう。 

そのためには業務の現場に実践的に投入し、異常データが蓄積されていくことで、改善されることを待つしかありません。導入することで、実際の微細なデータを学習することが可能なため、最終的には、効率的かつ、教師データなしのAIによる判定が可能になるということができます。 

GANについてはこちらでも詳しく解説しています。
敵対的生成ネットワーク・GANを用いた異常検知とは?

AISIA-ADにおける学習

「AISIA-AD」ではディープラーニングを利用して正常・異常の判断を行うことが可能となっています。AISIA-ADはクラウド上に学習環境を置いており、ここに学習用の正常データや異常データを取り込むことで学習が可能です。AI学習モデル配信環境によって、クラウドで学習したデータを、現場の異常検知ラインのエッジデバイスに対して配信を行い、検知環境で使用します。 

新たな異常が発生すれば、異常検知監視サーバーに対して異常データの蓄積が行われます。このデータは定期的に、AI学習用データが環境に送られるため、クラウド上の環境においてAIは最新の異常データを取り込むことが可能なのです。 

これによって、異常データが少なくても工場ラインなどの実践に導入することでおのずと異常データを収集することが可能となり、結果的に正常と異常の外観検査を行うことが可能となります。結果的に教師データがなくとも、自然に収集される精度の高いデータによって、異常検知が行われるようになるのはもちろん、AIモデルや判断基準は柔軟に選択や設定が可能なため、必要に応じて適切な設定をすることが可能です。

まとめ

教師なし学習、教師あり学習、そして異常検知で教師なし学習が重要な理由、その詳細、そして外観検査を支えるソリューションの紹介について解説しました。様々な種類のAIを搭載し、ディープラーニングを駆使した外観検査システムAISIA-ADを用いることで、教師なし学習を行っていた場合でも、最終的には高精度・高信頼性のデータから、異常検知を自動化することができます。

企業や業務形態、工場ラインに沿ったAIの選定から、検出に必要な機能まで相談することが可能です。異常検知に課題を抱えている場合はお気軽に弊社までご相談ください。

CTA

RECENT POST「異常検知」の最新記事


異常検知

異常検知におけるディープラーニング(深層学習)の活用

異常検知

Metric Learning(距離学習)は異常検知にどこまで使えるのか?

異常検知

異常検出アルゴリズムの代表格「Isolation Forest」とは?

異常検知

マシンラーニングを使った異常検知に利用できるデータセットを紹介!

「教師データなし」で異常検知は可能か?