人工知能を理解する(Vol.1)

2018.01.12 株式会社システムインテグレータ

はじめに

このブログは、人工知能に関する技術をぱっとまるわかりするための連載です。これから人工知能や機械学習について勉強しようという技術者をペルソナ（想定対象）としていますが、すでにAI技術を学んでいる人でも役に立つ内容にしています。

世の中に人工知能の情報があふれるようにありますが、断片的に情報に触れるだけではなかなか実像が見えてきません。そこでこのブログでは、人工知能に関する知識や技術をきちんと整理して体系的に理解できるようにします。できるだけ数式を使わず、シンプルにわかりやすく説明して、技術者以外の人でも「なるほどそうなのか〜」と理解できるように書いていきますね。

人工知能の全体像(AI Overview)

最初にディープラーニングを支える技術基盤はどのようになっているかBirds Eyeで理解しましょう。図1は現時点における人工知能関連技術の全体像（Overview）です。大きく4つの層で構成されていますので、下から順に説明しましょう。人工知能の全体像(Overview)

図1：人工知能の全体像(Overview)

(1)ハードウェア（チップとサーバー）

最下層は、ハードウェアです。ディープラーニングのニューラルネットワーク演算に求められる高速処理は、もはやCPUだけでは対応しきれないため、GPUやFPGA、ASICといった高速処理チップが使われています。

また、AIサービスの多くはクラウドコンピューティングで提供されていますが、IoTの普及とともに最近注目されているのがエッジコンピューティングです。IoTエンドポイント（端末）からは大量のデータが連続発生しますが、これらを利用したディープラーニング計算処理をインターネットを介して処理していると通信が増えてネットワークコストやクラウド料金が膨れ上がる上に、処理速度が遅くなってしまいます。そこでユーザーの近くにエッジサーバーを設置してその上で人工知能を働かせるのです。

(2)機械学習ライブラリ（フレームワーク）

第2層は、機械学習（Machine Learning）を行う仕組みを持ったライブラリです。ハードウェアが車のボディだとすれば、こちらはディープラーニング車のエンジンのようなものです。

ライブラリはフレームワークとも呼ばれることも多く、どれもオープンソースで無償提供されています。チュートリアルも充実していますので、我々エンジニアは手軽にこれらを利用してディープラーニング学習モデルを作成することができます。

(3)人工知能プラットフォーム

ライブラリを使って画像認識や音声認識などの学習を行い、目的別にユーザーが利用しやすいサービスとして提供しているものが人工知能プラットフォームです。ほとんどのAIプラットフォームはクラウドをベースとした有料サービスです。例えばGoogle Cloud Machine Learningでは「画像認識」「動画分析」「音声認識」「機械翻訳」「自然言語理解」などのAIサービスを提供しています。

[RELATED_POSTS]

(4)人工知能アプリケーション

ライブラリを使って自ら機械学習させたり、AIプラットフォームが提供するサービスを利用したりして、人工知能を活用したアプリケーションが爆発的な勢いで広がっています。

例えば「画像認識」を使った「異常検知・予測」、「自然言語理解」を使った「パーソナルアシスタント」、「テキスト分析」を使った「ナレッジ」＆「検索」というように、さまざまなAI技術を組み合わせてさまざまな人工知能利用アプリケーションが続々と誕生しています。

ディープラーニングの歩み

今回の人工知能の盛り上がりは、2012年の２つの出来事をきっかけに始まりました。1つは2012年6月にGoogleが猫を認識できるAIを開発したと発表したことです。これまで用いられてきた機械学習のアルゴリズムに代わって深層学習（ディープラーニング）という新しいアルゴリズムでAIが自然に猫を認識（教師なし学習）したことは多くの専門家にインパクトを与えました。

もう1つは同年10月にカナダのトロント大学が、ILSVRCという画像認識コンテストにおいてAlexNetというニューラルネットワークを使って２位の大差を付けて優勝したことです。これでいっきにディープラーニングの威力が世界中に広まり、AI研究の世界が一変しました。

図2にその衝撃以降のディープラーニングの発展具合をまとめています。翌2013年にはさっそくハード、ライブラリ、AIプラットフォームそれぞれの層で新たな成果が出ています。NVIDIAがディープラーニングにGPUを使った効果を発表し、バークレー大学がCaffeというライブラリを開発し、IBMがWatsonを公開しているのが2013年です。

2015年になると、ニューラルネットワークのライブラリが続々登場してきました。FacebookがTorchをサポートし、現在、世界で人気の高いKerasやTensorFlow、日本のChainer、中国のPAIが公開されたのもこの頃です。ライブラリの拡充は2016年も活発で、MicrosoftがCNTK（そののちCognitive Toolkitに改名）を公開し、Amazonもmxnetのサポートを公表しています。

ライブラリの拡充に１年遅れる感じでビッグカンパニーを中心としたAIプラットフォームが続々花開いています。2015年にAzure Machine LearningとAmazon Machine Learning、翌2016年にはGoogle Cloud Machine LearningやSalesforce Einstein、Oracle Intelligent Applications、そして2017年になってNVIDIA GPU CloudやApple Core Machine Learningなどが発表されています。

そして、あまりに多岐にわたるので図2には載せていませんが、AIを活用したアプリケーションがまさに爆発的に誕生しつつあり、加速度を付けて広がりつつあるのが現状です。ハード、ライブラリ、プラットフォーム、アプリケーションの各階層が、多少の時間軸のずれを持ちながら、拡充・進化を続けているのが今の人工知能(AI Now)なのです。

ディープラーニングの歩み

図2：ディープラーニングの歩み

まとめ

Vol.1では、AIを構成する技術基盤を4つの階層に整理して全体像を把握しました。また、2012年のビッグバン以来のディープラーニング関連製品・サービスの発表を時系列に並べ、これまでの歩みを理解した上で今現在どのような状態にあるかをイメージできるようにしました。次回は、最下層のハードウェアについて、もう少し詳しく説明します。

梅田弘之株式会社システムインテグレータ：Twitter @umedano