|
ディープラーニング・AI |
IT TERMS INFORMATION
2016-No.1 |
|
|
|
|
|
|
■ 「ディープラーニング」と機械学習、ニューラルネットワーク |
「ディープラーニング」(Deep Learning、深層学習)は、いわゆる「機械学習」と呼ばれている分野に属する手法のひとつです。この「機械学習」とは、人間が通常行っているような学習能力と同様の機能を人工知能で実現しようとするもの、といえばよいでしょうか。コンピュータに入力されるさまざまなデータ集合のなかから、その傾向や規則、表現、判断の基準などといったルールをアルゴリズムで学習し、それ以降の判断を機械自身が行えるようにするもので、従来の技術では難しかった画像、音声、自然言語などの複雑な現象を、高い精度で予測・解析することを目指しています。
また、ディープラーニングのベースとなっているのは、機械学習の分野で扱われる「ニューラルネットワーク」という計算アルゴリズムの一種で、人間の脳の神経回路をモデル化した「人工ニューロン」を階層的な構造に配置したネットワークです。入力層、中間層、出力層に分かれ、これらの層をデータが通過することで処理されて、出力結果が生成されます。中間層が多い(=深い)ほど扱うパラメータ数が増え、学習の難易度も上がってきます。
この「ニューラルネットワーク」を活用した機械学習手法が「ディープラーニング」と呼ばれ、1対1の機械学習方式に比べ効率よく高度な処理ができるというメリットなどから脚光を浴びているのです。インターネット経由で大量のデジタルデータを容易に取得可能になったことや、高機能な汎用なハードウェアの登場が、その背景と言えます。
■ 画像・音声認識、自然言語処理における「ディープラーニング」の応用 |
「ディープラーニング」の活用が現在最も期待されているのは、画像認識、音声認識、自然言語処理といった分野です。
画像認識の分野では、複数の米大手クラウドサービス企業やメディア等が、ウェブ上での画像検索サービスに活用しています。色、形状、質感、全体像など複数の特長を抽出してコンテンツそのものを直接認識することで、従来のテキストによるタグ付けのみに比べて、大幅な検索精度の向上に貢献しています。
また、音声認識の分野では、音声波形解析と音素の単語へのあてはめ(音響モデル)、単語の組み合わせの最適な割り出しと文の推定(言語モデル)といった処理を通して、声を使ったデバイスの操作や自動翻訳システムなどへの応用が考えられます。現在市場で販売されているスマートフォンやタブレット、ウィジェットなどで、すでに実装されているものがいくつかあります。
自然言語処理とは、人間が普段使用している自然言語のテキスト情報を基に、意味の抽出や変換などをコンピュータに処理させる技術です。文章の自動要約や翻訳、ニュースなどのトピックの分類、質疑応答といった部分で、「ディープラーニング」の活用が期待されています。たとえば、膨大な数の記事をウェブ上で収集してテキスト情報を分析し、自動的にカテゴリ分けするなどといった、ニュース閲覧用アプリの処理などで実際に用いられています。
「ディープラーニング」は日々発展を遂げており、処理も高度化しています。たとえば言語分野などでは将来的に、コンピュータに対して文章によって指示を出す、膨大な文書の中からコンプライアンスに違反しているものを探し出す、手書き文字を理解・判別して分類を行うなどのことが実現していくと考えられます。また、自動車関連分野においても、車が障害物を認識して衝突しないよう制御する機能など、自動運転への応用研究が進められています。センサーなどと連携して、医療や介護、ロボット、設備保守、建設などといった分野の技術と「ディープラーニング」が結びつくことで、製品・サービスの付加価値が大きく向上することが期待できます。
■ニューラルネットワークによる画像認識
|