企業のウェブサイトはもちろん、ニュースや新聞などでも機械学習という用語を目にする機会が多くなりました。一方で、その定義やAI・ディープラーニングといった関連用語との違いを明確には理解できていないという方もいらっしゃるのではないでしょうか?本コラムでは、AI・ディープラーニングとの関係を踏まえたうえで機械学習の定義を解説します。また、実際に導入する際に押さえるべきポイントを紹介します。
目次
AI(人工知能)・機械学習・ディープラーニング(深層学習)の定義
ここでは、AI、機械学習、ディープラーニングの特徴、それぞれ関係、違いを解説します。
・AI
「人間のように考えることができるシステム」の総称。
・機械学習
AIで用いられている手法の1つ。様々なデータを投入して学習を繰り返すことでAI自身が新たな判断基準を獲得できるようにするというもの。
・ディープラーニング(深層学習)
機械学習で用いられている手法の1つ。人間の脳をモデル化した数理モデルであるニューラルネットワークを多層にすることで、より人間に近い学習や判断を自ら実現するというもの。
AI(人工知能)とは?
AI(Artificial Intelligence/人工知能)は、1950年代に世に登場した用語です。「人工知能」という日本語訳が用いられているように、端的に言えば「人間のように考えることができるシステム」の総称です。ただし、明確な定義が存在しない用語でもあります。そして、「機械学習」と「ディープラーニング」はAIの研究が進むなかで生み出された技術です。
機械学習とは?
「機械学習」とは端的に言うと、コンピュータがデータからパターンやルールを見つけ出し、そこに別のデータを当てはめ、そのデータにもとづく予測や分析を行える技術を指します。
私たち人間は、前提となる情報をもとに、何らかの判断基準にしたがって行動します。AIを「人間のように考えることができるシステム」とするならば、AIにも行動(=処理)の前提となる「判断基準」が必要ということになります。
AIが世に登場した当初、このような判断基準は人間の手で設計する必要がありました。一般的なシステムのようにプログラムの中に漏れなく条件文を記載するといった形です。一方で、テキストや音声でコミュニケーションを図ったり、監視カメラの映像から異常を検知したりといった複雑な処理を行うには、膨大な数の判断基準が必要となります。それらを条件文として漏れなく記載しておくというのは不可能です。
そこで、AIの研究者たちは人間の手に頼らずに、AIが自ら判断基準を増やしていくことができる手法を考えました。その結果生み出されたのが「機械学習」です。機械学習を搭載したAIは、与えられた大量のデータを学習することによって自ら判断基準を増やし、それにしたがって最適な処理を実行できるようになります。
機械学習はすでに身近な製品やサービスで活用されています。その一例が、GmailやYahoo!メールといったメールサービスのフィルタリング機能です。フィルタリング機能とは、スパムメールを「迷惑メールフォルダ」へと振り分ける機能です。多くの場合にはフィルタリング機能には機械学習が用いられており、件名・送信元メールアドレス・本文といった各メールの要素や、「通常の『受信フォルダ』に格納されたメールを『迷惑メールフォルダ』に移動する」といったユーザーによる過去の操作などを学習したうえで、受信したメールを自動的に振り分けています。
ディープラーニングとは?
ディープラーニング(Deep Learning/深層学習)は機械学習で用いられている手法の1つです。コンピュータがデータから「自分で」データの背景にあるパターンなどの蓄積から「特徴」を見つけ出し、判断する技術を指します。
具体的には、ニューラルネットワークを多層にすることで従来の機械学習と比べてより人間に近い学習を実現しようという試みです。ニューラルネットワークとは、人間の脳内に多数存在している神経細胞(ニューロン)とそのつながりを数理モデル(※1)で表現したものを言います。
従来の機械学習の場合、AIが新たな判断基準を獲得するためには判断の根拠となるデータの特徴をあらかじめ人間の手で定義づける必要があったことはすでに述べたとおりです。しかし、ディープラーニングの場合、人間が指示を与えなくともAIが自ら特徴を判別して判断基準を増やしていきます。
たとえば、画像に含まれる要素を特徴ごとに分類する場合、従来の機械学習ではあらかじめ人間が分類するための特徴を指示する必要がありました。「自動車の色に着目して、色ごとに分類しなさい」といった形です。一方、ディープラーニングではこのような指示を与える必要はありません。自ら自動車の「色」という特徴を見つけ出して分類していくことができるからです。
(参考)総務省:人工知能(AI:エーアイ)のしくみ
※1:現実の世界で発生する様々な事象を簡略化し、方程式などを用いて数学的に表現すること
機械学習やディープラーニングを使うべき4つの理由
機械学習やディープラーニング(ここでは総括して「機械学習」と表記します)の導入は、成長を目指す企業にとって重要な要素となっています。ここではその理由を4つに分けて解説します。
データ活用の最大化が可能になる
企業が戦略を立てるためには大量のデータが必要ですが、そのデータを有効活用できていない企業が日本の古くからある企業では多いのではないでしょうか。
機械学習を導入することで、データを分析し、パターンや傾向を発見することが可能になります。これにより、企業の意思決定の根拠を強化し、戦略立案や効果的なマーケティングなどを、より効率的に実現できます。
予測・予防が可能になる
機械学習はデータを分析し、将来の出来事をある程度予測することが可能です。企業はこれを活用することで、需要予測・在庫最適化・顧客行動の予測などを行い、ビジネスプロセスを改善することができます。また、リスク予測といった予防的なアプローチにも使えます。
自動化と効率化がすすめられる
機械学習はルーチンワークや複雑なタスクの自動化に役立ちます。これにより、従業員はより付加価値の高い業務、人間でなければ難しい創造性の高い業務に集中することができます。例えば、顧客サービスの自動化、自動運転技術、ロボットによる生産などがこれにあたります。
また経営側から見ると、自動化が進むことで雇用の調整もできるでしょう。効率化と生産性の向上は、企業の競争力を高めるために重要です。
イノベーションと競争力の獲得が期待できる
機械学習は新たなビジネスモデルや価値の創造にも貢献します。データを活用することで、顧客ニーズを的確に把握でき、何が今トレンドなのか、顧客はどのようなものを好むのか、どんなサービスが受け入れられるのかなどを正確に知ることができるのです。これにより、新たな価値提供を行う領域を見つけ出し、競争市場での差別化や市場シェアの拡大が見込めます。また社会に対してのインパクトある刷新や変革を提案することも可能です。
機械学習の導入は他社との競争においても重要です。迅速な意思決定やマーケットの変化への適応力が求められている昨今、機械学習を導入しているかどうかで企業の将来性に差がでてくるかもしれません。
このように機械学習の導入は企業にとって多くの恩恵をもたらします。機械学習をうまく活用することで、企業は市場での優位性を確保し、持続的な成長を実現することができるでしょう。
機械学習を導入するメリットとデメリット
ここでは機械学習(ディープラーニング含む)を導入して得られるメリット、また注意すべきデメリットについてまとめます。
機械学習のメリット
低コストである
機械学習は、コンピュータを活用してデータから学習するため、人手に比べてコストが低く済みます。従来は人が手作業で行っていたものを、機械学習によって代行させることでその分の人件費を削減することができます。工数が少なくなる
機械学習は自動化や自己学習が可能なため、人間が手作業で行う必要があったタスクを効率的に処理することができます。複雑な作業を短時間で実行できる
機械学習は、膨大なデータや複雑なパターンを高速に処理することができます。人間にとって難しい作業や複雑な問題に対しても、迅速かつ正確な解析や予測を行うことができるのです。時間の節約や効率化が求められる場面で、機械学習の活用は大きなメリットとなります。
機械学習のデメリット
- ブラックボックス化するおそれがある
機械学習のデメリットはいくつか考えられますが、その一つは「ブラックボックス化」です。
機械学習はAIが蓄積されたデータから学習して予測や意思決定を行うのですが、「AIがなぜそう考え、結論付けたか」という内部のプロセスや判断基準が人間には理解しづらい場合があります。これは、複雑な数学的アルゴリズムや大量のパラメータを使用しているためです。
つまり、機械学習モデルが予測を行う際に「どの特徴が重要で、どのような要素が結果に影響を与えているのか」が明確にはわからない場合、その機械学習モデルが予測を誤ったり不正確な結果を出したりしても、その「理由」を特定し修正するのが困難になります。
例えば、特に法的な規制や倫理的な配慮が必要な問題には、予測や判断の根拠を明確にすることが求められます。しかし、ブラックボックス化されて根拠がはっきりしないケースでは、その根拠を正確に説明することが難しいため、せっかく出した結論をそのまま適用することができなくなるかもしれません。
また、ブラックボックス化によって機械学習モデルが学習する際に偏ったデータセットを使用したり、不適切な特徴を学習したりしても気づきづらくなるおそれがあります。結果的にモデルが明らかに偏った予測や判断を行った場合でも、どこにその原因があるのか、そのバイアスを特定して修正することが難しくなるのです。
このような機械学習のブラックボックス化の問題に対処するためには、慎重な機械学習モデルの構築と評価、データの継続的な品質管理の取り組みなどが必要です。
■機械学習をビジネスに導入する際に押さえるべき3つのポイント
実際に機械学習を導入する際には、次に挙げた3つのポイントを押さえることが重要です。
ポイント1:用途を明確にしたうえで最適な製品を選定する
今日では、機械学習を実行することができる様々な製品が存在しています。
大規模なものでは、NECグループの「NEC the WISE」のような「自然言語処理」「音声認識」「画像認識」といった複数の技術を組み合わせた統合的なAI製品があります。また、FRONTEO社が開発したテキストデータの解析に特化したAI製品「KIBIT」のように特定の用途に最適化した製品も存在します。そのほかにも、ソニー社の「Nural Network Console」のようにドラック&ドロップによる直感的な操作で機械学習のプログラムを設計できることを売りにしている製品も開発されています。あるいは、小規模であれば無料で提供されている簡易的な製品を活用するというのも選択肢の1つでしょう。
見方を変えれば、このような数多くの製品の中から最適なものを選定しなければならないということです。そのためには、まずは機械学習の用途を明確にすることが重要です。用途によって、最適な製品が異なるからです。
たとえばテキストの生成や校正といった、業務の自動化・効率化を目指す場合にはテキストマイニング(※1)に強みのある製品を選択すべきでしょう。また、AIによるコールセンター業務の代替を目指す場合には音声認識や日本語による自動応答といった機能が優れているAI製品が適していると言えます。
※1:大量のテキストデータから必要な情報を抽出すること
ポイント2:用途に沿った学習データを用意する
製品を導入したからといって、すぐに機械学習によって想定通りの処理を実行できるというわけではありません。まさに人間と同様に学習する期間が必要になります。そのため、まずは実際の用途に沿った学習データを用意しましょう。
たとえばドイツの大手自動車メーカーであるアウディ社は、プレス工場で製造する部品に発生するひび割れ(クラック)を自動検知する機械学習を活用したシステムを開発。その際、開発チームは数百万枚にものぼるサンプル画像を収集し、それらをピクセル単位で確認して微細なひび割れをマークするという気の遠くなるような作業を経て学習データを用意したそうです。
また、用意した学習データはそのまま機械学習で利用できるとは限りません。必要に応じて、文字データや数値データに変換したり、学習の妨げとなるような異常値を排除したりといったいわゆるデータクレンジングを行わなければなりません。
ポイント3:十分な学習期間を設けて精度を高める
学習データを準備できたら、実際に導入した製品にデータを投入して学習を開始しましょう。
おそらく学習を開始した当初は、想定通りの処理を実行できないはずです。学生時代を思い出してみてください。ほとんどの方が、難しくて最初は解くことができなかった問題であっても、学習を繰り返すうちに解けるようになったといった経験をしているのではないでしょうか?あるいは仕事においても、類似する業務での経験を重ねるうち、何らかの課題に直面した際に自ら解を導き出せることが多くなっていくというのはよくあることです。人間はこれを「経験」という言葉で言い表すことが多いかもしれません。
この流れは、機械学習においても同じです。学習データを用いた継続的な学習によって、処理の順番や使用するアルゴリズムなどをチューニングしながらその精度を徐々に高めていく必要があります。そして、やはり人間と同じく、複雑な処理を要する用途の方がより長期にわたる学習期間が必要になります。そのため、用途に応じた十分な学習期間を設けて処理の精度を高めるようにしましょう。
まとめ|機械学習の導入には外部パートナーの協力が欠かせない
この記事では、AI・機械学習・ディープラーニングの関係性、機械学習のメリットとデメリット、導入する際のポイントについて解説しました。
機械学習を自社に導入してDXを進めたいと考える企業経営者の方は多いでしょう。すでに世界のDX、IT化の流れに遅れをとっている日本企業は、できるだけ迅速にデジタル技術を取り入れ、業務効率を高めていかなければなりません。
前述したように、今日では機械学習を実行できる様々な製品が存在しています。一方で、機械学習の導入にあたってはそれを実行するためのシステムを自社開発するというのも選択肢の1つです。
また、実際に機械学習の運用を開始する前には学習データを用いた学習を行う必要があることも述べました。さらに当然のことですが、実運用を開始した後も導入した製品に新鮮なデータを投入し続けなければなりません。そういった意味で、機械学習の導入にあたってはデータを収集できる「基盤」を整備することが欠かせません。
一方で、はじめて機械学習を導入する場合には、システムを自社開発したり、データ基盤を整備したりといったことは非常にハードルが高い取り組みと言えます。投資にかかる費用やIT人材の確保なども必要なため、機械学習の導入はすぐにできるものではありません。また「機械学習に興味はあるけれど、具体的に何をすべきかわからない…」とお悩みの方もいるかもしれません。その場合は、外部の機械学習に関する専門的な知見をもった外部パートナーの協力が欠かせないでしょう。