(本記事は、中澤公貴氏の著書『データ分析チームの作り方』秀和システム2019年9月18日刊の中から一部を抜粋・編集しています)
AI活用までの道のり
日本でもデータサイエンティストの報酬を高めるためには、企業がしっかりとデータやAIの活用からくる旨味を感じなければいけません。特にテクノロジー領域の企業を中心に、日本でもデータやAIの活用が進んできていますが、ほかの産業ではまだこれからという印象を受けます。その理由として、AIを活用するためには、まずデータを集めたり、それらのデータに対して様々な処理を施す必要があり、AI活用までには「通らなければならない道のり」が存在するためでしょう。
データやAI活用のために必要なステップ
次ページの図表5は、様々な企業でデータサイエンス・アドバイザーを務めるモニカ・ロガティ(Monica Rogati)氏がブログ上に投稿したものです。
データサイエンスという領域では、様々な解析分野が存在します。そして、それぞれの解析分野の用途を満たすためには、それぞれ違った準備が必要になりますが、その各用途の順序と準備がわかりやすく記載されています。
その用途の頂点にあるのがAI活用で、そこに至るまでに、様々な段階を経る必要があるのです。図表5のピラミッドを詳しく見ていきましょう。一番下の段から始まり、頂上を目指していきます。
まずデータを集めるために、機械やWebサイト上で生成されるコンテンツやログを収集するところ(図表5のCOLLECT)から始まります。そして、インフラを整えたり、データパイプラインを作り(MOVE/STORE)、データを活用可能な状態にした後で、データの前処理を行い(EXPLORE/TRANSFORM)、目的に応じてデータにアノテーション(※1)を加えたり、統合、フィルタリングを行ったりします(AGGREGATE/LABEL)。この段階にたどり着いてようやくデータからインサイト(※2)を得られはじめます。そのようなインサイトを用いて事業を営む企業をデータ・ドリブンと呼ぶようになりました。
その後は、AI活用領域のLEARN/OPTIMIZEの段階として、実験の導入や機械学習モデルを活用することが可能となります。テクノロジー企業の多くはAGGREGATE/LABELまで達しているケースが多い一方で、テクノロジー分野が本業ではない企業にとっては、その段階まで進めるには相当の企業努力が必要となります。
AGGREGATE/LABEL以上に位置する企業は、A/Bテストや実験による対象課題の最適化など、すでにデータドリブンに意思決定ができているケースが多いです。そのため、データ活用のマインドセットが社員に浸透しており、こういった企業では次のAI活用段階に進む場合も、ほかの企業よりもハードルが低くなります。
このように、ひと言でデータやAI活用と言っても、ピラミッドの頂上から景色を見渡すには険しい山道を進んでこないといけません。ただ私は、どのような企業でも、本書で解説する現実的な方法を実践できれば、この頂点まで到達できると感じています。そして、この頂点に位置する企業こそ、AIドリブン企業なのです。
近年、解析に使うインフラやツールは低コスト化が進んでおり、これからAI活用に取り組む企業にとってはまたとないチャンスが到来しています。まさにAIの民主化の波が押し寄せているのです。これからAIを活用していきたいと考えている企業で働く方が、業界を先導するAIドリブン企業を作るために、本書を参考にしていただければ幸いです。
テクノロジー以外の業界でも、AI活用が進めば自ずと解析系人材に対するニーズが高まり、データ解析を学ぶ学生も増え、日本でも米国にあるようなエコシステムの構築に繋がっていくでしょう。
※1 テキストや音声、画像などのデータにタグを付ける作業のこと
※2 対象物を深く理解すること。例えば対象が消費者の場合だと、その購買行動や思惑、またそれらの背景にある意識構造を理解すること
※画像をクリックするとAmazonに飛びます