AIとは、「人工知能」を意味する英語の「Artificial Intelligence」の略称で、人間が語り掛けると、人工知能によって自動応答するスピーカー端末のことを、「AIスピーカー」または「スマートスピーカー」などと呼ばれている。

ニュースを聴いたり、好きな音楽をリクエストしたり、遠く離れたところにいる相手にメッセージを送ったりと、さまざまな使い道が考えられることから、「ポスト・スマホ」の本命ガジェットだという人も少なくない。

米国のアマゾン・ドット・コムが2014年に音声認識機能を持つAI「Alexa」を搭載している「アマゾンエコー」を発売、グーグルも「Googleアシスタント」搭載の「グーグルホーム」を市場に送り出した。AppleのAI「Siri」を搭載した「ホームポッド」はハイファイサウンドや広範囲で有効なファーフィールド音声認識などが可能といい、期待が高まっている。この分野は今後も急速な市場拡大が見込まれている。

注目すべきAIスピーカー・スマートスピーカーの関連銘柄をピックアップしてみよう(紹介する銘柄、情報は投資の勧誘や個別銘柄の売買を推奨するものではありません)。

音声認識の技術を提供――フュートレック

AI,関連銘柄
(画像=PIXTA)

フュートレック <2468> は音声認識やユーザーインターフェースのソリューションなどを主力事業としている。いうまでもなく音声認識は「人が話す自然な言葉を機器が認識、操作や入力をサポートする」ことをテーマとしており、AIスピーカーには欠かせない技術分野だ。音声合成などと組み合わせ、機器との対話によって操作や入力を行う音声対話技術など、使う人にやさしい音声言語関連技術が対象となっている。

音声認識とは、基本的には「人の声を機械で文字にする仕組み」のことだ。例えば、「今日は良い天気です」という音声を入力すると、「音響モデル」のデータとの照合によって「音」が「キョウハヨイテンキデス」という「ヨミ」に変換される。この「ヨミ」を「言語モデル」のデータと照合して漢字に変換し、最終的には「単語の並び」として整えられたものが、認識の結果としてテキストで表示される。「音声認識エンジン」はこうした一連のプロセスを実現しているわけだ。

フュートレックが提供している「vGate」は、同社の音声言語関連技術を使ったソリューションの総称だ。音声認識ソフトウェア単体のみならず、音声認識と機械翻訳を組み合わせた音声翻訳など、今後も同社の高度な音響技術がAIスピーカー分野の発展に寄与することが期待されている。

ユーザーの好みに合った商品やコンテンツを提案――ソケッツ

東証マザーズ上場のソケッツ <3634> のビジネスモデルは、同社の最大の強みであるメディアサービスデータベース「MSDB」を用いて、よりエンドユーザーの嗜好にあった商品・コンテンツを提案し、ユーザー体験の向上やパートナー事業の収益増加に貢献する事業を行なうというものだ。

「MSDB」は、人の気持ちが求める「漠然とした感覚」に論理性を付与しようと試みる技術だ。それぞれが異なった形態や特徴を持っている、音楽や映像などのコンテンツについて、受け取る人間の感情の側面から洞察を重ね、それらを蓄積・体系化している。言い換えれば、市場に出ているほぼすべての商品を網羅できるように、コンテンツを一元管理している手法なのだ。

例えばTVのシリーズドラマを思い浮かべてみよう。「MSDB」によれば、作者と作品のつながりや、シリーズ名と作品名とのつながりといった点に至るまでの一括した管理が可能になり、作品タイトルに関連したあらゆる起点から、ユーザーのニーズに対応可能な情報がデータベース化されることになる。

音楽や映像、言葉を使った表現、そして人そのものというように、人が生み出すコンテンツがどのような表現形式をとっていたとしても、「MSDB」はユーザーの求めた結果から作品と作品の近似値と類似値を推論し、メディアを越えたレコメンドを可能にしている。

ソケッツはすでに国内最大級のエンターテイメント系のメディアデータベースを保有しており、その構築で培った技術をベースに、難易度の高い感性的なエンターテイメントコンテンツのデータベースなど、あらゆるデータベースの効果的な構築を実現しているという。

アレクサと家電を連携させる――アプリックス

著名な中国仙人伝に由来する名を冠したアプリックス <3727> は、杏(アプリコット)の苗木が人々からの感謝の意で樹となり林となったという「杏林佳話」の精神を受け継いで、「ソフトウェアの力で世の中のあらゆる人々に幸せをもたらすこと」を使命としているのだという。

同社の事業は、米国のアマゾンが提供するクラウドベースの音声認識機能「Alexa」と家電を連携させ、家電メーカーの対応製品開発を支援するというものだ。AIアシスタント端末に向かって話しかけると、その音声が「Alexa」に送られ、「Alexa」はそこで認識した音声の内容に対応する処理を選び出し、その処理内容を家電製品などに実行させるコマンドを発する。

つまり「Alexa」を活用すれば、話しかけることによって操作ができる家電が出来上がるというわけなのだが、アプリックスは家電と「Alexa」との連携に必要となるスキルをはじめ、IoTモジュールやクラウドシステムなどによって、家電メーカーが対応製品を開発できる環境を提供しているのだ。

「空気清浄機」を例にとってみよう。ユーザーがAIスピーカーに向かって「フィルターをチェックして」と命令すると、「Alexa」はその音声信号を解析して、空気清浄機が実際にフィルターの点検を行うようにコマンドデータを送り込む。ユーザーにしてみれば、まるで命令を受けたAIスピーカーが、忠実に空気清浄機をコントロールしているような感覚に捉われることになる。

アプリックスの技術は、こうした流れを裏方として支えているわけで、まさにAIスピーカーの根幹を握るIoTソリューションに欠かせない存在だと言えるだろう。

アミボイスで知られる音声認識技術――アドバンスト・メディア

アドバンスト・メディア <3773> の事業の核となっているのは、音声認識技術である「AmiVoice(アミボイス)」だ。AmiVoiceは、従来の機械が中心となる音声認識とは一線を画し、人が自然に話しかけると、機械があたかも人間のように受け答えや記録などの動作をしてくれるという、知的ヒューマンインターフェースとしての音声認識を目指している。

AmiVoiceの最大の特徴は、「あらゆる人、言葉、会話スピードに対応している」ことだ。あらかじめ自分の話し方のクセを学習させておく必要がないため、老若男女を問わず、アクセントや会話スピードを気にすることなく利用できるという。

AmiVoiceは、「高品質かつ高速の処理能力」という点でも高い評価を得ている。スピーディに音声認識することができるか否かは、音声を認識する精度に左右されるのだが、AmiVoiceはある程度明瞭な音声に対する高い認識率を持っており、ほぼリアルタイムの認識処理が実現されている。

認識に利用されたこうした音声は、テキスト化したデータとともに非常にコンパクトなデータとして保存されており、再編集や議事録への利用など、音声とテキストのデータベース化が可能になるという。

また、認識率には周囲の騒音や雑音が大きく影響するのだが、AmiVoiceは世界トップクラスの技術で会話からノイズを可能なかぎり除去しており、街中はもとより、自動車・電車・飛行機などの騒音、電話などの聞き取りづらい音声にも対応できるという。

アドバンスト・メディアの事業には、こうした特徴を持つAmiVoiceを組み込んだ音声認識ソリューションの企画・設計・開発を行う「ソリューション事業」や、AmiVoiceを組み込んだアプリケーション商品をライセンス販売する「プロダクト事業」、企業内のユーザーや一般消費者へAmiVoiceをサービス利用の形で提供する「サービス事業」などがある。

独自のAIアシスタントを提供、スピーカーも発売――LINE

LINE <3938> が提供する、社名と同じサービス「LINE」は、すでにスマホを中心とするコミュニケーションツールとしてすでに定着した感があるが、そのLINEが開発したAIアシスタントが「Clova」(クローバ)だ。生活をより便利にする機能によって日々の生活をサポートするこのClovaが、実際に活躍している場面を見てみることにしよう。

まずはエンターテイメントの分野では、Clovaが搭載されたスマートスピーカーに話しかけることによって、LINE MUSICが提供する約4千万曲に及ぶ音楽を楽しむことができる。「何か音楽を再生して」とか、「この曲の曲名を教えて」、「リラックスできる曲を再生して」、「おすすめの曲を再生して」、「曲を止めて」、「次の曲を再生して」などなど。いとも気軽に頼みを聞いてもらえる。radikoと連携してラジオを楽しんだり、「桃太郎を読んで」という具合に童話の朗読を頼んだりすることもできる。

家族間でよく使われそうなサービスには、LINEの送受信がある。「お母さんにLINE送って」とか、「新しいLINE読んで」などと頼んでみたり、「お父さんに電話かけて」といったLINE無料通話を発信したりといったことも可能だ。

このほかニュースや天気予報などの情報収集やカレンダーサービス、占いやアラーム設定など、LINEの様々な機能がAIスピーカーに話しかけるだけで利用できるほか、Bluetoothペアリングの開始、解除や各機能に関する音声ガイドなど、利用者の日常生活を熟知するLINEならではのきめの細かいサービスが満載されている。

データサイエンティスト育成にも注力――チェンジ

チェンジ <3962> はモビリティやIoTビッグデータ、クラウド、セキュリティなどのテクノロジーを活用した各種のサービスを提供しているほか、IT人材を育成するための研修「NEW-ITトランスフォーメーション事業」を展開している。

中でも特筆すべきなのが、データサイエンティストに必要とされる「統計技術」や「IT技術」、「ビジネスインサイト」などを網羅的に習得できる研修サービスを提供している「データサイエンティスト育成事業」だろう。

例えば「AI利活用検討ワークショップ~1日でAI活用方針を立案しよう~」というコースでは、これまで研究分野でのみ利用されていた技術がビッグデータ技術の発達によって広く一般に利用されるようになった現状に即し、自社ビジネスにおいてAIを活用する上で必要な知識と考え方を習得し、さらにはAI活用のためのアイデア検討を行うことまでをテーマに置いている。

コースによってAIに関する理解を深め、今後のビジネス企画に向けたアイデアを検討できるようになった受講者は、自社に戻ってAIに関する現場の責任者として、リーダーシップを発揮できるようになるのだという。

音声インターフェース技術で注目――オンキヨー

高品質なコンテンツから再生機器までをトータルに展開するビジネスモデルを展開中のオンキヨー <6628> が、音とAIの融合という新しい分野への挑戦を試みつつある。AIが世の中を変えようとする勢いで目覚ましく進化している今、人とAIをつなぐ様々な技術の中でも、とりわけオンキヨーの得意とする音声インターフェースが注目を集めているのだ。

同社は2017年11月に「ONKYO スマートスピーカー P3」の発売を開始した。このAIスピーカーはアマゾンの「Alexa」対応しており、Amazon Musicなど音楽ストリーミングサービスの選曲や再生、ユーザーからの質問に対する応答のほか、ニュースの読み上げや最新の天気予報、プロ野球やサッカーといったスポーツ結果の確認、オーディオブックの読み上げ、タイマーやアラームのセット、カレンダー設定など、音声コントロールによるさまざまな操作ができるという。P3は「Alexa」に対応した各社のスマートホーム製品関連のアプリケーションもサポートしており、本製品に呼びかけるだけで、照明装置などの家電を操作することができる。

デュアル2.5インチフルレンジウーファーやデュアルパッシブラジエーターが生み出す、良質で広がりのある音質も、オンキヨーならではで、コンパクトサイズながらもエネルギッシュなサウンドが実現されている。

AIスピーカー向けの技術開発に積極的な姿勢を見せているオンキヨーが開発した、音声認識を向上させるマイク振動抑制技術にも注目しておきたい。従来はスピーカーの大音量化・高音質化を追求すればするほど、マイクから入る音声の認識が困難になるという課題があったのだが、この解決策として、マイク基板を天面ラバー部に直接固定し、他の筐体と接触しないフローティング構造を開発したという。これによりマイクに伝わる筐体内部振動を抑制しフラットなマイク特性を実現でき、大音量で音楽を再生している際、小さな声で話しても十分な音声認識ができるようになったという。

「何をどう質問したらいいか分からない」の解決めざす――パナソニック

東証1部上場のパナソニック <6752> もまた、AIスピーカー・スマートスピーカーに深くかかわる技術の開発に余念がない。例えばレシピ提案チャットの「CookChat」は、ユーザーモデル推定対話技術を駆使している。問いかけに対して、要点を掴んで専門知識データベースから自動アドバイスするというもので、ディープラーニングを含む機械学習技術を活かして、コミュニケーションロボットやサービスロボットに実装するための対話エンジンの研究開発を行なう試みだ。

Web検索では、多種多様なことがらについて瞬時に調べることができるようになっている。その一方で、自分の不得意な分野についてはそもそも知りたいことが具体的にはどういったことで、何をどう質問すれば良いのか分からないという問題に直面することもある。

こうした問題を解決するために、専門家の対話の進め方のパターンを機械学習し、ユーザーから断片的に情報を引き出しながら、その意図を推定するという「ユーザーモデル推定対話技術」が開発されている。この技術を組み込んだ、一般公開中の「レシピ提案対話システム」の実証実験も進行中だ。(ZUU online編集部)