Amazonが推進する音声認識技術「Alexa(アレクサ)」。ここでは、Alexaを使った同社の「Amazon Echo(エコー)」と共に、その特徴や市場に与えるインパクト、日本市場への展開について予測してみる。
家庭内の音声入力のハブを目指すAlexa
Alexaは一言でいえばiPhoneではSiri、Android端末では“OK Google”に相当する、Amazonが開発した音声認識・入力技術である。
2014年に発表された同社の「Amazon Echo」に搭載され、音声による入力により音楽を掛けられるスピーカー……という印象が当初はあった。音声でコマンドを入力する機能は、古くは音声入力が可能な携帯電話があり、ヘッドセットから宛先を声で入力すればハンズフリーで電話がかけられるというものがあった。
SiriやOK GoogleそしてAlexaは、携帯電話に搭載されていたころの機能とは比較にならないほど高性能であり、できることが大幅に増えている。
また音声認識技術も進化し、セキュリティの観点から個人を識別できる…というところまで来ている。それぞれの技術は似通っており、クラウドデータを使いデータを解析してフィードバックするという機能は横並びと言える。Alexaは他の音声認識技術と比較して、携帯電話ではなく家庭内に設置されて、様々なアシスタント機能を提供する点が特徴的である。
Skill(スキル)と呼ばれるAlexa接続サービス
AppleのSiriがクローズド、つまり自社製のiPhoneなどにしか搭載されないのに対し、Alexaは様々な機器と接続することを前提にしており、家庭内のIoT(モノのインターネット)機器すべてを音声にてコントロールしたり、これを搭載した車でさえもコントロールすることを目的としている。
Alexaに接続するサービスをSkill(スキル)と呼び、ディベロッパーが自由に開発し公開することが可能である。先述のAmazon Echoはこれが搭載されており、入力された音声の文脈などを解析し、データを送信して得られた結果をフィードバックする。
当初はAmazon Echoは「聞きたいジャンルを音声で入力すると、それを演奏してくれるスピーカー」としか見られていない部分もあったが、実際は音声によるAmazonへの注文などもこなすことが出来る。この文脈を解析するプログラム部分がSkillとなる。
クラウドデータから適切なフィードバックを得るためのプログラム、と言い換えることもできる。通常のプログラム同様、ディベロッパーの(開発者の)センスが要求される部分でもあるのだ。開発環境としてLambda(ラムダ、サーバなしで開発環境が使えるコンピューティングサービス)が使えるという点も、Skillが開発される裾野が広がる可能性を持っている。
日本語版はいまだ登場未定
Amazonは自社開発のハードウェアをいくつか持っており、特徴的なものは電子ブックリーダのKindleなどがある。Echoは日本ではあまり知られていないが、米国ではかなりの人気となっている。Amazonは自社ハードウェアの出荷台数を公表していないが、少なくとも1500万台以上売れていると分析している所もある。
約180ドルという決して安くは無い機器(廉価版のEcho dotは50ドル)としてはかなり売れているほうだが、日本におけるEchoの展開は全く未定である。もちろんEchoはクラウドサービスの入り口の機器でしかないので、厳密に言えば「日本語版のAlexa」が開発されない限り販売する意義がない。
AmazonはAlexaを新しい世代のFire TVなどにも搭載しており、従来からあったコンテンツを探すための音声認識機能に代わり、さらに高機能化されている。現在アメリカで出荷されているFire TV (と廉価版のStick)の新型にはAlexaが搭載されているが、日本で販売されているFire TVにはAlexaは搭載されていない。
日本語版のAlexaがまだないからである。そのため日本では旧モデルのFire TVが継続して販売されている。
日本語版Alexaが出た場合のインパクトは?
Alexaは現在英語版とドイツ語版しかなく、他言語版も開発されているものと思われるが、音声入力された文脈を解析し、それをクラウドデータで判断するという仕組みは、言語学にも由来する難しい部分もあると推測される。
AppleのSiriも最初は英語版しか存在しなかったが、その後急速に各国語版が開発されたのは周知の事実である。AlexaはAmazonのサービスの導入部分としても(通販会社としては当然だが)活用されている上、AIを活用したクラウドデータは消費行動の分析にも直結するため、市場の大きな順番から開発されていくだろうことは容易に想像できる。
日本語版Alexaが出た場合には、これを使うためのSkillも日本語が使えるという事を意味している。つまり、日本のITメーカーや個人がSkillを開発し市場に提供する事が可能となるわけであり、特にIoTの分野での活用が期待される。家庭内の機器をすべて音声でコントロールできるということは、いつか我々が見たことがある「未来の家」が実現することになり、とても分かりやすい形のITが登場するわけである。
同時に企業側としても「クリック・アンド・モルタル」に誘導する入り口が簡単に実現できることになり、こちら側の恩恵も計り知れないだろう。IT産業の動向にも注目が必要である。(信濃兼好、メガリスITアライアンス ITコンサルタント)
【編集部のオススメ記事】
・「信用経済」という新たな尺度 あなたの信用力はどれくらい?(PR)
・資産2億円超の億り人が明かす「伸びない投資家」の特徴とは?
・会社で「食事」を手間なく、おいしく出す方法(PR)
・年収で選ぶ「住まい」 気をつけたい5つのポイント
・元野村證券「伝説の営業マン」が明かす 「富裕層開拓」3つの極意(PR)