スマートスピーカーの普及で注目が高まる「音声」操作とコンテンツ

掲載日:2018年11月5日

Amazon Echoなどのスマートスピーカーが登場したことで、音声で操作するユーザーインターフェースや音声で提供するコンテンツに注目が集まっています。

スマートスピーカーで採用される音声ユーザーインターフェース(VUI)

スマートスピーカーとは、人の声で操作できるAIアシスタントを備えたスピーカー型のデバイスのことです。国内でも2017年にGoogle Home、Amazon Echoシリーズ、続いてClova WAVEが発売されてからおよそ1年、徐々に利用者が増えています。

基本的なしくみは、円柱っぽい形(商品によっては手のひらサイズだったりキャラクター型だったり)のマイク部分から発話者の声を拾い、クラウドサービス上で音声認識して処理した結果をスピーカーから返します。

音楽を聴いたり天気を尋ねたりするときには、まず「アレクサ」「ねえグーグル」「クローバ」などスピーカーに話しかける必要があります。このような言葉はウェイクワードと呼ばれ、スピーカー側はウェイクワードを受け取ることで起動して処理を開始するようになっています。

このように音声で機器と情報をやり取りする操作手段のこと「VUI(音声ユーザーインターフェース・Voice User Interface)」と呼びます。
(→参考:音声ユーザーインターフェース (VUI) とは何か・amazon alexa

今までもAppleのSiri(シリ)やgoogleのGoogle Assistant(グーグルアシスタント)、MicrosoftのCortana(コルタナ)といったAIアシスタントがスマホやPCで使われていましたが、スマートスピーカーの登場により、いっきに音声での操作が注目されるようになりました。

スピーカーに話すだけで操作できるという手軽さ

コンピューターとやりとりする手段としては、パソコンのソフトウェアを操作するGUI(グラフィカルユーザーインターフェース)や、コマンドなど文字列でやりとりするCUI(キャラクターユーザーインターフェース)がよく知られています。これらはマウスやキーボードなどで指示内容を伝えるかたちです。Googleで検索するときには検索ボックスにキーワードを入力しますし、スマホではタップやスワイプなど画面に手で触れて操作するタッチUIが使われています。

VUIでは「音声で」指示内容を伝えるため、いままでのUIと比べて以下のようなメリットがあります。

(1)両手がふさがっているときでも利用できる
(2)入力の手間がかからない
(3)離れた場所からでも利用できる

Amazon EchoのテレビCMでは、キッチンでケーキを作っている親子が「おおさじ4杯は何カップ?」「キッチンペーパー注文して!」とスマートスピーカーに話しかけています。料理中に手が汚れていても、コンピュータと離れた場所にいても、利用できますよ、ということをわかりやすく表現しています。

音声によるコンテンツの需要が高まる

スマートスピーカーは一部を除き、音声のみで結果を返します。そのためVUIが注目されたのと同時に、音声で提供するコンテンツにも注目が集まっています。

Amazon、LINEでは、スキルと呼ばれるスマートスピーカー上で動くアプリケーションを個人でも法人でも開発することができます。Amazonでは機器操作や読み聞かせ、クイズなど1000以上のスキルが公開されています(2018年6月末時点)。スキルは事前にスマホのアプリから設定する必要があります。


出典:Amazon Alexa スキルストア

ピーボ~絵本読み聞かせ~」は、「アレクサ、ピーボを開いて」と話しかけるとオリジナル絵本や名作絵本を読み聞かせしてくれるスキルです。

サントリー のドリンク商品「グリーン ダ・カ・ラ」では、「こたえのないえかきうた」というスキルを提供しています。これは「アレクサ、えかきうたをスタート」と話しかけると開始し、1万通りある絵描き歌を歌ってくれるもの。答えがなく歌に合わせて自分の好きに絵をかいて、子供と楽しめるようになっています。

企業がユーザーとつながる手段のひとつとして、スキルを活用する流れも生まれてきています。

2019年以降さらに音声コンテンツ市場が活性化する可能性

スマートスピーカーは音声認識の精度を高めながら使いやすく進化しています。従来からあったオーディオブックや音楽だけでなく、ゲームや教育、ニュースなど新しいかたちの音声コンテンツが楽しまれるようになり、音声で提供するコンテンツの需要がいっそう高まると予測されます。

テキストや動画といったコンテンツと比較すると音声コンテンツのノウハウはまだ多くはなく、先行してサービスやコンテンツを提供している企業がノウハウを蓄積している状況です。今後既存の出版物、カタログなどを音声化したいという需要が増えていく可能性もあり、ビジネス機会としても期待できそうです。

(JAGAT 研究調査部 中狭亜矢)

関連イベント

音声コンテンツの市場とビジネス可能性(11/29開催)

スマートスピーカーの普及に伴い音声ユーザーインターフェイス(VUI)が注目されている。VUIの現状と可能性を理解したうえで、音声コンテンツの事例から今後のビジネス可能性を考える。