スマートスピーカー「グーグルホーム」とは? 声掛けで開く未来の扉

 7月の当欄でコンピューターによる音声認識の仕組みを紹介したが、それを活用した注目の新製品が「スマートスピーカー」だろう。声による指示を人工知能(AI)が認識してニュースを読み上げたり、音楽をかけたりできる。小さな花瓶にも似たこの機器がどのように私たちをアシストし、暮らしをスマート化してゆくのか。米IT大手グーグルの「グーグルホーム」を通して、AIが身近にある未来を考えた。 

 グーグルホームは「OKグーグル」と呼び掛けることで、いろんな質問に答えてくれる。では聞いてみよう。「OKグーグル、グーグルホームって何?」

 「グーグルホームは、グーグルアシスタントを搭載し、音声で動作するスマートスピーカーです」

 「『OKグーグル』と声を掛けるだけで、知りたいことを調べたり、音楽をかけたり、毎日のちょっとしたタスクをこなせたりするほか、ご自宅のスマートデバイスを操作することができます」

 よく分かりました。説明終了! といきたいところだが、もっと詳しく知りたいことがある。引き続き、グーグル合同会社(東京)の徳生裕人製品開発本部長に聞いた。グーグルホームに搭載されたグーグルアシスタントとは?

 「AIを活用して、会話形式でコンピューターとインタラクトする(相互に作用する)製品です。検索などグーグルの各種サービスとつながる『窓口』として開発しました。声を掛けると音声認識をして何を求めているか理解し、ユーザーをアシストしてくれます」

 グーグルホームの頭脳のような存在だ。音声認識が重要な役割を担っている。

 「機械学習が進化し、音声認識がストレスなく使えるようになってきました。スマートフォンの操作がややこしいと感じる人も、話し掛けるだけで気軽にコンピューターを使えます。以前から、『機械に何か話し掛けて、それに答えるのがAI』というイメージがありました。だからグーグルアシスタントを搭載したグーグルホームは、AI感にあふれています」

 グーグルホームにはどんな装置が入っているのか。

 「マイクとスピーカー、それにちょっとしたコンピューターなどです。このコンピューターはスイッチのようなもの。ユーザーが『OKグーグル』と言ったことを判断して、ネットワークを通じてクラウドへ音声データを送ります」

 「クラウドに送られたデータは音声認識でテキスト(文章)化され、自然言語処理(☆1)で何を意図しているのかを読み取ります。その後はAIがユーザーの意図を分析し、次の動作を判断するのです」

 ●周辺機器を操作

 どんなことができるのか。

 「検索や目覚まし時計の機能、計算などができますが、単体ですべてができるというものではありません。対応するアプリが『できること』を広げます。グーグルのアプリ『プレイミュージック』を使い音楽を聴くことができます。『ユーチューブ』のアプリを入れ、クロームキャスト(☆2)をテレビに接続することで動画が見られます」

 ネットワークでつながったデバイス(周辺機器)と連携することで、グーグルホームは新たな役割を得る。声で機器を操作することだ。

 「ロボット掃除機に指示を出す、照明をつけて消す、テレビやエアコンのリモコンを操作するなどグーグルホームに声を掛けて動かせるデバイスは、数多くあります。これからも対応製品は増えてゆくでしょう」

 「私たちはインフラストラクチャー(土台)を作っています。グーグルホームへの使いやすいアクセスの方法を提供して、価値を見いだす方に新しい製品を作っていただくイメージです。デバイスだけでなく、他社の方が対応アプリを開発できるプラットフォームも準備しています」

 ●技術者が改善に努力

 ときどきリクエストに答えられず、「お役に立てそうにありません」と言う場面がある。

 「グーグルアシスタントの登場からまだ数年。理想のAIのレベルに達するように、第一歩を踏み出したばかり。できないこともまだあります。スムーズにつながればユーザーは使ってくれますが、期待通りに反応してくれなければ使われなくなる。私たち開発グループは細かいエラーや、ユーザーのストレスが出ないように、品質を上げる努力を続けています」

 グーグルは「AI for everyone(AIをすべての人に)」を掲げ、AIでよりよいサービスを提供し、AIをより身近に感じられる社会を目指している。

 「機械学習は昔からあったが、急激に役に立つレベルに達してきていると思います。新しい技術を投入することで、より多くのユーザーが技術の進化の恩恵に触れ、よりよいユーザー経験が生まれます。会社を挙げてどれだけこの技術を製品に反映させられるかが、今後のテーマです」 (塩田芳久)

 ●注釈
 ☆1 日本語や英語など日常で使う自然言語をコンピューターで取り扱う技術の総称。具体例は日本語のかな漢字変換、機械翻訳、構文解析など。
 ☆2 スマートフォンやタブレット端末などを無線でテレビに接続し、視聴するための装置。2013年に米IT大手グーグルが開発した。

関連記事

PR

開催中

2022酒器展

  • 2022年1月12日(水) 〜 2022年1月24日(月)
  • 福岡三越9階岩田屋三越美術画廊

PR