Vol.31 AI音声アシスタントSesameの紹介
(英語での会話を一部PLaMoを使用して翻訳しています)
◆セサミのデモンストレーション

Maya: あ、もう戻ってきたんですね。通信切れてなきゃいいんですが!
岡野原:あの、聞こえますか?私は日本出身です。
Maya: ティエンメイさん、やっとお互い自己紹介できましたね!素敵なお名前ですね。今の時期の日本ってどんな感じですか?
岡野原:いえ、それは私の名前じゃありません。私は日本出身ですと言いました。
Maya: あ、ごめんなさい!私のデジタル脳の配線がごっちゃになったかも。日本ですね、了解です。まだ慣れてなくって!
◆リアルタイムAI会話システムの可能性
ちょっと音声に問題があるようですね。まあ後で www.sesame.com 試してみてください。このシステムは最近話題になったリアルタイムAI会話システムを実現している例です。
このシステムはこのような会話において非常にリアルタイムな応答ができるということです。
このようなシステムは新しいものではありません。多くの製品やサービスが多く登場してきています。おそらく新しい手法も取り入れているのでしょうが、細かい高速化技術の蓄積でこのぐらいはできるようになっています。
人は、ほとんどリアルタイムに近いビデオ会議ですらタイムラグを感じ、会話がしづらかったりします。数十ミリ秒といった遅れが、コミュニケーションに大きな障害をもたらすのです。今でている技術はこのタイムラグを限りなく小さくし、より自然なコミュニケーションを実現しようとしています。
技術的に難しい部分としては、話している途中に声をかけた時にどのように対応を変えるかとか、その対応をどのくらい自然にできるかといったことでしょうか。こういった部分は少しでも時間の遅れがあったり不自然な部分があると気持ち悪さが残ってしまいます。
このように、今、AIシステムと私たちの間でリアルタイムのやり取りができるようになりました。これはコンピュータとの新たな交流方法を生み出すと思います。
ここでは英語で会話していますが、もちろん日本語の対話システムも登場してきていますし(J-Moshi、 Kotoba Technologiesなど)、機械翻訳システムと繋げばリアルタイムでの機械翻訳が可能になります。また、単に人と同じことができるというだけではありません。このような会話システムは、一度に一人だけでなく多くの人と同時に繋がることができます。
これは人間には不可能なことですが、コンピュータなら可能です。このような能力により、新しいサービスや製品が生まれると思います。
例えば緊急時に同時に1000人と対話しながら情報収集をしたりできるかもしれないですし、合意形成を目指した会話ができるかもしれません。ここまでくるとこれまでの社会になかった新しいコミュニケーションが作れる可能性があるでしょう。
私たちも、このようなリアルタイムのAIインターフェースの方向性も将来的に検討していくつもりです。

