エージェントやロボットとことばを使って楽しく自然に会話できる?!

人間と自然に会話するコンピュータ。人間と音声で自然に会話するコンピュータを創る研究に取り組んでおり、コンピュータに会話させるにはどうすればよいか、どのような会話が人間にとって快適かを探求しています。音声対話コンピュータの実現に向け、音声認識や音声理解、音声対話といった要素技術を総動員し、複合する枠組みを提案。さらに人間の対話行動の観察、心理計測・生理計測による「対話モデル」評価法の確立をめざしています。

■私たちは、こんな研究をしています。

徳竹 啓佑

ロボットに簡単にものを頼めるよう、 聴くための耳をつけてあげたい……。

ロボットがもっと身近になったら、人間と話をするようにロボットにものを頼んだり伝言を聞いたりできるのが、理想的なインタフェースだと思います。そのためにはロボットに聴くための耳、話すための口が必要ですね。私は、ロボットに聴覚を与える研究をしています。具体的にはモーターや機械など自分の体から発する大きな騒音の混ざった音声を、高精度で音声認識するための研究に取り組んでいます。

予測困難な複雑系の知見・技術を 音声対話の研究に適用する。

川端研では、音声対話コンピュータの実現に向けて要素技術を横断・統合する方法論として、複雑系に注目しています。例えばライフゲームという疑似生命シミュレーションは、わずかな配置の違いが、その後の世界の変化に大きな影響を与えます。音声信号の時間変化や人間の行動にも同じような性質があるので、複雑系の研究で培った知見・技術を音声対話に適用することにで、大きな技術進展が得られるのではないかと期待しています。

人間とは何か?……その問いに挑み、 ことばを聴き・話すコンピュータを研究。

地球上で唯一人間だけがことばを話し、相互に理解しあうことで、協調的な社会を実現しています。コンピュータ上の音声対話エージェントや対話ロボットといった、ことばを聴き・話すコンピュータの研究は「人間とは何か」という問いに真っ向から取り組むことになるのです。音声・画像・知能・行動科学といった既存の技術分野を横断・統合する新パラダイムの創出が、これからのテーマになると思います。

音声による情報検索をはじめとして 多彩な分野への応用が考えられる。

こうした研究の応用分野としては、パソコンとおしゃべりする感覚でWWWの情報検索ができるといった、便利でかつ楽しい用途もありそうです。また将来、一般家庭にロボットが普及すれば、音声対話がロボットとのコミュニケーションの基本になるかもしれません。さらに、研究の過程で生まれる複雑系の考え方を取り入れた新しい信号処理パラダイムは、他のさまざまな技術領域に変化をもたらすかもしれません。

研究のkeywords

音声認識

コンピュータに人間の話す内容、音声言語を聞き取らせる技術。すなわち、ロボットやコンピュータに「耳」を与える技術のこと。この技術を使えば、キーボードなどを使わずに文字の入力や操作ができる。

複雑系

たくさんの要素が相互作用することによって未来の予測や制御が著しく困難な状態、またはそれを取り扱う技術領域の総称。WWWのページ間リンクは、複雑系ネットワークの一種であることが知られている。