Mainly, we have researched about how to handle multimedia contents on the Web and smart devices. Our target media includes video, map, human communitity, e-learning, and voice interaction.
主に,Webやスマートフォン上でマルチメディアコンテンツをいかに賢く扱うかについて研究しています. 対象とするマルチメディアコンテンツは動画・地図・人間関係・Eラーニング・音声対話などです. とくに,コンテンツの内容に基づく処理(Content-Aware),Webコミュニティの力やWeb上における 社会的活動(Web Social Activities)を積極的に活用する(Community-Based), 価値のあるコンテンツを協調的に創生する(Creativity)の3つのCを重視した研究を行っていることが特徴です. 既存のWebの概念に捕らわれず,必要とあれば,新しいWebを積極的に提言していく研究を目標としています.
実験サービス山本研究室では、ユーザ生成コンテンツに関する研究を実施しています。 ユーザ生成コンテンツとは、管理者やプロのクリエータではなく、コンテンツを利用する側のユーザ(一般ユーザ)が 作成したコンテンツです。代表的な例としては、WikipediaやYouTube、OpenStreeetMapなどが挙げられます。これらは従来、 学者や放送局の製作スタッフ、地図会社が長い時間をかけて作っていたコンテンツの制作を、ユーザに開放することで、膨大で詳細なコンテンツが 生成された成功例です。ユーザ生成は、1.人的コストが低い、2.集合知の概念に基づき良いコンテンツが生成される、 3.情報の更新が早い、などの利点が挙げられます。
山本研究室では、音声対話、音声道案内、アノテーションなど、従来ユーザ生成のターゲットとなっ・トいなかったような コンテンツに対して、ユーザー生成の概念を導入していく研究を実施しています。音声対話コンテンツをユーザ生成する 仕組みとしてMMDAgent EDITとMMDAgent SHAREを開発・公開しています
山本研究室では、音声インタラクションシステム構築ツールキットMMDAgentを用いた研究を実施しています。 MMDAgentは、音声対話システムを実現するために必要な機能、たとえば、音声合成、音声認識、3Dモデル描画、 物理演算に基づく3Dモデル制御、対話制御などを統合したシステムであり、WindowsやMac OS、Linux、AndroidなどのPCやスマートフォンでの動作が可能です。 特に、スマートフォン向けの音声対話システム[1]について研究しています。
MMDAgentは、FST(Finite State Transducer)形式の音声対話スクリプトと関連する素材 などに基づいて動作します。これらの音声対話スクリプトと関連する素材・モデルをまとめて「音声対話コンテンツ」と呼んでいます。 他の多くの音声対話記述言語とは違って、FST(状態遷移)形式を採用していますので、よりきめ細やかな対話制御が実現できると 同時に、状態遷移に関する各種理論や、グラフ理論的なアプローチが適用できる利点があります。
山本研究室では、特に、スマートフォンを用いた音声対話システムの仕組み、FSTを用いた音声対話システムの制御手法の仕組み、 音声対話コンテンツを作成する仕組み[2]、対話ロボット、音声対話コンテンツの利用ログを解析する仕組みなどについて研究しています。
図1. 世界初の3Dグラフィックキャラクタを用いたスマートフォン向け音声対話システム(左)、と、状態遷移(FST)を用いた対話スクリプト記述例。
山本研究室では、地理情報システム(GIS)に関する研究を実施しています。
通常のGISの研究では、道路地図を、ノードとリンクの集合であるグラフとして捉えています。様々なグラフ理論的アプローチが適用できる 利点があります。その一方で、人が地図を理解するときは、単に地図をグラフとして捉えるだけでなく、いわゆる「認知地図」と呼ばれる、 認知心理学に基づて解釈している場合が多く、通常のグラフ理論的アプローチだけでは不十分な場合もあります。
我々の研究室では、これらの認知心理学的概念に基づき、あらたな数学的モデル(Focus+Glue+Contextマップ[1]、周回道路[2]、道なり道路、ストローク)を 提案し、そのモデルに基づいた研究を実施しています。GPS[3]などの位置情報を用いた研究や、モバイル音声道案内システムに関する研究[4]も実施しています。
Focus+Glue+Context Mapのデモはこちらです。
図2. 世界初のリアルタイム動作可能なFisheye Web Map(左)、モバイル音声道案内システム(中)、モリコロパーク設置の虫メガネ地図(右)山本研究室では、地域に根差した社会基盤の一つである「市バス(路線)」に着目した研究を実施しています。
市バスは、その重要性に反して、財政的な問題で衰退の危機にあり、比較的人口密度の高い名古屋市であっても、 無料の敬老パスを発行するなどの形で、100億円以上の補助金が投入されなければ維持できないのが現状です。 また、都市部のバス路線は路線数が100以上あるなど、経路や時刻表が複雑で本質的に分かり難く、旅行者や外国人はもとより、地域の住民であっても、 事前の下調べ無しで容易に利用することができません。バス路線を維持・発展させるためには、より多くの人たちが手軽に利用できる仕組みが必要であると考えました。
そこで、本研究室では、音声対話技術やWebマップ技術等を活用した、デジタルサイネージ型の「しゃべる」バス停を開発することにより、 バス停自身が旅行者や地域の住民に対して、バス路線の利用を促す仕組みを実現するを目指しています。
また近年注目を集めているMaaS(Mobility-as-a-Service)との連携も考えています。