Yamamoto Laboratory

Mainly, we have researched about how to handle multimedia contents on the Web and smart devices. Our target media includes video, map, human communitity, e-learning, and voice interaction.

主に，Webやスマートフォン上でマルチメディアコンテンツをいかに賢く扱うかについて研究しています．対象とするマルチメディアコンテンツは動画・地図・人間関係・Eラーニング・音声対話などです．とくに，コンテンツの内容に基づく処理(Content-Aware)，Webコミュニティの力やWeb上における社会的活動(Web Social Activities)を積極的に活用する(Community-Based)，価値のあるコンテンツを協調的に創生する(Creativity)の3つのCを重視した研究を行っていることが特徴です．既存のWebの概念に捕らわれず，必要とあれば，新しいWebを積極的に提言していく研究を目標としています．

実験サービス

MMDAgent SHARE 音声対話コンテンツを共有するためのサービスです（山本研が主に開発）
MMDAgent EDIT 音声対話コンテンツをWebで簡単に作成するためのサービスです（山本研が主に開発）
MMDAgent 音声対話コンテンツを利用するためのアプリです。（山本研が開発に参加）
Focus+Glue+Context型マップ Fisheye型Webマップサービスのデモサイトです（山本研が主に開発）
しゃべるバス停プロジェクト
虫めがねｄe 愛・地球博　モリコロパークの公式ＨＰからリンクあります。

Research Topics

Web service and Multimedia
Web-based video annotation
Web map services
E-Learning
Voice interaction System
MaaS : Mobility as a Service

User Generated Content - ユーザ生成コンテンツ

山本研究室では、ユーザ生成コンテンツに関する研究を実施しています。ユーザ生成コンテンツとは、管理者やプロのクリエータではなく、コンテンツを利用する側のユーザ（一般ユーザ）が作成したコンテンツです。代表的な例としては、WikipediaやYouTube、OpenStreeetMapなどが挙げられます。これらは従来、学者や放送局の製作スタッフ、地図会社が長い時間をかけて作っていたコンテンツの制作を、ユーザに開放することで、膨大で詳細なコンテンツが生成された成功例です。ユーザ生成は、１．人的コストが低い、２．集合知の概念に基づき良いコンテンツが生成される、３．情報の更新が早い、などの利点が挙げられます。

山本研究室では、音声対話、音声道案内、アノテーションなど、従来ユーザ生成のターゲットとなっ・ﾄいなかったようなコンテンツに対して、ユーザー生成の概念を導入していく研究を実施しています。音声対話コンテンツをユーザ生成する仕組みとしてMMDAgent EDITとMMDAgent SHAREを開発・公開しています

Tomohiro Yanagi, Daisuke Yamamoto, Naohisa Takahashi, Development of Mobile Voice Navigation System Using User-Based Mobile Maps Annotations, Proc. of IEEE/ACS ICIS 2015, pp. 373 - 378, Las vegas, 2015.6
Daisuke YAMAMOTO, Tomoki MASUDA, Shigeki OHIRA, Katashi NAGAO. Video Scene Annotation Based on Web Social Activities, IEEE Multimedia, Vol.15, No.3, pp.22-32, 2008.9

Mobile Voice Interaction Systems - モバイル音声対話システム

山本研究室では、音声インタラクションシステム構築ツールキットMMDAgentを用いた研究を実施しています。 MMDAgentは、音声対話システムを実現するために必要な機能、たとえば、音声合成、音声認識、3Dモデル描画、物理演算に基づく3Dモデル制御、対話制御などを統合したシステムであり、WindowsやMac OS、Linux、AndroidなどのPCやスマートフォンでの動作が可能です。特に、スマートフォン向けの音声対話システム[1]について研究しています。

MMDAgentは、FST(Finite State Transducer)形式の音声対話スクリプトと関連する素材などに基づいて動作します。これらの音声対話スクリプトと関連する素材・モデルをまとめて「音声対話コンテンツ」と呼んでいます。他の多くの音声対話記述言語とは違って、FST（状態遷移）形式を採用していますので、よりきめ細やかな対話制御が実現できると同時に、状態遷移に関する各種理論や、グラフ理論的なアプローチが適用できる利点があります。

山本研究室では、特に、スマートフォンを用いた音声対話システムの仕組み、FSTを用いた音声対話システムの制御手法の仕組み、音声対話コンテンツを作成する仕組み[2]、対話ロボット、音声対話コンテンツの利用ログを解析する仕組みなどについて研究しています。

図1. 世界初の3Dグラフィックキャラクタを用いたスマートフォン向け音声対話システム（左）、と、状態遷移（FST)を用いた対話スクリプト記述例。

Daisuke Yamamoto, Keiichiro Oura, Ryota Nishimura, Takahiro Uchiya, Akinobu Lee, Ichi Takumi and Keiichi Tokuda, Voice Interaction System with 3D-CG Human Agent for Stand-alone Smartphones, Proc. of the 2nd International Conference on Human Agent Interaction, ACM digital library, pp.320-330, 2014
Keitaro Wakabayashi, Daisuke Yamamoto, Naohisa Takahashi, A Voice Dialog Editor Based on Finite State Transducer Using Composite State for Tablet Devices, Computer and Information Science 2015, Studies in Computational Intelligence, Vol. 614, pp.125-139, 2016.

Geographical Information Systems - 地理情報システム

山本研究室では、地理情報システム(GIS）に関する研究を実施しています。

通常のGISの研究では、道路地図を、ノードとリンクの集合であるグラフとして捉えています。様々なグラフ理論的アプローチが適用できる利点があります。その一方で、人が地図を理解するときは、単に地図をグラフとして捉えるだけでなく、いわゆる「認知地図」と呼ばれる、認知心理学に基づて解釈している場合が多く、通常のグラフ理論的アプローチだけでは不十分な場合もあります。

我々の研究室では、これらの認知心理学的概念に基づき、あらたな数学的モデル（Focus+Glue+Contextマップ[1]、周回道路[2]、道なり道路、ストローク）を提案し、そのモデルに基づいた研究を実施しています。GPS[3]などの位置情報を用いた研究や、モバイル音声道案内システムに関する研究[4]も実施しています。

Focus+Glue+Context Mapのデモはこちらです。

図2. 世界初のリアルタイム動作可能なFisheye Web Map（左）、モバイル音声道案内システム（中）、モリコロパーク設置の虫メガネ地図（右）

Daisuke Yamamoto, Shotaro Ozeki, Naohisa Takahashi, Focus+Glue+Context: An Improved Fisheye Approach for Web Map Services, Proceedings of the ACM SIGSPATIAL GIS 2009, Seattle, Washington, pp.101-110, 2009.11.4
Daisuke Yamamoto, Kohei Hukuhara, Naohisa Takahashi, A Focus Control Method Based on City Blocks for the Focus+Glue+Context Map, Proceedings of the IEEE 24th Internatinal Conference on Adavanced Information Networking and Applications Workshops (DMWPC 2010), Perth, Australia, pp.956-961, 2010.4.21.
Pablo Martinez Lerin, Daisuke Yamamoto and Naohisa Takahashi, Pace-Based Clustering of GPS Data for Inferring Visit Locations and Durations on a Trip Date of Evaluation, IEICE Transactions on Information and System, Vol. E97-D No.4, pp.663-672, April 2014.
Tomohiro Yanagi, Daisuke Yamamoto, Naohisa Takahashi, Development of Mobile Voice Navigation System Using User-Based Mobile Maps Annotations, Proc. of IEEE/ACS ICIS 2015, pp. 373 - 378, Las vegas, 2015.6.30.

バス路線案内システム

山本研究室では、地域に根差した社会基盤の一つである「市バス（路線）」に着目した研究を実施しています。

市バスは、その重要性に反して、財政的な問題で衰退の危機にあり、比較的人口密度の高い名古屋市であっても、無料の敬老パスを発行するなどの形で、１００億円以上の補助金が投入されなければ維持できないのが現状です。また、都市部のバス路線は路線数が１００以上あるなど、経路や時刻表が複雑で本質的に分かり難く、旅行者や外国人はもとより、地域の住民であっても、事前の下調べ無しで容易に利用することができません。バス路線を維持・発展させるためには、より多くの人たちが手軽に利用できる仕組みが必要であると考えました。

そこで、本研究室では、音声対話技術やWebマップ技術等を活用した、デジタルサイネージ型の「しゃべる」バス停を開発することにより、バス停自身が旅行者や地域の住民に対して、バス路線の利用を促す仕組みを実現するを目指しています。

また近年注目を集めているMaaS(Mobility-as-a-Service)との連携も考えています。

Research Topics

User Generated Content - ユーザ生成コンテンツ

Mobile Voice Interaction Systems - モバイル音声対話システム

Geographical Information Systems - 地理情報システム

バス路線案内システム

デジタルサイネージ

ソーシャルアノテーション

コンテンツ流通

Videos