世界初の「携帯電話音声翻訳サービス」を開発
知識創成コミュニケーション研究センター MASTARプロジェクトでは、言葉の壁を乗り越え、さまざまな話題や環境で話された日常の話し言葉を、正しく認識したり、翻訳・合成したりする技術や、インターネット上に流通するさまざまな情報を翻訳する技術を研究開発し、言語の壁を
乗り越えた新しいコミュニケーションの実現を目指しています。
本プロジェクトの活動の一環として、音声翻訳の研究開発及び成果展開の推進を目的とした音声翻訳モニター実証実験を北京市内ほかで2008年8月から9月にかけて行いました。
この実験のために、携帯電話に向かって海外旅行会話を中心とした日常会話を話しかけると、中国語への翻訳結果が音声で再生される世界で初めての「携帯電話音声翻訳サービス」を新たに開発し、北京オリンピック観戦ツアーなどに参加する日本人旅行者や北京在住の日本人のモニターを募集し、実際に北京市内で利用してもらいました。
モニターには、観光、ショッピング、道案内等で、このサービスを使って中国の人とコミュニケーションしていただくとともに、その体験についてアンケートにも答えてもらい、実際の発話を収録しました。
写真は、携帯電話音声翻訳サービスのイメージを示したものです。このサービスでは、次のような新しい機能が導入されています。
- あらかじめ幾つかの文を発声することでユーザーの声の特徴を登録することができます。
- 場所や場面に応じて、それぞれの条件に合った言葉の辞書に切り替えることができます。
- 翻訳結果の音声を合成することができます。
- 翻訳結果を再度元の言語に翻訳して、翻訳結果が正しいかどうかを確認することができます。
実証実験と開発の両面から使いやすいシステムを実現
また、今回の実験のために、中国の清華大学と協力して北京市内の観光、ショッピング、移動、食事に用いられる数千語の固有名詞辞書を新たに整備しました。本実験では、「携帯電話音声翻訳サービス」以外に、ビジネス手帳大の小型のパソコンに音声翻訳のすべての機能を内蔵した「音声翻訳専用機」での実験も行いました。モニターからのアンケート結果によれば、音声を音声に翻訳する技術への期待は大きく、自動音声翻訳機を早く実用化してほしいという声が多かったほか、携帯電話で音声から音声への翻訳が実現されていることについて、技術がここまで進展していることについての驚きの声が聞かれました。その反面、さまざまな言い回しを正しく音声認識・翻訳してほしい、レストランや品物の名前など単語をもっと入れてほしい、スムーズな会話が可能なように処理速度を速くしてほしい、初めての人でも使いやすい画面インタフェースにしてほしい、相手の声も精度良く認識してほしいなどのさまざまな意見が寄せられました。
今後、得られたデータを分析し研究開発を加速するとともに、このような実証実験と開発の両輪を回していくことにより、より使いやすいシステムを実現していきます。
Profile
清水 徹(しみず とおる)
知識創成コミュニケーション研究センター
音声コミュニケーショングループ専門研究員
大学院修了後、国際電信電話(株)(現KDDI(株))研究所、国際電気通信基礎技術研究所研究室長を経て、2006年より現職。音声合成、自然言語処理、音声認識の研究とシステム開発に従事。