2

前号 | 次号 | NICTホームページ


灘本明代 (なだもと あきよ) - 情報通信部門 けんはんな情報通信融合研究センター メディアインタラクショングループ研究員

民間の研究所をいくつか経験後2002年独立行政法人通信総合研究所(現在NICT)に入所。主にインターネットと放送の コンテンツ変換・融合に関する研究に従事。博士(工学)


はじめに

テレビは、利用者が「見る」「聞く」という受動的な動作によって情報を取得することができます。つまり、子供から お年寄りまで誰でも情報を取得できるとともに、寝転がりながらや家事等の他の仕事をしながら見聞きしていても、容易に 情報を得ることができます。一方、Web(World Wide Web)も、現在ではテレビやラジオと同じように一般的なメディアの 一つとなってきています。コンピュータの専門家でなくても、コンピュータを操作できればWebを閲覧することにより、 インターネット上の希望する情報を取得することが可能となっています。しかしながら、現在のWebの閲覧環境は、 利用者に「クリックする」「スクロールする」「読む」といった能動的な操作を要求します。これでは、コンピュータを 操作できない人はインターネット上にある情報を享受することができなくなります。また、コンピュータを操作できる人でも、 状況に応じて、寝転がりながらWeb情報を見たい、家事をしながらテレビを見るようにWebの情報をより利便性高く取得 したいという需要があると考えられます。そこでわれわれは、 Webページを、テレビ番組のようなコンテンツ(放送型 コンテンツと呼びます)に自動変換することにより、誰でも「容易に」「楽しく」「片手間に」Webの情報が取得できると 考え、Webコンテンツから放送型コンテンツへの自動メディア変換に関する研究を行っています。

システムの概要

図1に示すように、われわれは、キャラクターアニメーションと音声合成技術の活用により、Webページを放送型コンテンツに 自動変換するシステム開発を行っており、本システムをWeb2TVと呼んでいます。Web2TVでは、音声合成を用いてキャラクター がWebの文章を読み上げるとともに、キャラクターの台詞のタイミングに合わせてWebページに含まれている画像を提示します。 技術的には、Webページの論理的な構造(HTML文書の構造)を解析することで、その画像の説明に該当する文章を自動的に 発見したり、キャラクターの台詞となる文を抽出します。このような放送型コンテンツを自動変換して作り出すには、 実際のテレビと同様に、キャラクターの動きやカメラワーク、ライトの設定等の演出効果をどのように盛り込むかが重要です。 そこで、どのような演出をすればよりわかりやすいコンテンツになるかといった演出効果の研究も行っています。また、 一般的にWebページは平叙文で書かれていますが、この平叙文をそのままCGキャラクターが読み上げても、親しみのある コンテンツに変換されたとは言えません。そこで、われわれは、Webページの平叙文を、自動的に複数のキャラクターの 対話に変換することにより、より親しみのある放送型コンテンツに変換できると考え、対話文生成によるWebコンテンツの 放送型コンテンツへの変換の研究も行っています。具体的には、対話文を自動的に生成する際に、Webページから自動抽出 したキーワード群の情報をもとに、元の文章を質問・応答文に変換したり、理解が難しい単語を推定してその単語をより やさしい単語に言い換えたりしています。 Webページからの対話文生成の応用として、Webページを漫才風の放送型コンテンツに変換することを試みました。漫才は、 子供からお年寄りまで、気軽で親しみのあるコンテンツの一つであると考え、漫才風の放送型コンテンツを生成する 「漫才の泉」を開発しました。漫才の泉では、ユーザが指定したWebページをその場でリアルタイムに漫才風の放送型 コンテンツに変換し提示します(図2、3、4参照)。漫才の泉によりニュースサイトの記事などを、テレビの漫才番組を 見るように楽しみながら、また、分かり易く享受することが可能となります。

携帯電話への応用

携帯電話はコンピュータに比べてディスプレイが小さく、また、操作ボタンの数やその機能がパソコンに比べて制限が あるため、コンピュータ用にデザインされたWebページをそのままで閲覧することは困難です。そこで、我々が提案する Web2TVを携帯電話に応用したシステムの開発も行っています(図5参照)。このシステムでは、利用者が指定したWebページを ニュース番組風の放送型コンテンツに変換し、携帯電話へ音声付きビデオとして転送します。これによって、利用者は戸外や 移動中でも携帯電話でテレビ番組を見るように、Webの情報を取得することができるようになります。

おわりに

Webページをテレビ番組のような放送型コンテンツに変換することにより、デジタルデバイドと呼ばれる、コンピュータを 操作するのが不得手であった人や、作業中で手がはなせないためパソコンの操作が行えずWebを閲覧できなかった人も、 「容易に」「楽しく」「片手間に」Webの情報を享受することが可能となります。また、デジタル放送の開始とともに、 テレビのコンテンツ不足も指摘されています。今後は我々の研究成果のクオリティを上げ、実際のテレビ番組の品質に 近づけられれば、テレビ業界のコンテンツ不足の解消にもなると考えています。なお、この研究は現在、けいはんな オープンラボプロジェクト「コンテンツ融合環境構築技術とその社会的活用」の一環として、NHK放送技術研究所および 野村総合研究所との共同研究を行いながら推進しています。


Q. Web2TVの仕組みを紹介してください。
A. まずWebのテキスト言語であるHTMLの構造を解析し、そこから画像とテキストが同期する領域を発見するとともに、 キャラクターの台詞となるテキストを抽出します。抽出されたテキストからキーワードとなる単語を抽出しそのキーワード に基づいた対話文を生成して台本を作成します。作成された台本に演出を付加し、TVMLに変換してテレビ番組のような コンテンツを作成します。TVMLとはNHK放送技術研究所が開発した、テレビ番組を制作するためのコンピュータ言語です。
Q. 携帯電話でも見られるようになるといいますが、どのようなことですか。
A. 携帯電話側では専用の検索システムを使って見たいページを指定し、システム(サーバ側)に送ります。システムは 指定されたWebページをWeb2TV システムを使ってテレビ番組のようなコンテンツに変換し、さらにそれを携帯電話用の 動画像に変換します。利用者はその動画像を携帯電話で受信し、視聴することにより、容易に、楽しくWebコンテンツを 入手することができます。

通信と放送のコンテンツ融合によって、さまざまな課題が解消
現在は実験段階ですが、Webページから漫才メタファを用いて漫才のような対話生成を行い、キャラクタアニメーションと 合成音声によって、テレビ番組のような放送型のコンテンツへの変換に成功しています。この様子は、2004年7月に けいはんな情報通信融合研究センターの一般施設公開でも公開されました。こうした技術が完成し、普及することで、 デジタルデバイドの解消はもちろん、本格化するデジタル放送のコンテンツ不足解消にも役立つものと期待されています。