NICT NEWS
トップページ
社会インフラとしての情報通信技術を支える 福永 香
玉石混淆のWebコンテンツ 木俵 豊
みんなの翻訳 内山 将夫
生きた細胞を用いた新しい分子通信解析手法の開発 小林 昇平
平成21年度新規採用者紹介
-トピックス- John L.Hall博士 NICT来訪
-トピックス- 受賞者紹介
-トピックス- 平成22年度パーマネント総合職員採用情報
リサーチ

みんなの翻訳 ボランティア翻訳者の支援と翻訳の自由な流通のためのWebサイト 知識創成コミュニケーション研究センター 言語翻訳グループ 主任研究員 内山 将夫

ボランティアによる翻訳

ボランティアの翻訳者は、様々な文書を翻訳しています。その中には、例えば、オープンソースソフトウェア(ソースコードを公開し、みんなで協力して開発するソフトウェア)のマニュアルの翻訳や、ブログの翻訳、NPO/NGOの文書などの翻訳があります。
 ボランティアの翻訳者は、翻訳により、世の中に貢献していると言えます。例えば、マニュアルの日本語訳は、日本人のユーザーにとっては、大変有り難いものですし、ブログの翻訳は、他のメディアが注目しない場所や人々について光を当てるものと言えます。
 したがって、ボランティアの翻訳者を支援することは、世の中に貢献することと言えます。
 また、日本にいるボランティアの翻訳者は、現在、数千人程度ですが、外国語特に英語を翻訳できる潜在的なボランティア翻訳者の数は、数十万人程度ではないかと思われます。
 そのため、翻訳をしたい人が、簡単に翻訳ができる環境を提供すれば、現状よりも、もっと多くの人が翻訳をするようになり、より多くの外国の情報を取り込めるとともに、日本の情報を発信することもできるようになると思います。
 このような動機から、NICT言語翻訳グループでは、東京大学図書館情報学研究室と共同で、「みんなの翻訳」というWebサイト (図1) を開設しました。
 みんなの翻訳の特徴は、(1)東京大学で開発された高機能な翻訳支援エディタQRedit を誰もが利用できること、(2)みんなの翻訳で公開されている翻訳には、「一定の条件の下で、二次的著作物を作成し、それを公開しても良い」というライセンスが付与されているため、適切な使用であれば、翻訳を利用できるということ、(3)三省堂の協力により「グランドコンサイス英和辞典(36万項目収録)」が翻訳支援に利用できることです。

図1●「みんなの翻訳」サイト(http://trans-aid.jp/)

高機能な翻訳支援エディタQRedit

翻訳支援エディタQReditの基本設計理念は、以下の4点に集約されます。(1)新たな情報・機能を提供するのではなく、翻訳者が現に行っている作業の手間を省く、(2)システムが決めるのではなく翻訳者が決めるのに必要な情報を提供する、(3)翻訳者の発想を豊かにする情報を表示する、(4)できるだけシンプルにする。これらの方針は、翻訳者へのインタビュー及び現状の翻訳支援技術の水準に基づいて決めました。
 QReditでは、入力された原文に対し、複数の辞書や翻訳者が登録した用語を対象に辞書引きを行い、翻訳者は単語をクリックすることで簡単にその訳語を把握することができます。また、高度な熟語検出機能を備えていて、熟語の辞書引きもできます。
 これらの熟語に対して、QReditでは、図2のように、下線を引いて示すなどして、翻訳者が見落とさないようにしています。熟語は、熟練翻訳者でも誤訳する可能性がありますので、このように、エディタ側から何らかの警告を与えることは有用です。
 そのほかにも、QReditには、Web検索や、用語登録機能があり、用語を登録すると、その用語をQRedit内から検索できます。この検索は、自分が登録した用語だけでなく、他の人が登録した用語も同様に検索できますので、みんなの翻訳で公開されている用語が増えれば、辞書に載っていない用語であっても、辞書引きができるようになります。

図2●翻訳支援エディタ QRedit

翻訳の共有

翻訳結果を共有するためには、原文と翻訳文の使用許諾について考慮する必要があります。例えば、当然ですが、原文の著者が翻訳文の公開を許可していない場合には、翻訳文は公開できないので、翻訳結果を共有することはできません。
 そのため、みんなの翻訳の利用者には、原文と翻訳文の使用許諾について確認を求めています。また、みんなの翻訳の利用者には、各自が翻訳した文は、二次的利用ができるように許可することを求めています。そのために、システムは、みんなの翻訳の利用者が翻訳文を保存するときに、以下のようにして、使用許諾などを確認しています(図3)。

図3●文書の使用許諾権の設定

(1)システムは、「あなたが翻訳の対象とした文書(原文)は、原文著者が明示的に許可している場合を除いて、私的な利用その他など、著作権法で認められている範囲でしか利用できません。原文著者は、その翻訳を公開しても良いと(あなたや他の人に)許可をしていますか?」と確認します。(2)それが「はい」の場合には、システムは、クリエイティブ・コモンズ等の「あなたの文書から二次的著作物を作成し、それを公開しても良い」という条件に矛盾しない使用許諾条件を設定してもらうようにしています。
 このようにして、みんなの翻訳では、原著者や翻訳者の著作権を尊重しつつ、翻訳を共有できる仕組みを準備しています。

今後の展開

みんなの翻訳は2009年4月8日に一般公開しました。それから1か月ほどで、500人程度のユーザーが登録しています。また、アムネスティインターナショナル日本を含む四つの翻訳グループにも使っていただいています。
 現状のみんなの翻訳は、英日及び日英の翻訳しかサポートしていませんが、これを多言語に展開するとともに、共有された翻訳や用語を有効利用するための言語処理技術を研究開発していきたいと思います。


Profile

内山 将夫 内山 将夫(うちやま まさお)
知識創成コミュニケーション研究センター 言語翻訳グループ 主任研究員
大学院博士課程修了後、2001年に通信総合研究所(現NICT)入所。自然言語処理一般、特に言語翻訳の研究に従事。博士(工学)。

独立行政法人
情報通信研究機構
総合企画部 広報室
広報室メールアドレス
Copyright: National Institute of Information and Communications Technology. All Rights Reserved.
NICT ホームページ 前のページ 次のページ 前のページ 次のページ