本文へ
文字サイズ:小文字サイズ:標準文字サイズ:大
  • English Top

“英語特許文”の高精度「自動翻訳ソフトウェア」を開発

~NICTとニッパツが特許向け英日翻訳技術を共同開発し、5月にサービス開始~

  • 印刷
2013年3月21日

独立行政法人 情報通信研究機構(以下「NICT」、理事長: 宮原 秀夫)と日本発明資料株式会社(以下「ニッパツ」、代表: 森 紀二)は、共同で、“英語の特許文献(特許や実用新案など)”を日本語に自動的に翻訳する「自動翻訳ソフトウェア」を開発しました。本技術では、従来技術に比べて、大幅に翻訳誤りを削減しました。平成25年5月に、ニッパツが、この英日自動翻訳ソフトウェアを活用したサービスを開始します。

背景

近年、海外で増加している特許の侵害・訴訟リスクを回避するため、外国の特許文献の検索や内容把握が不可欠となっており、日本語への翻訳ニーズが高まっています。しかし、人手による翻訳には費用と時間が莫大にかかる一方で、日本語への自動翻訳システムには精度が低いという問題があります。

特許文は、一文が非常に長く、また、英語や中国語の文法は、日本語の文法と全く異なります。そのため、翻訳の際、語順の変換が難しく、さらに、大量の専門用語の訳語を正確に選択することが求められます。このように特許文の翻訳は大変困難なため、完璧な翻訳を目指すのでなく、多少の不自然さを許容しても通じる翻訳の実現が目指されています。

NICTは、特許などの長文の自動翻訳技術の高精度化を目指して統計翻訳技術の高度化に取り組んでおり、昨年11月には、研究成果を活用した中国語から日本語への自動翻訳の事業化について、報道発表しました。

今回の成果
NICTの自動翻訳方式
NICTの自動翻訳方式

このような背景の下、NICTとニッパツは、それぞれの技術を連携させることによって、特許文の英語から日本語への自動翻訳技術の高精度化を目指した共同開発を行ってきました。

①NICTの技術: 語順変換や専門用語の訳語選択を高精度に実現する英日自動翻訳技術(出願済、補足資料 図1参照
②ニッパツの技術: 特許特有の文体を解析して、翻訳精度と読みやすさを向上するMT Plus技術

NICTとニッパツが共同で開発した「英日自動翻訳ソフトウェア」では、(特許要約1件あたりの)訳語誤り数を従来技術と比べて、約12分の1に削減するという高い品質を実現しました(ニッパツ調べ: 補足資料 図2及び表 1参照)。

今後の展望

今回開発した「英日自動翻訳ソフトウェア」によってニッパツは、①英語特許文献を日本語に翻訳するサービス、②日本語に自動翻訳した英語特許文献データベース、③MT Plus対訳公報などの販売を平成25年5月から開始する予定です。

NICTは、特許を含む多分野での長文翻訳の品質を今後更に改善するために、新たな技術の研究を推進してまいります。

補足資料

図1 NICTの自動翻訳方式


図1 NICTの自動翻訳方式
NICTの自動翻訳方式では、文法が異なる言語間の翻訳の際、自動学習した語順変換規則に従って、語順を変換した後、自動学習した確率付きの対訳辞書を用いて訳語を選択します。


図2 特許要約あたりの平均訳語誤り数の比較

図 2 特許要約あたりの平均訳語誤り数の比較
今回、NICTとニッパツが共同開発した「英日自動翻訳ソフトウェア」(一番右: MT Plusを追加)では、従来技術に比べて、特許要約あたりの平均訳語誤り数を約12分の1に削減しました。


表 1 英語要約における自動翻訳の訳文の比較
英語原文 The utility model discloses a multi-shaft drive hybrid power vehicle drive system, comprising a first engine power source; the output of the engine is connected with a speed change mechanism; the output of the speed change mechanism is connected with a transmission mechanism to drive a first driving shaft. The system also comprises a set of power source different from the power source of the engine; the output of the set of power source is connected with a variable transmission mechanism; the output of the variable transmission mechanism is connected to a driving shaft which is different from the first driving shaft. As a plurality of vehicle shafts are arranged, the bearing capacity of the vehicle is greatly improved and unrestricted; the system has simple structure and eliminates the complicated transfer devices; the combination forms of the motor drive and the engine drive are diversified and can be flexibly controlled; therefore, under the precondition of guaranteeing the off-road and passing performances of vehicles, the utility model can greatly increase the carrying capacity of vehicles, achieve the optimization of energy utilization, reduce the system complexity, improve the driving and braking abilities of vehicles, decrease emissions and energy consumption, reduce vehicle weight and lower cost.

従来技術の訳文
実用新案は最初のエンジン出力出所を含んで、多重シャフトドライブ・ハイブリッド動力車両駆動系を開示する; エンジンのアウトプットは速度変換機構と関係がある; 速度変換機構のアウトプットは最初の駆動軸を運転するために波及経路と関係がある。システムはさらにエンジンのパワーソースと異なる1セットのパワーソースを含む;パワーソースのセットのアウトプットは可変波及経路と関係がある;可変波及経路のアウトプットは、最初の駆動軸とは異なる駆動軸に接続される。複数の乗り物軸体が準備されるとともに、乗り物の地耐力は非常に改善され無制限である;システムは単純構造を持っており、複雑な切換装置を除去する;電動部とエンジンドライブのコンビネーション・フォームは多様化し、柔軟にコントロールすることができる;したがって、乗り物のオフロードで通過する実行を保証する必須条件の下で、実用新案は大幅に増加する場合がある、乗り物の環境収容力、エネルギー利用の最適化を達成する、システムの複雑さを縮小する、乗り物の駆動でと制動能力を高める、減少する、放射およびエネルギー使用量、乗り物重量およびより低コストを減らす。

NICTの自動翻訳の訳文
ユーティリティモデルは、多軸駆動型のハイブリッド動力車両駆動システムを開示、第1のエンジン動力源を備え、エンジンの出力が変速機構に接続され、変速装置の出力は、第1の駆動軸を駆動する伝達機構に接続されている。システムはまた、エンジンの電源とは異なる電源のセットを含み、電源のセットの出力は、可変伝達機構と接続し、可変伝達機構の出力は、第1の駆動シャフトとは異なるされた駆動軸に接続されている。車輪が複数配置されるように、車両の支持力が大幅に改善され、制限され、システムは、簡単な構造を有し、複雑な搬送装置を除去し、モータ駆動とエンジン駆動の組み合わせの形態は様々であるかつ柔軟に制御することができるため、オフロードを保証し、車両の性能を通過する前提で、ユーティリティモデルは、車両の運搬能力を大幅に増大し、エネルギー利用の最適化を図り、システムの複雑さを減らし、車両、排出物や消費エネルギーの駆動・制動能力を高める、車両重量を低減し、下できる

ニッパツの技術で改良したNICTとニッパツの共同技術の訳文
実用新案は、多軸駆動型ハイブリッド動力車両駆動システムについて開示する。第一のエンジン動力源を有すること、と、
エンジンの出力は変速機構と接続すること、と、
変速機構の出力は、第一の駆動軸を駆動する伝達機構と接続する。システムはまた、エンジンの電源とは異なる電源のセットを有すること、と、
電源の組の出力は、可変伝達機構と接続すること、と、
段変速機構の出力は、第一の駆動シャフトとは異なるされた駆動軸に接続されている。複数の車輪が配置されるように、車両の支持力が大幅に改善され、自由であること、と、
このシステムは、簡単な構造を有し、複雑な伝送装置を排除すること、と、
モータ駆動とエンジン駆動の組み合わせ形態は、多種され、柔軟に制御可能なこと、と、
このため、オフロードを保証し、車両、実用新案の性能を通過する前提で、車両の運搬能力を大幅に高めることができる。エネルギー利用最適化を図る。システムの複雑さを減らす。車両の制駆動能力を高める。排出物およびエネルギー消費。車両重量及びコストを低減する。

  • 英語原文のサンプルについて、異なる3つの方法で自動翻訳した結果を比較しました。
    ①従来技術による翻訳
    ②NICTの自動翻訳の訳文
    ③ニッパツのMT Plus技術によって②を更に改良した訳文
  • 「訳語誤り(赤字)の個数」は、①から②、②から③と削減されることが分かります。このように、NICTとニッパツが共同で開発した「英日自動翻訳ソフトウェア」は、相補的に動作して、大幅に「訳語誤りの個数」を削減することに成功しました。
  • アメリカ、欧州、中国等から、英文の知財情報が提供されており、英語を翻訳対象とすることによって、幅広い知財情報を調査することが可能となります。ここのサンプルは、中国実用新案201165194の英語要約です。

用語 解説

特許の侵害・訴訟リスク

産業構造審議会 知的財産政策部会 第18回(平成24年6月25日)配布資料
「知財立国に向けた新たな課題と対応」より
http://www.jpo.go.jp/cgi/link.cgi?url=/shiryou/toushin/shingikai/sangyou_kouzou.htm

統計翻訳技術

統計翻訳技術では、原文とその訳文の対を集めた対訳コーパスから二言語間の単語や句の対応関係を抽出した翻訳モデル(確率付きの対訳辞書と語順変換表)と 訳文の言語らしさを表現する言語モデル(英日翻訳であれば、並びの自然さを表す確率付き日本語の単語連鎖データ)を導出し、これらの確率の積を最大化する訳文候補を出力する。

NICTの報道発表資料

2012年11月5日発表
「“中国語 特許文”の高精度「自動翻訳ソフトウェア」を開発
~JapioとNICTが中日翻訳技術を共同開発し、デモを公開。来春事業化へ~」

MT Plus技術

MT Plusでは、特許公報の各段落単位の独自表現の対応、特に要約、請求の範囲については、英文手がかり句解析を行い、発明の構成要素(複数)と発明対象を正しく分離・列挙することを可能とし、構成要素単位に「、と、」改行で区切る表現並びに日本特許公報の定型文体「・・を特徴とする○○○」の表現を可能とした。また、数式や数値範囲指定・化学式・表など非テキスト部についても、原文を忠実に再現できるようにした。
http://www.nefnet.co.jp/wp-content/uploads/2012/07/MTPlus.pdf



問い合わせ先

<事業計画・MT Plusについて>

日本発明資料株式会社
春日 邦夫
Tel: (代)03-3500-1461
Fax: 03-3500-1464
E-mail:

<自動翻訳技術について>

NICT ユニバーサルコミュニケーション研究所
隅田 英一郎
Tel: 0774-98-6350
Fax: 0774-98-6955
E-mail:

<取材依頼 及び 広報について>

NICT 広報部 報道担当
廣田 幸子
Tel: 042-327-6923
Fax: 042-327-7587
E-mail: