HTML5 Webook
26/194

読み方が変わるため、低い評価となっている。最後の『諾否疑問文の平叙文との違い』は、「はい」か「いいえ」で答えるタイプの疑問文を同じ内容の平叙文と識別する手がかりが「語尾上げ」などイントネーション以外にあるか、という項目である。ASR・TTSのいずれにも関わるが、前者で課題となることが多い。多言語化の体制2022年度の時点で、対象とする21言語すべての母語話者が研究室に在籍する。外国語大学/学部を除くと、これだけ多言語の話者がいる研究/開発環境は国内では稀有であろう。彼女ら彼らの担当業務は多岐にわたり(後述)、研究開発のあらゆる段階で欠くべからざる役割を果たしているが、当初からこの体制をとっていたわけではなく、研究開発フェーズの移行とともに段階を経て現在の体制に行き着いた。その変遷の過程と現状を述べる。まず、最初の段階は国際共同研究の形態であった。各言語における開発をその言語が話される国・地域の研究機関や大学が担当する。ごく初期には各機関同士で一対一の協定を結んでいたが、それは速やかに国際コンソーシアムの枠組へと移行した。これには、新たな機関が加わるごとに関係機関全てと個別協定を結び直す必要がないという利点がある。前身の研究開発における体制が日米独3か国の機関によるC-STAR(Con-sortium for Speech Translation Advanced Research, 1991年〜)で始まり、A-STAR(Asian Speech Transla-tion Advanced Research Consortium, 2006年〜)を経て、U-STAR(Universal Speech Translation Advanced Research Consortium, 2010年〜)へと引き継がれた。NICTは2006年4月から2016年3月までこれらを事務局として支えた。国際共同研究の形態は、各言語に依存した人的物的資源が現地で得られやすいという利点があり、また国際研究交流などアピールポイントも多い。しかし、開発が進み、実用システムを組み上げる段階では、各機関における開発ペースの違い等のために、どうしても言語間で不均衡が生じてしまう。そこで、各言語を担当する研究者をNICTで受け入れる形態を一部の言語について取り入れた。主に東南アジア地域の大学・研究機関から招へい研究員・研修員を招き、数言語でほぼ白紙の状態から公開モデルの完成まで漕こぎ着けた。特に、ミャンマー語のシステムは、2015年12月の公開時点では同言語として世界初の音声翻訳アプリであったこともあり、2022年現在もトップの日本語に迫る利用数を保つ人気を博している[2]。他機関から研究者を受け入れる形態は、あくまで本人の研けん鑽さん・研修が主目的であり、相手機関との間で目的とスケジュールのすり合わせが必要である。より速く広い多言語化の需要に応えるためには、開発の全過程を単一機関の管理下で行うことが理想的である。そこで、研究開発サポート業務を専門とする母語話者の「言語担当者」を研究室内に置く体制へと移行した。これには、開発成果の権利をNICTが保持することが容易になるという利点もあった。言語担当者は国内在住者から募ったが、専門分野が音声や言語であることを必須の条件とはしなかった。これは、言語によっては国内に候補者が僅少であることが予想されたためであったが、研究開発フェーズが言語によらない手法にシフトしていたから可能であったことも事実である。言語担当者は主に下記のような役割を担い、効率的かつ高品質な多言語化に貢献する。まず、最も基本的な役割は、音声・言語コーパスの品質の向上と維持である。他章で述べたように、機械学習によるASR・TTSでは学習に用いる音声・言語データの量と質の両方が性能を左右する。量が少ない場合に質が重要なのは言うまでもないが、量を増やしても質が十分でなければ性能は頭打ちとなる。音声コーパスの質は、コーパス全体としての発話内容の多様性や網羅性、雑音・残響の程度など音響的な健全性のように母語話者でなくても評価可能な部分もあるが、当該言語としての質、すなわち発話の正確性・了解性・自然性、表現の規範性・自然性などの部分は母語話者以外には評価し難い。書き起こしテキストが音声に正しく対応しているか、話者が訛なまっていないかなどの評価も同様である。次に、本特集号2-2-1で述べた多言語対訳辞書など翻訳データの品質向上にも言語担当者が貢献する。翻訳自体は外部の翻訳者に依頼するが、対訳辞書の対象は音声・言語コーパスに出現しにくい語彙なので、一般の辞典には掲載されておらず、翻訳の方法が定まっていないものが多い。日本の地名や施設名など固有名詞も多く含まれるため、ローマ字が使える(=正書法がラテン文字の)言語以外では日本語の転写も問題となる。そこで、NICTの担当者が様々なタイプの語彙に対する翻訳方針を定めた『辞書翻訳ガイドライン』並びに『日本語音写ガイドライン』をあらかじめ作成することで品質の統一を図るとともに事後の評価も担当する。以上については、言語担当者自らが音声を書き起こしたり、対訳を作成したりすることもあるが、音声・テキストともにデータ量が膨大なため、少量を抜き取って検査した結果をコーパスや翻訳データの作成者に返して改善を促す、という役割が中心である。最後に、ASR・TTSシステムの評価も重要な役割である。システムの更新時にていねいな評価を実施する320   情報通信研究機構研究報告 Vol.68 No.2 (2022)2 多言語コミュニケーション技術

元のページ  ../index.html#26

このブックを見る