音声コーパスの誤った公開による情報漏えいとその対応に関するお知らせ(第1報)
2026年3月19日
国立研究開発法人情報通信研究機構(NICT)において、研究用途として公開していた音声コーパスに関し、本来公開対象外である一部の音声ファイルが誤って公開されていた事案が判明しましたので、お知らせいたします。
1. 事案の概要
2026年3月12日(木)午後3時頃、NICTにおいて研究用途向けに「音声合成用日本語複数話者音声コーパス」を公開しました。
2026年3月13日(金)午後9時頃に、公開対象外であるボイスチェック用音声ファイル115名分が、誤って公開用データに含まれていたことが、外部の研究者からの指摘で判明しました。
当該音声ファイルに含まれていた個人情報は、話者の氏名等の人の呼称に限られており、これ以外の個人情報(住所、連絡先、生年月日等)は含まれていません。
2026年3月13日(金)午後9時頃に、公開対象外であるボイスチェック用音声ファイル115名分が、誤って公開用データに含まれていたことが、外部の研究者からの指摘で判明しました。
当該音声ファイルに含まれていた個人情報は、話者の氏名等の人の呼称に限られており、これ以外の個人情報(住所、連絡先、生年月日等)は含まれていません。
2. 判明後の対応
本事案の判明後、2026年3月14日(土)午前9時頃に以下の対応を実施しました。
- 当該音声ファイルを含む音声コーパスの公開停止
3. ダウンロード状況等について
公開されていた期間中に、当該音声ファイルについて最大12件のアクセスが行われた可能性があることを確認しております。
公開時の周知先に対し、当該データの利用停止および削除の要請を実施しており、このうち、連絡が可能であった先につきましては削除のお願いを行い、すでに削除いただいた旨のご連絡をいただいております。
なお、現時点では、当該音声ファイルがインターネット上で流布、二次利用されたといった情報に接しておりません。
公開時の周知先に対し、当該データの利用停止および削除の要請を実施しており、このうち、連絡が可能であった先につきましては削除のお願いを行い、すでに削除いただいた旨のご連絡をいただいております。
なお、現時点では、当該音声ファイルがインターネット上で流布、二次利用されたといった情報に接しておりません。
4. 話者の方々への対応
誤って公開された音声ファイルの話者の方々に対しては、プライバシーに配慮しつつ、個別に事実関係の説明およびお詫びを行う等の対応を進めてまいります。
5. ダウンロードされた方へ
万が一、本コーパスをダウンロードされた方がいらっしゃいました場合には、誠に恐れ入りますが、当該データの削除にご協力いただきますとともに、下記連絡先までご一報くださいますようお願い申し上げます。
6. 今後について
引き続き状況の確認を行い、必要に応じて適切に対応してまいります。
関係する皆様にご心配をおかけしましたことを、深くお詫び申し上げます。
また、NICTでは、本事案を厳粛に受け止め、再発防止に向けて、公開手続きおよび確認体制の見直しを含む必要な対策を講じてまいります。
関係する皆様にご心配をおかけしましたことを、深くお詫び申し上げます。
また、NICTでは、本事案を厳粛に受け止め、再発防止に向けて、公開手続きおよび確認体制の見直しを含む必要な対策を講じてまいります。
用語解説
音声コーパス
音声ファイル群とそれに対応する書き起こし等の付加情報からなるパッケージを指します。
音声認識、音声合成、翻訳、話者認識、音声解析・音響等の研究やアプリ/サービス開発・評価に活用されています。
音声認識、音声合成、翻訳、話者認識、音声解析・音響等の研究やアプリ/サービス開発・評価に活用されています。
本件に関する問い合わせ先
ユニバーサルコミュニケーション研究所先進的音声翻訳研究開発推進センター
先進的音声技術研究室
E-mail: astl
ml.nict.go.jp
ml.nict.go.jp広報
広報部報道室
E-mail: publicity
nict.go.jp
nict.go.jp