誤って公開対象外の音声データを公開、115人分の氏名等 NICT
国立研究開発法人情報通信研究機構(NICT)は3月19日、研究用途として公開していた音声コーパスで本来公開対象外である一部の音声ファイルが誤って公開されていた事案が判明したと発表した。
NICTによると、2026年3月12日(木)午後3時頃から、研究用途向けに「音声合成用日本語複数話者音声コーパス」を公開していたが、同3月13日(金)午後9時頃に、公開対象外であるボイスチェック用音声ファイル115名分が、誤って公開用データに含まれていたことが、外部研究者からの指摘で判明した。音声ファイルに含まれていた個人情報は、話者の氏名等の人の呼称に限られており、これ以外の個人情報(住所、連絡先、生年月日等)は含まれていないという。
指摘を受けてNICTでは14日(土)午前9時頃に当該音声ファイルを含む音声コーパスの公開を停止した。公開期間中に、当該音声ファイルについて最大12件のアクセスが行われた可能性があることを確認したといい、公開時の周知先に対し、当該データの利用停止および削除の要請を実施。現時点では、当該音声ファイルのインターネット上での流布や二次利用は確認されていない。
今後は誤って公開された音声ファイルの話者に対しては、プライバシーに配慮しつつ、個別に事実関係の説明と謝罪対応を進めるとしており、「関係する皆様にご心配をおかけしましたことを、深くお詫び申し上げます。また、NICTでは、本事案を厳粛に受け止め、再発防止に向けて、公開手続きおよび確認体制の見直しを含む必要な対策を講じてまいります」とコメントしている。
※音声コーパス:音声ファイル群とそれに対応する書き起こし等の付加情報からなるパッケージを指す。音声認識、音声合成、翻訳、話者認識、音声解析・音響等の研究やアプリ/サービス開発・評価に活用されている。
この記事を書いた記者
- 主に行政と情報、通信関連の記事を担当しています。B級ホラーマニア。甘い物と辛い物が好き。あと酸っぱい物と塩辛い物も好きです。たまに苦い物も好みます。


