Data Privacy Riskとは
Data Privacy Riskとは、生成AIの入力・学習・出力を通じて個人情報や機微情報が漏えい、再識別、不正利用されるリスクです。NIST AI 600-1では、生体情報、健康、位置情報、その他の個人を識別できる情報への影響として説明されています。経営判断では、AIに何を入れてよいかを決める情報管理の問題として扱うと分かりやすいです。
入力情報と学習データの両方を見る
生成AIのプライバシー事故は、社員がチャット欄に顧客情報を貼る場面だけではありません。学習データや評価データに個人情報が混ざる、出力から個人が推測される、匿名化したつもりの情報が別データと組み合わされる、といった形でも起きます。
NISTは、モデルが訓練データを記憶してしまうデータ記憶の問題にも触れています。入力禁止リスト、データ保持設定、ログの閲覧権限を合わせて確認しないと、Information Security for GenAIだけを見ても足りません。
ビジネスでの使われ方
社内FAQ、営業支援、採用、医療や金融の相談支援では、Data Privacy Riskが特に表面化します。AIが便利でも、顧客名、住所、病歴、取引履歴をそのまま投入する運用は危険です。
紙の書類を外部業者に渡すときの確認を、AI入力にも適用するとイメージしやすいでしょう。Human-AI Configurationの面では、社員がAIを「安全な社内メモ帳」と思い込まない教育も必要です。
Topic「匿名化したから安全」とは限らない
NISTは、個人情報だけでなく再識別のリスクもData Privacyの中に含めています。名前を消したデータでも、位置、職種、時刻、購買履歴が組み合わさると個人が推測される場合があります。生成AI導入では、入力欄だけでなく、ログ、評価データ、外部連携先まで見る必要があるでしょう。
Data Privacy Riskに関するよくある質問
- 匿名化したデータならAIに入れても安全ですか?
- 名前を消しても、位置情報や購買履歴などを組み合わせると個人が推測される場合があります。匿名化の方法と再識別の余地を確認してください。
- まず社内で決めるべき入力ルールは何ですか?
- 顧客名、連絡先、健康情報、取引履歴など、投入禁止の情報を具体的に列挙します。あわせてログ保存と学習利用の設定も確認します。