マシンアンラーニングとは
マシンアンラーニングとは、一度AIに学習させたデータの影響を、後から「忘れさせる」技術のことです。利用者が削除を求めたデータを、データベースからだけでなく、学習済みのAIモデルの中からも取り除こうとする取り組みです。
なぜ「消す」のが難しいのか
データベースから記録を消すだけなら簡単ですが、それではAIは忘れてくれません。学習したデータは、モデルの内部に溶け込むように記憶されているからです。かといって、対象のデータを抜いて最初から学習し直すのは時間も費用もかかりすぎます。そこで、影響を効率よく打ち消す工夫が研究されており、データを小分けにして学習しておき、必要な部分だけをやり直す手法などが知られています。
差分プライバシーとの違い
個人を守る似た技術に差分プライバシーがありますが、こちらは学習の最初から個人が分からないようにしておく「予防」の発想です。対してマシンアンラーニングは、すでに学習させてしまった後に消す「事後対応」にあたります。守りの段階が違うと整理すると分かりやすいでしょう。
「忘れられる権利」への備え
欧州のGDPRなどがうたう「忘れられる権利」への技術的な答えとして注目されています。利用者から「私のデータを消して」と求められたとき、AIモデルからもその影響を消せるかどうかは、これからの企業にとって法令順守の課題になります。ただし完全に忘れさせる方法はまだ研究の途上にあり、確立した万能の手立てがある段階ではありません。
Topic「データを消してもAIは覚えている」が出発点
この分野が生まれたきっかけは、皮肉な発見でした。AIへの攻撃によって「ある人のデータが学習に使われたか」を言い当てられると示され、消したはずのデータの痕跡がモデルに残っていると分かったのです。だからこそ「学習済みのAIから本当に忘れさせる」という新しい研究テーマが必要になりました。
マシンアンラーニングに関するよくある質問
- なぜ「AIに忘れさせる」研究が必要になったのですか?
- 皮肉な発見がきっかけでした。AIへの攻撃によって「ある人のデータが学習に使われたか」を言い当てられると示され、消したはずのデータの痕跡がモデルに残っていると分かったのです。欧州のGDPRなどがうたう「忘れられる権利」に応えるため、「学習済みのAIから本当に忘れさせる」という新しい研究テーマが必要になりました。
- なぜAIに「忘れさせる」のが難しいのですか?
- 学習したデータはモデルの内部に溶け込むように記憶されているため、データベースから記録を消してもAIは忘れてくれません。かといって対象データを抜いて最初から学習し直すのは時間も費用もかかりすぎます。そこでデータを小分けに学習しておき必要な部分だけやり直すなど、影響を効率よく打ち消す工夫が研究されています。
- 差分プライバシーとは何が違いますか?
- 差分プライバシーは学習の最初から個人が分からないようにしておく「予防」の発想ですが、マシンアンラーニングはすでに学習させた後に消す「事後対応」です。完全に忘れさせる方法はまだ研究の途上にあり、確立した万能の手立てがある段階ではありません。