マシンアンラーニングとは

マシンアンラーニングとは、一度AI学習させたデータの影響を、後から「忘れさせる」技術のことです。利用者が削除を求めたデータを、データベースからだけでなく、学習済みのAIモデルの中からも取り除こうとする取り組みです。

なぜ「消す」のが難しいのか

データベースから記録を消すだけなら簡単ですが、それではAIは忘れてくれません。学習したデータは、モデルの内部に溶け込むように記憶されているからです。かといって、対象のデータを抜いて最初から学習し直すのは時間も費用もかかりすぎます。そこで、影響を効率よく打ち消す工夫が研究されており、データを小分けにして学習しておき、必要な部分だけをやり直す手法などが知られています。

差分プライバシーとの違い

個人を守る似た技術に差分プライバシーがありますが、こちらは学習の最初から個人が分からないようにしておく「予防」の発想です。対してマシンアンラーニングは、すでに学習させてしまった後に消す「事後対応」にあたります。守りの段階が違うと整理すると分かりやすいでしょう。

「忘れられる権利」への備え

欧州のGDPRなどがうたう「忘れられる権利」への技術的な答えとして注目されています。利用者から「私のデータを消して」と求められたとき、AIモデルからもその影響を消せるかどうかは、これからの企業にとって法令順守の課題になります。ただし完全に忘れさせる方法はまだ研究の途上にあり、確立した万能の手立てがある段階ではありません。

Topic「データを消してもAIは覚えている」が出発点

この分野が生まれたきっかけは、皮肉な発見でした。AIへの攻撃によって「ある人のデータが学習に使われたか」を言い当てられると示され、消したはずのデータの痕跡がモデルに残っていると分かったのです。だからこそ「学習済みのAIから本当に忘れさせる」という新しい研究テーマが必要になりました。

マシンアンラーニングに関するよくある質問

なぜ「AIに忘れさせる」研究が必要になったのですか?
皮肉な発見がきっかけでした。AIへの攻撃によって「ある人のデータが学習に使われたか」を言い当てられると示され、消したはずのデータの痕跡がモデルに残っていると分かったのです。欧州のGDPRなどがうたう「忘れられる権利」に応えるため、「学習済みのAIから本当に忘れさせる」という新しい研究テーマが必要になりました。
なぜAIに「忘れさせる」のが難しいのですか?
学習したデータはモデルの内部に溶け込むように記憶されているため、データベースから記録を消してもAIは忘れてくれません。かといって対象データを抜いて最初から学習し直すのは時間も費用もかかりすぎます。そこでデータを小分けに学習しておき必要な部分だけやり直すなど、影響を効率よく打ち消す工夫が研究されています。
差分プライバシーとは何が違いますか?
差分プライバシーは学習の最初から個人が分からないようにしておく「予防」の発想ですが、マシンアンラーニングはすでに学習させた後に消す「事後対応」です。完全に忘れさせる方法はまだ研究の途上にあり、確立した万能の手立てがある段階ではありません。