モデルドリフトとは

モデルドリフトとは、本番で動かしているAIモデルの予測精度が、時間とともにじわじわ落ちていく現象のことです。意外に思えるかもしれませんが、モデルの中身は何も変わっていないのに、世の中の方が学習したときと変わっていくために起こります。固定された地図と、変わり続ける街並みのズレが広がっていくイメージです。

英語表記:Model drift

ドリフトが起きる2つの原因

原因は大きく2つに分けられます。ひとつはデータドリフトで、モデルに入ってくるデータの傾向が変わること。たとえば顧客層が若返ったり、季節や市場が動いたりするケースです。もうひとつは概念ドリフトで、入力と結果の「関係」そのものが変わること。不正の手口やスパムの中身が変わり、これまでの正解パターンが通用しなくなる状況がこれにあたります。

「モデルドリフト」と「データドリフト」は同じではない

この2語はよく混同されますが、指すものが違います。モデルドリフトは「結果として精度が落ちる」現象そのものの総称で、データドリフトはその原因の一つ。つまり、データドリフトはモデルドリフトを引き起こすきっかけのひとつであって、両者は同じ意味ではありません。「精度が落ちた(モデルドリフト)。なぜなら入力データが変わったから(データドリフト)」という関係で押さえておくと、社内の会話で取り違えずに済むでしょう。

放置せず「見張って、作り直す」のが基本

対策の柱は、精度を継続的に見張る監視と、必要に応じた再学習(最新のデータで作り直すこと)です。一度作って終わりにすると、知らないうちに誤った予測で判断し続けることになりかねません。AIを本番で使い続ける以上、ドリフトは避けられない前提として、運用の仕組み(MLOpsやモデル監視)に点検と再学習を組み込んでおくことが欠かせません。

Topicこわいのは「自信満々に間違え続ける」沈黙の劣化

ドリフトのなかでも厄介なのが概念ドリフトです。精度が落ちても、AIは「自信なさそう」にはなりません。むしろ高い確信度のまま誤った答えを返し続けるため、性能を数字で見張っていないと、誰も異変に気づかないまま誤判断が積み上がります。エラーで止まってくれるバグより、静かに進む精度低下の方が見つけにくい。だからこそ「動いているから大丈夫」ではなく、定期的に成績を測る習慣が要るわけです。

モデルドリフトに関するよくある質問

一度精度が高ければ、AIモデルはそのまま使い続けられますか?
使い続けられません。世の中が変わればドリフトで精度は落ちていきます。定期的に成績を測り、必要なら最新データで作り直すことを前提に運用する必要があります。
市場や顧客が急に変わったときも問題になりますか?
はい、急変時はドリフトが一気に進みやすい場面です。たとえば景気や流行が大きく動くと、それまでの予測の前提が崩れ、精度が短期間で落ちることがあります。
再学習すればモデルドリフトは直りますか?
最新のデータで作り直せば精度は回復しますが、その後もまた少しずつズレていきます。一度で終わる対処ではなく、監視と再学習を繰り返す継続的な運用ととらえるのが現実的です。

あわせて読みたい記事