Frontier Safety Framework(フロンティアセーフティフレームワーク)とは

Frontier Safety Frameworkとは、最先端のAIが将来もたらしうる深刻な危害を、その能力に達する前に見つけて抑えるために、Google DeepMindが自主的に定めた安全管理の枠組みです。危険な能力に近づいたら所定の対策を発動する、という「先回り」の発想が柱になっています。法律で課された義務ではなく、開発元が自分に課したルールという点はAnthropicOpenAIの枠組みと同じです。

「危険になる手前」に一線を引く

中心にあるのが重要能力レベル(CCL=Critical Capability Levels)という考え方です。対策をしないと深刻な危害に関わりうる「能力の最低ライン」を先に決めておき、AIがそこに近づいたら守りを発動するしくみになっています。対象は、化学・生物・放射性物質・核などの悪用、サイバー攻撃、AIが自分自身のAI開発を加速させる能力などです。守りはAIの設計図にあたる「重み」を盗まれないようにするセキュリティ面と、危険な能力を使わせない運用面の2系統で用意します。

他社の枠組みとの違い

AnthropicのRSP(ASL)、OpenAIのPreparedness Frameworkと同じ「能力に応じて対策を強める自主的なしくみ」の系統です。DeepMind版は危険の線引きをCCLという形で示し、各レベルにセキュリティと運用の対策を割り当てるのが特徴になります。初版は2024年5月に公表され、その後も改訂が重ねられてきました。いずれも法律ではなく自主的な約束なので、公表している事実だけで安全が保証されるわけではない点には注意がいります。

Topic「自分の停止に抵抗するAI」まで想定し始めた

2025年9月に公表された改訂版では、AIが運用者によるシャットダウン(停止)を妨げようとする状況が、新たに警戒すべきシナリオとして枠組みに書き加えられました。まだ起きていない先の事態まであらかじめ線引きしておく、という先回りの姿勢がよく表れています。SF的な脅威をあおる話ではなく、「もし起きたらどう気づき、どう抑えるか」を前もって決めておく備えとして整理されている点が要点です。

Frontier Safety Frameworkに関するよくある質問

重要能力レベル(CCL)に達したら、何が起きるのですか?
対策をしないと深刻な危害に関わりうる能力ラインがCCLです。AIがそこに近づくと、設計図にあたる重みを盗まれないようにするセキュリティ面の対策と、危険な能力を使わせない運用面の対策を発動します。
AnthropicのRSPやOpenAIの枠組みと、どれかが業界標準なのですか?
どれも各社が自主的に定めたもので、共通の業界標準ではありません。考え方は近いものの、AnthropicはASL、OpenAIは追跡カテゴリ、DeepMindはCCLと用語や区分が異なり、そのまま横並びでは比較できません。
いつ作られ、改訂は続いていますか?
初版は2024年5月に公表され、その後も複数回にわたり改訂が重ねられています。2025年9月の改訂では、AIが停止に抵抗する状況など新たなシナリオも対象に加えられました。

あわせて読みたい記事