Preparedness Framework(プリペアドネスフレームワーク)とは
Preparedness Frameworkとは、最先端のAIが新たに生みうる重大なリスクを早めに見つけて備えるために、OpenAI(ChatGPTの開発元)が自主的に定めた安全管理の枠組みです。危険につながりうる能力を監視し、一定の水準に達したら配備や開発の進め方を見直す、という考え方を指します。法律で課された義務ではなく、開発元が自分に課したルールという位置づけです。
何を監視し、どこで歯止めをかけるのか
監視の対象は追跡カテゴリ(Tracked Categories)と呼ばれ、2025年4月の改訂版では生物・化学、サイバー、AIの自己改善という3つの危険領域に絞られています。能力が高まると「高(High)」「危機的(Critical)」という段階で評価され、高に達したら配備の前に対策を、危機的なら開発の途中でも対策を講じると定めています。判断はOpenAIの幹部らで作る安全諮問グループが勧告し、経営陣、さらに取締役会の委員会が監督する三層のしくみです。
他社の枠組みや法律との違い
同じ発想の自主的なしくみは他社にもあり、Anthropicの「RSP」やGoogle DeepMindの「Frontier Safety Framework」が同じ系統です。呼び名や区分は各社で違い、そのまま横並びでは比べられません。またこれは法律ではなく企業の自主的な約束で、EU AI法のような規制とは性質が異なります。「危険水準に達したら必ず止まる」と単純化せず、対策を強めながら配備の可否を判断する枠組みだと捉えるのが正確です。
TopicGPT-4oで引っかかったのは意外にも「説得力」だった
OpenAIが2024年8月に公開したGPT-4oの安全評価では、当時の4つの危険カテゴリのうち、化学兵器でもサイバー攻撃でもなく「説得(人の考えを変える力)」だけが中程度に近いと判定されました。人を動かす力こそが最初に引っかかった、という意外な結果です。しかもこの説得カテゴリは、翌2025年の改訂で枠組みそのものから外されました。何を危険とみなすかが、運用しながら見直されている様子がうかがえます。
Preparedness Frameworkに関するよくある質問
- OpenAIのこの枠組みは、AnthropicやGoogleのものと何が違いますか?
- 考え方は同じ系統で、AnthropicはRSP(ASL)、Google DeepMindはFrontier Safety Framework(CCL)を使います。OpenAI版は危険領域を生物・化学・サイバー・AI自己改善に絞り、高と危機的の2段階で歯止めをかける点に特徴があります。
- 危険な水準に達したら、AIの開発は必ず止まるのですか?
- 必ず止まるわけではありません。多くは配備(提供)の前に対策を講じる形で歯止めをかけ、最も深刻な「危機的」では開発の途中でも対策を求めます。あくまで自主的な約束で、止めるか否かは社内の安全諮問グループや経営陣の判断を経ます。
- いつ作られ、今も使われていますか?
- 2023年12月にベータ版として公表され、2025年4月に大きく改訂されました。各モデルの公開時に、この枠組みに沿った安全評価が示されており、更新を前提に運用が続いています。