AI安全性(えーあいあんぜんせい)とは

AI安全性とは、AI事故・悪用・意図しない害を起こさないようにするための研究や取り組みのことです。賢いAIを作る競争が進むなか、「強くする」だけでなく「安全に保つ」ことの大切さが高まっています。SFのようなロボットの反乱だけを指す言葉ではなく、いま実際に起きる問題まで含む、幅広い分野です。

近い害から、長期のリスクまで

AI安全性が扱う範囲は広く、大きく2つに分けて捉えるとわかりやすいでしょう。一つは、いますぐ起きる害バイアスによる差別、誤情報、悪用などが当てはまります。もう一つは、長期のリスク。AIが人の意図から外れて動いたり、制御しきれなくなったりする心配です。こうした問題に備えるため、AIを人の意図どおりに動かす「アラインメント」や、判断の中身を見えるようにする「解釈可能性」といった研究が進んでいます。

企業も政府も取り組むテーマに

AI安全性は、いまや一部の研究者だけの話ではありません。AnthropicOpenAIDeepMindといった開発企業が安全研究の部門を持ち、米国や英国は2023年に政府のAI安全研究所を立ち上げました。便利さと引き換えにリスクも大きくなるからこそ、作る側と社会の両方で「安全をどう確かめるか」を考える流れが強まっています。

Topic暗号解読の地に、各国が集まった

2023年11月、英国のBletchley Park(ブレッチリー・パーク)で、各国が参加するAI安全サミットが開かれました。最先端AIの悪用や、制御を失うリスクが主な議題です。じつはこのBletchley Parkは、第2次世界大戦中にアラン・チューリングらが暗号解読にあたった、コンピュータ史ゆかりの地。計算機の礎が築かれた場所で、そのAIのリスクを世界が話し合ったという符合が、AI安全性が一研究テーマから国際的な課題へ移ったことを物語っています。

AI安全性に関するよくある質問

AI安全性はSFのようなロボットの反乱の話ですか?
それだけではありません。AI安全性は、いま実際に起きる害(バイアスによる差別・誤情報・悪用)から、AIが人の意図から外れて制御しきれなくなる長期のリスクまでを含む幅広い分野です。「強くする」だけでなく「安全に保つ」ための研究や取り組みを指します。
AI安全性のために、どんな研究が行われていますか?
AIを人の意図どおりに動かす「アラインメント」や、判断の中身を見えるようにする「解釈可能性」といった研究が進んでいます。いますぐ起きる害と、長期のリスクの両方に備えるためです。
AI安全性に取り組んでいるのは誰ですか?
AnthropicやOpenAI、DeepMindといった開発企業が安全研究の部門を持ち、米国や英国は2023年に政府のAI安全研究所を立ち上げました。一部の研究者だけの話ではなくなっています。