直交性仮説とは

直交性仮説とは、AIの知能の高さ(目標を達成する能力)と、その目標が善いか賢いかは、互いに独立に組み合わせられるという仮説です。「賢いAIなら自然と良い目標を持つはず」とは限らない、という指摘で、手段的収束とともにAGI(人間並み以上に汎用的なAI)の安全性を論じる土台になっています。

英語表記:orthogonality thesis

なぜこの仮説が大事なのか

私たちはつい「頭が良くなれば、考え方も立派になる」と人間の感覚で想像しがちではないでしょうか。けれど直交性仮説は、能力と目標は別物で、どんなに高性能なAIでも瑣末だったり有害だったりする目標を持ちうる、と考えます。哲学者ニック・ボストロムが整理した考え方で、手段的収束と対になります。ここから導かれる結論はシンプル。強力なAIをつくれば安全になるわけではなく、その目標を人間の価値に合わせる作業(アライメント)が別に必要だということです。能力の向上が、そのまま安全性の向上にはつながらないのでしょう。

Topic「直交」という言葉はどこから来たのか

「直交」はもともと数学の言葉で、二つの軸が互いに直角に交わる=一方を動かしても、もう一方には影響しない「独立した関係」を指します。グラフの縦軸と横軸を別々に動かせるのと同じ発想です。この仮説では「知能の軸」と「目標の軸」が直交している、つまり独立に組み合わせられると見立てています。だから賢さの目盛りを上げても、目標の良し悪しの目盛りは勝手には動かない、というわけです。

直交性仮説に関するよくある質問

直交性仮説と手段的収束はどう違いますか?
直交性仮説は「能力と目標は独立に組み合わせられる」という主張です。手段的収束は「目標が何であれ、達成に役立つ中間目標は似通う」という主張で、二つはAGI安全論でセットに扱われます。
誰が提唱した考え方ですか?
哲学者ニック・ボストロムが2012年以降の論考や著作で整理しました。AIの能力が高まること自体が安全性を保証しない、という議論の出発点になっています。

あわせて読みたい記事