Stochastic parrotとは
Stochastic parrotとは、大規模言語モデル(LLM)が言葉の意味を本当に理解しているのではなく、学習した言葉のパターンから確率的にそれらしい文章を並べているだけだ、とする批判的な見方です。日本語では「確率的オウム」とも呼ばれます。流暢に話せることと、中身を理解していることは別だ、という問題提起です。
どんな批判なのか
名前のとおり、オウムが人の言葉を真似るイメージです。LLMは大量の文章を読み込み、次に来そうな言葉を確率で選んでつなげます。人間のように内容を理解して話しているわけではない、というのがこの言葉の主張。だからこそ、もっともらしいのに事実と違う答え(ハルシネーション)も起こりうる、と説明されます。
いつ生まれた言葉か
提唱されたのは2021年の論文です。ChatGPTの一般公開(2022年11月30日)より前に、すでに研究者たちはLLMの危うさを指摘していました。著者にはエミリー・ベンダー氏やティムニット・ゲブル氏らが名を連ねます。この論文の公開をめぐって著者の一人がグーグルを去る騒動が起き、AI倫理をめぐる議論として世界的に注目されました。
今、どう効いてくるか
生成AIが当たり前になった今こそ、この視点は役立ちます。なぜでしょうか。AIの文章は流暢でも、それが正しいとは限らないからです。重要な判断や対外的な文書では、AIの答えを鵜呑みにせず、人が事実を確かめる工程を残すべきでしょう。「上手に話せる=分かっている」ではない、と心に留めておくと、AIとの距離の取り方を誤りません。
Topicなぜ「オウム」なのか
Stochasticは、ギリシャ語で「推測に基づく」を意味する言葉に由来します。そこへ、意味を分からないまま人の言葉を真似る「オウム(parrot)」を組み合わせた造語です。元の論文のタイトルには、オウムの絵文字(🦜)まで添えられています。専門的な批判を、ひと目で伝わる比喩に落とし込んだ名づけといえるでしょう。
Stochastic parrotに関するよくある質問
- Stochastic parrotという批判は、今のAIにも当てはまりますか?
- 理解を伴わずに確率で言葉を並べる、という指摘は今のLLMにも引き継がれています。ただし性能は大きく向上しており、批判をふまえつつ実務でどう使うかが論点になっています。
- 「確率的オウム」と「ハルシネーション」は同じ意味ですか?
- 別の言葉です。確率的オウムはLLMの仕組みそのものへの批判で、ハルシネーションはその結果として起こる、もっともらしい誤りを指します。原因と症状の関係に近いといえます。