RAGとは

RAGとは、AIが答えを作る前に外部の資料を検索し、その内容を踏まえて回答を組み立てる仕組みのことです。Retrieval-Augmented Generation(検索拡張生成)の略。大規模言語モデルに、信頼できる資料という“カンニングペーパー”を持たせるイメージです。

どんな仕組みか

ふつうの大規模言語モデルは、学習で覚えた知識だけを頼りに答えます。いわば持ち込み禁止の試験(クローズドブック)です。RAGはこれを資料持ち込みOKの試験(オープンブック)に変える発想で、質問が来るたびに関連資料を探し、その記述を根拠に答えを作ります。モデルを学習し直すのではなく、その場で資料を参照する点がポイントです。

何の役に立つのか

最大の利点は、事実と違う内容をもっともらしく語るハルシネーションを抑えやすく、回答の根拠(出典)を示せることです。学習時点にない最新情報や、社外には出ていない自社の文書にも対応できます。社内マニュアルを参照する問い合わせAIや、資料に基づいて答えるNotebookLMなども、この考え方を土台にしています。

Topic名づけ親はFacebook(現Meta)・しかも2020年

RAGという言葉と仕組みは、2020年にFacebook(現Meta)の研究チームが論文で提唱したものです。世間がAIに驚いたChatGPTの一般公開は2022年11月ですから、その2年前には既に「AIに資料を引かせて答えさせる」という発想が研究されていたことになります。いま社内文書を扱うAIの多くがこの考え方を使っており、地味ながら息の長い基礎技術です。

RAGに関するよくある質問

RAGはどんな仕組みですか?
ふつうの大規模言語モデルは学習で覚えた知識だけで答える「持ち込み禁止の試験(クローズドブック)」です。RAGはこれを「資料持ち込みOKの試験(オープンブック)」に変える発想で、質問が来るたびに関連資料を探し、その記述を根拠に答えを作ります。モデルを学習し直すのではなく、その場で資料を参照する点がポイントで、考案は2020年にFacebook(現Meta)の研究チーム(ChatGPT公開の2年前)です。
RAGは何の役に立つのですか?
事実と違う内容をもっともらしく語るハルシネーションを抑えやすく、回答の根拠(出典)を示せることです。学習時点にない最新情報や、社外には出ていない自社の文書にも対応できます。
ファインチューニングとの違いは?
ファインチューニングはモデルを学習し直して中身を作り変えます。RAGはモデルを学習し直さず、質問が来るたびに関連資料を探してその場で参照する点が異なります。