リランキングとは

リランキングとは、一次検索で多めに拾った候補を、より精密なモデルで採点し直し、関連の高い順に並べ替えて絞り込む処理のことです。検索を「速く広く拾う」段と「丁寧に並べ替える」段の二段構えにする、後段の仕上げにあたります。

「広く速く」と「狭く正確に」を分業する

最初から精密なモデルで全文書を採点すると、計算が重く遅すぎて実用になりません。そこでまず高速な検索で候補をたとえば100件ほど広く拾い(取りこぼしを防ぐ)、その少数だけを精密なモデルで並べ替えて上位に絞ります(正確さを高める)。速度と精度を両立させる、実務の定石です。

後段の並べ替えには、問い合わせと文書をひとまとめに見て関連度を測るクロスエンコーダがよく使われます。全件に使うと遅いものを、最後の少数にだけ使うことで、重さを抑えつつ精度を引き上げる狙いです。

RAGの回答品質を底上げする

RAG(検索拡張生成)では、AIに渡す資料の本当に関連の高いものだけを上位に残せれば、回答の質が上がり、余計な情報を渡さずに済みます。検索の質に物足りなさを感じたとき、後段にリランキングを足すのは効果が出やすい改善策です。

Topic発想自体は検索エンジンの古い定石

「まず速いモデルで候補を絞り、次に重いモデルで精密に並べ替える」という二段構えは、生成AI時代に生まれた新技術ではなく、検索エンジンが以前から使ってきた定石です。近年はこの後段を専門に担う商用サービスも登場し、たとえばCohere社は2023年5月に「Rerank」という並べ替え専用のモデルを公開しています。古い知恵が、RAGという新しい用途で再び主役になりました。

リランキングに関するよくある質問

なぜ最初から精密に並べ替えないのですか?
最初から精密なモデルで全文書を採点すると、計算が重く遅すぎて実用にならないためです。そこでまず高速な検索で候補を100件ほど広く拾い(取りこぼしを防ぐ)、その少数だけを精密なモデルで並べ替えて上位に絞る(正確さを高める)二段構えにします。
並べ替えにはどんなモデルを使うのですか?
問い合わせと文書をひとまとめに見て関連度を測るクロスエンコーダがよく使われます。全件に使うと遅いものを、最後の少数にだけ使うことで、重さを抑えつつ精度を引き上げます。
リランキングは新しい技術ですか?
いいえ。「速いモデルで候補を絞り、重いモデルで精密に並べ替える」二段構えは、検索エンジンが以前から使ってきた定石です。近年はこの後段専門の商用サービスも登場し、Cohere社が2023年5月に並べ替え専用モデル「Rerank」を公開しています。古い知恵が、RAGという新しい用途で主役になりました。