SPLADEとは

SPLADEとは、検索文と文書をほとんどがゼロの疎なベクトルで表し、キーワード検索の扱いやすさと意味検索の柔軟さを近づける検索モデルです。正式にはSparse Lexical and Expansion ModelRAGで使う検索候補を、速く広く拾うための技術領域です。

BM25と埋め込みの間を狙う

BM25のようなキーワード検索は速く、理由も説明しやすい一方、同じ意味の別表現を取りこぼしやすい弱点があります。埋め込みを使うセマンティック検索は意味に強い反面、中身が見えにくく運用が重くなることも。SPLADEは疎な表現で検索しながら、関連語への広がりも持たせるため、この中間を狙う発想。

経営判断では、SPLADEそのものを覚えるより、検索はキーワード型、意味型、疎なニューラル型を組み合わせて設計できると理解するほうが実務的です。RAGの回答品質が伸びないとき、LLMだけでなく検索方式の選択も見直し対象でしょう。

TopicExpansionという名前が示すもの

SPLADEの名前にはExpansionが入っています。これは、検索語と完全一致する単語だけでなく、関連しそうな語へ表現を広げる考え方があるためです。古いキーワード検索の見やすさを残しつつ、意味の近さも少し取り込むところが、この技術の面白さ。

SPLADEに関するよくある質問

SPLADEは普通のベクトル検索と何が違いますか?
多くの値が詰まった密なベクトルではなく、ほとんどがゼロの疎な表現を使う点が違います。キーワード検索に近い扱いやすさを残しながら、意味の広がりも取り入れます。
RAG導入でSPLADEを必ず使う必要がありますか?
必須ではありません。RAGではBM25、埋め込み検索、リランキングなど複数の検索設計があります。SPLADEは検索方式を検討するときの有力な選択肢の一つです。

あわせて読みたい記事