セマンティック検索とは
セマンティック検索とは、キーワードの字面の一致ではなく「意味」でデータを探す検索方式のことです。言葉を意味のベクトルに変換し、その近さで探すため、入力した語が文書に含まれていなくても、内容の近いものを見つけられます。
言葉を「意味の座標」に変えて探す
従来のキーワード検索は、入力した単語と同じ文字列を文書から探す方式でした。これだと「値引き」で検索したとき「割引」と書かれた文書を取りこぼします。セマンティック検索は、言葉を埋め込み(意味を表す数値の並び)に変換し、意味の近さで探すのが特徴です。同じことを別の言い方で書いた文書も拾えるため、利用者が正確な言葉を知らなくても「言いたいこと」で検索できます。
RAGや社内検索の土台になる
RAG(検索拡張生成)では、AIに渡す資料をこの方式で集めることで、回答の的確さが上がります。実務では、純粋な意味検索だけよりもキーワード検索と組み合わせたハイブリッド検索のほうが精度が高いとされ、両者を併せて使う構成が一般的です。
Topic毎日使うGoogle検索も2019年に「意味で読む」へ進化した
セマンティック検索に関するよくある質問
- セマンティック検索はRAGや社内検索とどう関係しますか?
- RAG(検索拡張生成)では、AIに渡す資料をこの意味検索で集めることで回答の的確さが上がります。実務では、純粋な意味検索だけよりキーワード検索と組み合わせた「ハイブリッド検索」のほうが精度が高いとされ、両者を併せて使う構成が一般的です。
- 従来のキーワード検索と何が違いますか?
- キーワード検索は入力した単語と同じ文字列を探すため、「値引き」で検索すると「割引」と書かれた文書を取りこぼします。セマンティック検索は言葉を埋め込み(意味を表す数値の並び)に変換し意味の近さで探すので、別の言い方で書いた文書も拾え、利用者が正確な言葉を知らなくても「言いたいこと」で検索できます。
- セマンティック検索は新しい技術ですか?
- 生成AIブーム以前から実用化されています。私たちが日常使うGoogle検索も2019年10月にBERTという言語AIを導入し、文脈や語順から意図をくみ取る検索へ進化しました。Google自身がこれを「検索史上でも最大級の飛躍の一つ」と表現しています。