知識ベースとは
知識ベースとは、事実やルール、概念どうしの関係をコンピュータが扱える形に整理して蓄えた「知識の置き場」です。エキスパートシステムの時代には、知識ベースに蓄えた内容を推論エンジンが読み取って結論を導く、という分担でAIの片翼を担っていました。いまでは社内のマニュアルやFAQを集めた仕組みも、同じ名前で呼ばれています。
データベースとどこが違うのか
似た言葉のデータベースは、売上明細のような表形式の個別データを大量にさばくための仕組みです。一方の知識ベースが得意なのは、「すべての人間はいつか死ぬ」のような一般知識や、概念どうしのつながりを表現すること。個別の記録を貯めるか、世界の成り立ちを書き表すか。守備範囲がそもそも違うのです。
AIの部品から、社内の調べ物の土台へ
インターネットの普及後、この言葉の重心は人間向けに移りました。社内ポリシー・業務マニュアル・ベストプラクティスを貯めて従業員が検索する仕組み、つまり「ナレッジベース」としての使われ方です。自動推論の材料から、人が調べるための保管庫へ。同じ言葉が指す中身は、時代とともに広がってきました。
RAGで再びAIと合流した
生成AIの登場で、この置き場は再び主役になりつつあります。RAG(検索拡張生成)は、LLMが答える前に学習データの外にある知識ベースを参照させて、回答の確かさを高める仕組みです。参照先が古かったり散らかっていたりすれば、AIの答えもそれなりのものにしかなりません。社内文書の整理は、生成AI活用の成否を左右する事前投資と言えるでしょう。
Topic「常識」を40年書き続けているプロジェクトがある
人間の常識をすべて知識ベースに書き起こそうという挑戦が、実は40年以上続いています。1984年に始まったCyc(サイク)プロジェクトです。2017年時点で約2,450万件の知識を蓄え、2002年の時点で既に600人年と約6,000万ドルが投じられていました。それでも「常識を書き尽くした」とは言えず、評価は専門家の間でも割れています。人がいかに膨大な常識を無意識に使っているか。この途方もない計画が、裏側からそれを証明しているのかもしれません。
知識ベースに関するよくある質問
- 知識ベースとナレッジベースは別物ですか?
- 同じ英語knowledge baseの訳語です。ただしAI分野では推論の材料になる知識の集まりを、業務ツールの文脈ではFAQやマニュアルを集めた社内の情報置き場を指すことが多く、文脈で中身がずれる点に注意が必要です。
- 知識ベースには具体的に何を入れるのですか?
- 事実、用語の定義、業務ルール、概念どうしの関係などです。近年は人が読むマニュアルや手順書、過去の問い合わせ対応のような文書を含めて呼ぶことも増えています。
- うちの会社にはまだ関係ない、と考えてよいですか?
- 生成AIに社内事情を踏まえた回答をさせたくなった時点で、必ず関係してきます。文書がどこにあるか分からない状態を放置すると、その時にAIへ渡せる材料がない、という壁に当たります。