用語

Trust Laundering Chainとは

Trust Laundering Chainとは、出どころの弱い情報がAIの記憶や検索を通じて再利用され、信頼済みの文脈のように見えてしまう流れです。情報の中身だけでなく、誰が入れたか、どこから来たかが薄れる点が問題になります。

出どころが薄れるほど、信頼されたように見える

AIエージェントが社内文書、RAG、問い合わせ履歴、長期メモリをまたいで使うと、最初は未承認だったメモが、後の検索結果では正式なルールのように現れることがあります。人間なら「この文書は誰が承認したのか」と聞けますが、AIは文面のそれらしさに引っ張られかねません。これがSemantic Norm Driftにつながる経路です。

対策は、文書管理をきれいにするだけでは足りません。情報の出所、承認状態、更新日、利用範囲をAIが参照できる形で持たせる必要があります。特に業務ルールや顧客対応方針をAIへ読ませる場合は、Trust Laundering Chainを想定した導線設計が欠かせません。

Topic「laundering」は出どころが見えにくくなる比喩

The Misattribution Gapの論文では、出所が失われた情報が信頼済みのシステム文脈として再登場する流れをTrust Laundering Chainと呼んでいます。AIの安全性では、情報が正しいかだけでなく「なぜ信じてよいのか」を残す設計が大切です。

Trust Laundering Chainに関するよくある質問

どんな情報が紛れ込みやすいですか?
未承認の社内メモ、古い運用手順、顧客対応の例外ルールなど、正式文書に似た情報は注意が必要です。
防ぐには何を残せばよいですか?
情報の出所、承認者、更新日、利用範囲を残し、AIが根拠として使った時に確認できるようにします。

あわせて読みたい記事