用語

LLM Supply Chainとは

LLM Supply Chainとは、LLMを動かすまでに関わるモデル学習データ、外部部品、運用基盤、更新手順のつながり全体を指します。一般のシステム開発ではソフトウェア部品の安全性を見ますが、AIでは「どのデータで作られ、どのモデルを土台にし、誰が更新したか」まで供給網の一部です。

英語表記:LLM03:2025 Supply Chain

AIでは部品の範囲が広くなる

通常のサプライチェーンなら、ライブラリやクラウド基盤の脆弱性確認が中心。LLMではそこに、事前学習モデル、ファインチューニングデータセット、モデル変換サービス、推論環境が加わります。完成品だけを見ても、途中で混ざった欠陥や改ざんは見えません。

たとえば、外部から取ったモデルに隠れた挙動があれば、社内のAIアプリにもその影響が入ります。「有名な配布元にあったから安全」では足りないということ。どの版を採用し、どの検証を通し、誰が本番へ出したかの記録が欠かせません。

発注時に確認すること

経営側が聞くべき質問はシンプルです。モデルの入手元、更新頻度、検証記録、利用データの権利、事故時の切り戻し方法を確認しましょう。AIベンダーへ「精度は高いですか」と聞くより、「モデルとデータの出どころを追跡できますか」と聞くほうが、実務上の安全に近づく近道でしょう。

LLM Supply Chainは、Sensitive Information DisclosureLLM Misinformationともつながります。供給元が曖昧だと、機密情報の扱いも、回答の信頼性も評価しづらくなるためです。AI導入を急ぐほど、部品表と変更履歴を軽視しない姿勢が効く場面です。

Topicソフトウェア部品表の考え方がAIにも来ている

OWASPは対策として、SBOM(ソフトウェア部品表)だけでなくAI BOMやML SBOMにも触れています。これはAIの「材料表」を残す発想。ソースコードだけでなく、モデル、データ、追加学習の部品まで台帳化する流れが出てきたということです。

LLM Supply Chainに関するよくある質問

オープンソースモデルを使うと危険ですか?
オープンソースであること自体が危険という意味ではありません。入手元、版、改変の有無、検証手順を追跡できないまま本番利用することがリスクになります。
LLM Supply Chainとデータポイズニングは何が違いますか?
データポイズニングは学習データを汚染する攻撃です。LLM Supply Chainはそれを含みつつ、外部モデル、追加学習部品、配布元、運用基盤まで広く見る考え方です。

あわせて読みたい記事