用語

Transformer²とは

Transformer²とは、LLMが入力されたタスクに合わせて、推論時に自分の振る舞いを小さく切り替える自己適応型の研究フレームワークです。Transformerを土台にしながら、未知のタスクに対して毎回大きなファインチューニングをするのではなく、必要な成分だけを混ぜ替える発想。

英語表記:Transformer-Squared

毎回作り直さず、その場で寄せる

通常のファインチューニングは、特定用途に合わせてモデルを追加学習させます。Transformer²は、まずタスクの性質を見分け、次にタスク向けの専門ベクトルを混ぜるという二段階で適応する仕組み。人間でいえば、同じ資料を読む時に、営業目線、法務目線、技術目線の読み方をその場で切り替えるようなものです。

実務で見るべき点は、便利そうな名前よりも、どこまで安定してタスクを判別できるかでしょう。間違った読み方に切り替われば、回答もずれます。適応するAIほど、適応先の判定ロジックを評価する必要がある、という話です。

Topic2乗の記号は「もう一段変わる」印象を作る

Transformer²の名前は、Transformerに2乗の記号を付けた見た目です。論文上の表記はTransformer-Squaredで、単なる次世代Transformerというより、Transformerが自分の使い方をもう一段切り替える印象を与える名前になっています。研究名として覚えやすい工夫でしょう。

Transformer²に関するよくある質問

Transformer²という名前だけで採用判断できますか?
できません。研究名が印象的でも、実務では対象タスクで安定して判定できるか、既存運用に組み込めるかを別途確認する必要があります。
Transformer²とLoRAは何が違いますか?
LoRAは追加学習で軽い差分を持たせる方法として使われます。Transformer²は、入力タスクを見てその場で専門ベクトルを混ぜる点に特徴があります。

あわせて読みたい記事