NVLink(エヌブイリンク)とは
NVLinkとは、NVIDIAが開発した、GPU同士やGPUとCPUを直接つなぐ高速な接続技術です。巨大なAIモデルは1個のGPUには収まらず、複数のGPUに分けて動かすため、GPU間でやり取りするデータの速さが性能を大きく左右します。NVLinkは従来のPCIeより桁違いに太い通路でGPUをつなぎ、何台ものGPUをあたかも1つの大きなGPUのように働かせる土台です。
NVLinkは何が速いのか
パソコンの拡張部品をつなぐ一般的な規格であるPCIeが、第4世代でおよそ毎秒63ギガバイトなのに対し、NVLinkはGPU1基あたりの合計でその十数倍にあたる帯域を持ちます。道路にたとえると、PCIeが一般道なら、NVLinkはGPU専用に何車線も束ねた高速道路のようなものだと考えると分かりやすいでしょう。
多数のGPUをまとめて束ねる役割はNVSwitchというスイッチが担います。これを使うと、サーバー1台に積んだ8基のGPUや、より大きな構成では数十基のGPUを互いに直結し、ひとつの計算機のように協調させられます。スイッチ自身が合計などの簡単な計算を肩代わりしてGPU間の通信量を減らす仕組みも備わっており、単なる中継器ではありません。
PCIeやInfiniBandとの違い
混同しやすいのが、似たように「つなぐ」技術であるPCIeやInfiniBandとの役割の違いです。NVLinkは1台のサーバーの中でGPU同士を束ねる近距離の配線にあたります。これに対しInfiniBandは、サーバー(箱)と箱をつなぐネットワークで、役割の階層が一段違います。PCIeはあらゆる拡張部品をつなぐ汎用の規格で、速さではNVLinkに及びません。ノードの中はNVLink、ノードの外はInfiniBandという住み分けが、大規模なAI基盤の基本形になっています。
なぜ経営の視点で重要なのか
大規模なAIを学習させたり動かしたりするほど、GPUは何十基、何百基と束ねる必要が出てきます。このときGPU間のデータの受け渡しが遅ければ、高価なGPUが互いの待ち時間で遊んでしまい、費やしたコストが速度に結びつきません。NVLinkとNVSwitchは、その待ち時間を抑えてGPUの群れを一体で動かすための前提技術といえます。AIインフラの速度とコストを語るうえで、表に出にくいながら効いてくる土台です。
TopicNVLinkはゲーミングPCから姿を消した
NVLinkはかつて、ゲーミング向けGPUを2枚挿しして性能を上げる用途にも使われていました。ところが2022年に登場したGeForce RTX 40シリーズ(Ada Lovelace世代)でこの機能は削除されます。NVIDIAは、空いた回路をAIの処理能力に振り向け、家庭向けでは標準のPCIeに戻すと説明しました。登場は2016年のデータセンター向けGPUからですが、いまやNVLinkは事実上、データセンターとAI専用の技術へと立ち位置を移しています。
NVLinkに関するよくある質問
- NVLinkとInfiniBandは何が違いますか?
- NVLinkは1台のサーバーの中でGPU同士を束ねる近距離の配線です。InfiniBandはサーバー(箱)と箱をつなぐネットワークで、役割の階層が一段違います。ノードの中はNVLink、ノードの外はInfiniBandという住み分けが一般的です。
- NVLinkはゲーミングPCでも使えますか?
- 2022年のGeForce RTX 40シリーズ以降は削除され、現在はデータセンターやAI向けのGPU専用の技術になっています。家庭向けGPUでは標準のPCIeに戻りました。
- なぜPCIeでは足りずNVLinkが必要なのですか?
- PCIeは第4世代でおよそ毎秒63ギガバイトです。複数のGPUで巨大なモデルを動かすとGPU間のデータ量が膨大になり、その十数倍にあたる帯域を持つNVLinkでないとGPUが待ち時間で遊んでしまうためです。