エヌビディア帝国の誕生

データセンター垂直統合支配の野望

眩いばかりに光る伝家の宝刀GPU。急激にその勢力を拡大するエヌビディア帝国の首領、ジェン・スン・ファンCEO。Photo: "NVIDIA CEO Jensen Huang unveils the Quadro RTX GPU" by NVIDIA Corporation is licensed under CC BY-NC-ND 2.0

Nvidiaは先週、2021年第2四半期の業績を発表した。収益は38.7億ドルと、コロナの世界的な大流行の中でアナリストの予想を上回り、事業戦略の再方向転換が成功した兆しを見せている。

同社のフリーキャッシュフロー生成率38%は、テック業界の中では「最高クラス」。同社はゲーミング部門の収益の伸びとデータセンター部門の継続的な強さを理由に、下半期は堅調に推移するという強気の見通しを示した。

これはNvidiaにとって大きな勝利となった。Nvidiaは最近、インテルを抜き去り米国を拠点とする最も価値のあるチップメーカーになった。バンク・オブ・アメリカのアナリストは、Nvidiaはデータセンター事業の拡大とゲーム収益の急増により、5,000億ドル規模の半導体株の第1号になると主張した。

同社の収益構造には興味深い変化が生まれている。2021年第2四半期では、Nvidiaのデータセンター部門の収益(17.5億ドル、前年同期比167%増)はゲーム部門の収益(16.5億ドル、前年同期比24%増)を上回った。この多くは、わずか4ヶ月前に完了したMellanoxの買収による相乗効果のおかげだが、Nvidiaの野望はもっと遠くを見据えている。データセンターの垂直統合支配だ。

四半期ごとの収益の推移。この1年のデータセンター事業の伸びが凄まじい。Source: Nvidia. 

機械学習の波

NvidiaのGPUは初めのうちは、その名の通りグラフィックスの用途で利用されたが、GPUを利用した訓練や推論の有効性が証明された2012年頃以降から機械学習向けの用途が急激に加速している。

GPUを用いて汎用演算をする「GPGPU」が生まれたのが2007年だが、意外な副産物が生まれた。それは畳み込みニューラルネットワークの並列計算に応用することだ。スタンフォード大学のアンドリュー・ウン教授とNVIDIAは汎用コンピューティングプラットフォームのCUDAを採用し、モデルが猫を識別する「Googleの猫」を完成させた。

さらには画像認識の競技会である「 ImageNet LSVRC」の2012年大会では、ニューラルネットワーク「AlexNet」が従来型の機械学習モデルに対し大差をつけた。AlexNetの学習にはメモリ3GBのNVIDIA GTX 580 GPUが用いられていた(Alex Net開発者の一人である、Ilya Sutskeverは後に独立系人工知能研究所OpenAIの創業者になる)。これらがGPUが深層学習を高速化することを実証した。

この後、機械学習への熱狂が高まり、GPUの需要は高まるばかりだった。その熱狂を物語るエピソードがある。2016年12月に開催された機械学習関連のトップカンファレンス「Neural Information Processing Systems(NIPS)」に向けた論文の締め切りは5月19日だったが、これに合わせ世界中の研究チームがクラウドを利用したため、Google CloudとMicrosoft AzureのGPU資源が一時的に枯渇したのだ。

確固たるAIアクセラレータのポジション

Nvidiaのコンポーネントは、世界で最も強力なスーパーコンピュータのトップ500リストの上位10システムのうち8システム(全体の3分の2)に含まれ、SuperPODシステムのSeleneはリストの7位にランクインした。NvidiaのA100は、Google CloudがA100ベースのインスタンスを発表したり、Microsoft Azureが "スーパーコンピュータクラスのAI"を約束する独自のA100ベースのインスタンスを追加したりと、クラウドの世界でも人気があることが証明されている。

8月上旬には、機械学習の業界標準ベンチマーク「MLPerf」の第3ラウンド(「MLPerf v0.7」)において、8種類の機械学習モデルを対象としたスコア結果が発表され、NVIDIAとGoogleはともにトップ性能を達成したと主張したことが話題となった。

NvidiaのA100ベースのシステムは、商用利用可能なシステムのカテゴリーにおいて、全てのベンチマーク正規化結果で第1位の性能を達成した。これに対し、GoogleのTPU v3ベースのスーパーコンピュータが複数のベンチマークにおいて最速のトレーニング時間を記録したと主張した。

Nvidia A100はすべてのカテゴリでほかを圧倒したと主張するスライド。MLPerf.orgが8月上旬、第3ラウンドのトレーニングベンチマーク(v0.7)の結果を発表し、Nvidiaが再び勝利し、16の新記録を打ち立てたと主張した。Source: Nvidia

それでも、これまで以上にシステムビルダーは競争力のある選択肢を持っている。たとえば、Top500の新たな主役は、Armベースのシステムである富嶽(Fugaku)であり、SummitとそのNvidia Tesla GPUに取って代わった。おそらくもっと心配なのは、Nvidiaがエクサスケールシステムの計画に参加していないことである。Aurora (Intel GPU)、El Capitan (AMD GPU)、Frontier (AMD GPU)は他社のアーキテクチャを採用している。

これらのうち、Cray社が製造しているFrontierとEl Capitanの2つのシステムでは、AMDがCPUも提供している。これは、Nvidiaが垂直統合、特にArm社の買収を深く検討していることを裏付ける結果となっている。

インターコネクト技術のMellanox買収

NvidiaがNVLink GPU-to-GPUインターコネクトを開発し、2019年にはMellanox Technologiesの買収したことによって、Nvidiaは最新のデータセンターの重要な構成要素である高速相互接続を実現した。

Nvidia社は2019年3月にMellanoxを買収する意向を発表した当時、ライバルのIntelよりも、Mellanoxのデータセンター向けインターコネクト技術にも高値で入札したといわれていた。Mellanoxは「InfiniBand」と呼ばれるデータセンター技術パイオニアであったが、現在はInfiniBandだけでなく、データセンター向けのアダプタやスイッチ、ソフトウェア、半導体など幅広いソリューションを提供している。

買収に際して、Nvidiaの創設者でありCEOであるジェン・スン・ファンは、AIとデータサイエンスの出現と数十億人のコンピュータ・ユーザーの同時利用により、世界のデータセンターに対する需要が急増していることを指摘し、彼はデータセンターがスーパーコンピューターのクラスタによって形成されるというビジョンを示した。

「この需要(AIとデータサイエンス)に対応するためには、膨大な数の高速コンピューティング・ノードをインテリジェント・ネットワーキング・ファブリック上で接続し、巨大なデータセンター・スケールのコンピュート・エンジンを形成する総合的なアーキテクチャが必要になる。Nvidiaのアクセラレーション・コンピューティング・プラットフォームと、世界的に有名なMellanoxのアクセラレーション・ネットワーキング・プラットフォームを一つ屋根の下に統合し、次世代のデータセンター・スケールのコンピューティング・ソリューションを実現できることを大変嬉しく思う」。

NVIDIAとMellanoxには、米国エネルギー省が所有する世界最速の2台のスーパーコンピュータ「Summit」と「Sierra」の開発で何度も協力してきた経緯があった。

ゲーミング

ゲーミング用途のGPUは、AMDとNvidiaの2強の市場だ。AMDは2019年7月に、NVIDIAのRTX 2070 GPUに対抗するために、7nm(ナノメートル)のNavi GPUをゲーミング分野で発売した。その後、NVIDIAは、AMDの新しいGPUラインアップに対抗するために、Super GPUラインアップのもとにリフレッシュ版をリリースした。

両者からローエンドからハイエンドの製品まで、あらゆるものが提供されているが、パフォーマンスに関しては、Nvidiaが全体的に明確にリードしている。GPUパフォーマンスの階層を見てみると、(ゲーマー向けではないTitanカードを除いて)Nvidiaがトップ5を占めている。これは、AMDのリソースの大半CPUに投下されているが、Nvidiaの主戦場はGPUであることで説明できるだろう。

ArmのCPUとNvidiaのGPU等を組み合わせたSoCのTegraは、現在スマートフォンやタブレットなどのモバイル機器をターゲットにしたNVIDIA初のCPU-GPUマイクロプロセッサだが、その重要な顧客が任天堂である。Nintendo Switchが搭載するプロセッサは2015年発売の「Tegra X1」と同じものだ。任天堂は長い間、品薄の状況が続いていたゲームコンソールSwitchの増産しており、Tegraは出荷急増を享受している。

また、GeForce RTXグラフィックスカードは、開発者やゲーマーが待ち望んでいるリアルタイムのレイトレーシングを目指している。ライティング技術は、現実の世界で光がどのように振る舞うかをモデリングするための最も近似した方法であり、視覚的に激しいゲームでもリアルタイムで映画のような品質のレンダリングを実現する。

クラウドゲーミングサービス「GeForce NOW」

そしてNvidiaは、ゲーミング業界の新しいトレンドに乗り、ユーザーがGeForce RTXを購入せずともその性能を享受する方法を提供しようとしている。ゲームストリーミングサービス「GeForce NOW」は、月額4.99ドルで、既存のPCゲームストアとは異なる経路でPC、Mac、Androidにクラウドゲーミングを提供している。

北米には9カ所、西ヨーロッパには6カ所のデータセンターがある。Nvidiaによると、これらの地域のブロードバンド家庭の90%に20ミリ秒の応答時間を提供するのに十分なコンピューティング能力がある。韓国、日本、ロシアなどの他の地域では、Nvidiaは、低レイテンシーのゲーム・パフォーマンスを提供できるコロケーション企業と提携している。ゲームは毎秒60フレーム、時には毎秒120フレームで動作する。GeForce Nowクライアントは、クライアントデバイスに約100MBの空き容量しか必要としない。

NvidiaのGeForce Nowサービスは、もともとPascalのGPUをベースにした第一世代のサーバーを使用していたが、現在はRTXカードなどのトリノベースのGPUに切り替えている。状況に応じて、1台のGPUで1~2人のユーザーを処理することができるという。

Arm買収はエコシステムを破壊する?

そして、Nvidiaの今後を左右する買収交渉がソフトバンクGとの間で進行している。

Nvidiaのシステムスタックに欠けている唯一の要素は、汎用CPUである。Nvidiaは、2011年のProject DenverでCPUに参入する意図があったが、それらの計画は破棄された。Armを買収することがNvidiaにとって自然な次のステップだと考える人は少なくない。

ソフトバンクGが期待する330億〜500億ドルのArmの企業価値は、チップ業界ではあまり同意する人が少ないだろう。Armは2016年のソフトバンクGの買収以降、利益率が急激に悪化しており、組み込みコンピューター向けの安価なSoC向けに関してはRISC-Vがテイクオーバーしかねないという事業環境に直面している。ソフトバンクGにとっての望みは、Nvidiaが大きな野望を持っていることと、その時価総額3000億ドル超のディープポケットだ。

2016年のソフトバンクの買収から急速に縮小するArmのEBITDA. Source: Nvidia.

ファンは2019年3月の決算発表時、CPU事業の投資収益率に難色を示したことがある。「今日のCPUの構築に大量の研究開発を投入したとしても、5年後に得られるXファクターは約15%であり、私たちは大きなリターンが得られる分野、つまり、人々が投資していない分野に研究開発を投資したい」。

それでも、MellanoxとArmが手に入れば、Nvidiaはデータセンターにおける垂直統合戦略に力を入れることができるようになり、単なるコンポーネント・プロバイダーではなく、コンポーネントも提供するシステム・プロバイダーとしての地位を確立することができる。Nvidiaはすでに、システムレベルのソリューションを強調することで、特定のエンタープライズ向けコンポーネントの入手をより困難にしてきた。

ただし、Arm買収が業界に与える副作用を危険視する論者は少なくない。米半導体業界メディアSemianalysisは、NvidiaのArm買収はがArmのエコシステムを破壊すると主張している。Nvidiaがデータセンターに垂直統合型の支配を確立するため、ArmのIPを非常に高価で閉鎖的なものへと変えてしまう、と警鐘を鳴らしている。

「Nvidiaの最終目標は、ライセンス費用による収益の増加ではありません。彼らの最終目標は、完全に垂直統合されたデータセンター・プロバイダーになることだ。彼らは、3本足のスツールのすべての部分を作り、コントロールしたいと考えているだろう。そのIPを非常に高価なものにするか、自社設計のものを一世代前のものにするかにかかわらず、NvidiaはArmサーバーCPUの周りに堀を作るだろう。時間の経過とともに、ファンは、他のArmベンダーをNvidiaの自社設計で補完していくことになるだろう。オープンなArmのエコシステムは乗っ取られ、IntelやAMDに匹敵するか、それを超えるクローズドなエコシステムに置き換わるだろう」とSemianalysisのDylan Patelは述べている。

もしNvidiaが世界で最も重要なIP、最も一般的に使用されているCPU ISAとデザインを素早く手に入れることができれば、モバイルとデータセンターの運命を支配することになるだろう。これは、ジェン・スン・ファンの『トロイの木馬』であり、コンピューティングの未来をマキアベリズム的に乗っ取るためのものである」。

NvidiaがArmを適正な価格で買収したとき、それは新しい帝国の誕生を意味するだろう。