10,496 コアを備えた RTX 3090: Nvidia がこれがどのように可能であるかを説明

事前のリークは正しかったが、解釈が間違っていた。 (画像出典: Nvidia)

Nvidia の新しいグラフィックス カードに関する詳細は、最近ではほとんど議論されていません。シェーダユニットの数についての質問。尊厳公式情報によるとそれぞれの RTX 2000 の同等品と比較して 2 倍以上、以前のリークと比較してちょうど 2 倍でした。

さまざまな理論がありました。最新の CPU で知られる仮想コアの倍増に対応するテクノロジーに単純に基づいた単純なマーケティングについて語る人もいます。これらは、RTX 3090 の場合のように、実際の 10,496 コアではありません。

たとえば、Plus コラムでは、特に、Nvidia がこのようなパフォーマンスの飛躍的な向上で何を目指しているのか、またその理由は何なのかという問題を考察しています。

また、個々の構造が実際には 2 倍になっているものの、すべてが 2 倍になっているわけではない可能性があると考えている人もいます。誤解を招くという非難は議論全体に共通の糸のように流れた。しかし、Nvidia はこの疑問をついに明確にしました。: Nvidia が賢いテクノロジーを使用しているとしても、これらは実際には本物のコンピューティング ユニットです。

FP32ユニットが2倍になりました

シェーダ ユニットを収容するいわゆるストリーミング マルチプロセッサは、Ampere 用に再設計されました。 Turing アーキテクチャに基づく RTX 2000 が SM ごとに 64 の FP32 オペレーションを実行できるのに対し、Ampere は 128 の FP32 オペレーションを管理します。

これはどのように作動しますか?Nvidia は、シェーダー クラスターごとに 64 個の純粋な FP32 ユニットに加えて、FP32 ユニットと INT32 ユニットの両方で構成される 64 個の追加シェーダーをインストールします。ただし、これらを同時に使用することはできず、それぞれの要件に応じて、基本的にはどちらか一方を使用します。

FP32:32 ビットの精度の浮動小数点計算を表します。
INT32:32 ビットの精度で整数計算を表します。

Wie Nvidias コンテンツおよびテクノロジー担当上級副社長 Tony Tamasi よりレディットただし、パフォーマンスの点では FP32 操作の方がより重要です。だからこそ、RTX 3000 の目標はこれを 2 倍にすることです。

RTX 3000 に関する技術的な詳細については、次のテキストを参照してください。

リークは正しかったが、誤解されていた

今ではその理由が明らかです事前に漏れる誰もが間違っていて、たとえば RTX 3090 の場合は5,248 シェーダ ユニット予測、つまりちょうど半分です。

これまでは常にそうであったため、誰もがストリーミング マルチプロセッサあたり 64 FP32 ユニットを想定していました。ストリーミング マルチプロセッサの数も、予想の 82 個 (82 x 64 = 5,248、82 x 128 = 10,496) で変更ありませんでした。