NVIDIAがGTC 2022秋の基調講演にて、次世代GPU「GeForce RTX 40シリーズ」の「RTX 4090」および「RTX 4080」を発表したので、内容についてざっくりと見ていきたいと思います。
※掲載当初にプロセスルールを4nmと紹介していましたが、TSMC 4Nは4nmと断定できる情報はありませんでした(5nmカスタムとの噂も)。お詫びして訂正いたします。
本記事の内容は記事執筆時点(2022年9月21日)のものであり、ご覧になっている際には異なる可能性があるため注意してください。
追記:後に「RTX 4080」の12GBは発売中止となったことが発表され、「RTX 4070 Ti」として発売されました。
ざっくり要点まとめ
- RTX 4090
- RTX 3090 Tiの2~4倍の性能(RTX & DLSS3 有効時に最大4倍)
- 希望小売価格は1,599ドル~(NVIDIA公式HPによると日本では298,000円~)
- CUDAコア数:16384
- ビデオメモリ:24GB GDDR6X 384-bit
- TGP(消費電力):450W
- 10月12日発売
- RTX 4080 16GB
- RTX 3080 Tiの2~4倍の性能(RTX & DLSS3 有効時に最大4倍)
- 希望小売価格は1,199ドル~(NVIDIA公式HPによると日本では219,800円~)
- CUDAコア数:9728
- ビデオメモリ:16GB GDDR6X 256-bit
- TGP(消費電力):320W
- 11月発売予定
- RTX 4080 12GB
- 後に発売中止が発表→「RTX 4070 Ti」として登場
- RTX 3080 Tiよりも大幅に高性能
- 希望小売価格は899ドル~(NVIDIA公式HPによると日本では164,800円~)
- CUDAコア数:7680
- ビデオメモリ:12GB GDDR6X 192-bit
- TGP(消費電力):285W
- 11月発売予定
- RTX 40シリーズ(Ada lovelace)恐らく共通
- TSMC 4Nプロセス
- 全体的にクロックが飛躍的に向上
- 電力効率が前世代より2倍向上
- レイトレーシング性能が前世代より最大2倍の性能(RTコアが第3世代に)
- 第4世代Tensorコアへと刷新しDLSS3に対応。最大2倍の性能に(DLSS3は前世代までのサポートなし)
- 補助電源がPCIe 5.0(12VHPWR)へと移行(8pinへのアダプターは同梱)
- AV1エンコードに対応
- 第8世代NVEnc(ハードウェアエンコーダ)を2基搭載し、前世代から2倍以上の性能
- 当面はRTX 30も併せて販売
発表にされたのはハイエンドモデルのみで、「RTX 4090」「RTX 4080 16GB」「RTX 4080 12GB」の3モデルでした。
要点は上記に書きましたが、一応それぞれについて軽く触れていきたいと思います。
RTX 4090
最上位のハイエンドモデルの「RTX 4090」です。その性能は前世代の最上位モデル「RTX 3090 Ti」の2~4倍という驚異的な性能です。刷新されたRTコアとTensorコアを利用したレイトレーシングとDLSS3有効時に最大で4倍の性能向上となっているようです。
CUDAコア数は16384となっており、RTX 4080 16GBの9728よりも約68.4%も多いです。前世代ではRTX 3090とRTX 3080で約20%程度しかコア数が変わらなかったので、価格差ほどの優位性を感じにくかったですが、そこが大幅に改善されて価格に見合ったコア数になっていると思います。
更にはクロックも大幅に向上しています。RTX 3090 Tiではベースクロックが1.67GHz、ブーストクロックが1.86GHzだったのに対し、RTX 4090はベースクロックが2.23GHz、ブーストクロックが2.52GHzとなっています。アーキテクチャの刷新およびコア数&クロックの大幅な向上が驚異的な性能向上を実現しています。
メモリは24GB GDDR6X 384ビットとなっており、RTX 3090から大きなスペックアップとはなっていないように見えます。ただし、発表内容には無かったように見えますが、キャッシュメモリが大幅に増量すると言われているので、有効メモリ帯域幅は大きく向上していると思われます。
グラフィックスの総消費電力を表すTGPは450Wとなっており、前世代最上位の「RTX 3090 Ti」と同じです。消費電力自体は非常に多いですが、性能が2倍なら単純計算で電力効率は2倍と非常に優れており、ここまで良くなるとは思っていませんでした。
気になるのは価格ですが、北米での希望小売価格は1,599ドル~となっており、10月12日から発売です。RTX 3090の登場時の価格は1,499ドルだったので、100ドル高くなっています。日本のNVIDIA公式HPでは、298,000円~で販売されると掲載されています。めちゃくちゃ高いです。
元値が少し値上がりしたことに加え、日本では円安が大きく進行していることもあり非常に高価な設定になっています。現状既存のGPUが在庫処分価格になっていることも高く感じる要因になっていると思います。性能向上率が凄い上に電力効率が非常に優れているので、それでもコスパは悪く無さそうですが、初期費用はとんでもないことになりそうです。
また、補助電源コネクタは最新のPCIe 5.0規格の12+4ピンの「12VHPWR」が採用されています。既存の電源ユニットでは対応がほぼされていないですが、従来のPCIe 8ピンコネクタ×3の変換アダプタが同梱されるので、既存の電源ユニットでも利用することができます。
RTX 4090の総評としては、やはり高すぎる価格はネックになるものの、前世代のRTX 3090よりは明らかに下位モデルに対して優位性が大きくて魅力的なモデルに見えます。元々90番台は予算を気にしない人が導入していたということを考えると、選択する価値を感じる人は意外と多くなりそうな気がします。
特に、多額の収入のあるプロゲーマーやストリーマーにとっては、高価でもその分の見返りのあるモデルとして、雑に選べる人気モデルになるかもしれません。
RTX 4080
「RTX 4080」は16GBモデルと12GBモデルの2つのモデルがラインナップされています。
追記:RTX 4080 12GBモデルについては、「RTX 4080」という名前の割には16GBモデルとの性能差が大きいことが混乱を招く可能性があるとして、後に発売中止が発表されました。RTX 4070などの別モデルとして販売される可能性はあると思いますが、RTX 4080としてはひとまずは16GBモデルのみとなるようです。
ただし、VRAMだけではなく、コア数などその他の点でも違いがあるため、性能には大きな差がある点に注意が必要です。発表前のリークでは12GBモデルはRTX 4070として扱われていたこともあり、その性能差は同SKUのモデル違いというよりは単純に下位モデルと上位モデルと見なした方が良い差です。
CUDAコア数は、16GBモデルが9728、12GBモデルが7680となっています。16GBモデルの方が約26.7%も多いコア数となっており、性能には差があります。
また、メモリは容量以外でも差があり、バス幅が16GBモデルが256ビットなのに対し、12GBモデルでは192ビットとなっています。ハイエンドモデルで192ビットメモリが採用されるのは少しマイナス印象です。キャッシュメモリが大幅に増量される予測のため、キャッシュメモリのヒット率や実行メモリ帯域幅を考慮するとメモリ性能が下がっているとは言いませんが、前世代ではRTX 3080 10GBでも320ビットメモリが採用されていたことを考えると、VRAMだけで見るとややスペックダウンというレベルになると思います。
具体的な性能については、16GBモデルはRTX 3080 Tiの2~4倍の性能とのことで、刷新されたRTコアとTensorコアを利用したレイトレーシングとDLSS3有効時に最大で4倍の性能向上ということのようです。グラフィックスの総消費電力を表すTGPは320Wとなっており、RTX 3080 Tiよりやや少ないので、電力効率は単純計算でも2倍以上も向上しています。
ですが、性能についてはRTX 3090 Tiの約2倍の性能と言われるRTX 4090より4割もコア数が減っているのに、RTX 3090 Tiと1割ちょっとしかゲーミング性能の変わらないRTX 3080 Tiの2倍の性能が出せるのかは正直やや疑問です。示された表を見る限りでも、DLSSやレイトレーシングを使用しない場合のゲームではRTX 3080 Tiの2倍には届いていないです。最大で2倍程度ということなのでしょうが、恐らくは大方のゲームでは2倍ほどの差は出ないと思うので、ここはちょっと誇大広告だったのではないかと邪推してしまいます。とはいえ、格段に性能が向上しているのは間違いないと思いますし、電力効率も物凄く良いので、GPU自体の評価は前世代から遥かに良くなっています。
12GBモデルについては、RTX 3080 Tiよりは大幅に高性能なのは間違いなさそうですが、比較表を見ると大体のゲームではレイトレやDLSS未使用時にRTX 3090 Tiと同等か、ゲームによってはやや上回るという感じに見えます。グラフィックスの総消費電力を表すTGPは285Wとなっており、前世代のRTX 3070 Tiとほぼ同等です。昨今のハイエンド帯にしては少なめの消費電力です。RTX 3090 Ti以上を見込める性能に加え、大幅に消費電力が減る点を考慮すると、予算を考えたハイエンドモデルとしては魅力的に見えますが、16GBモデルとの差が大きいのが気になるところです。
価格については、まず16GBモデルの参考価格が1199ドル~で、日本のNVIDIA公式HPでは219,800円~で販売されると掲載されています。また、発売予定は11月予定となっています。
ドルでの希望小売価格はRTX 3080 Tiの発表当初の価格と一致しますが、現在では、在庫処分価格となっている上に100ドル値下げされた「現状のRTX 3080 Ti」は12万円程度でも購入できるので、それよりは圧倒的に高いです。円安の影響も大きいと思われますが、さすがに80番台で22万円は高すぎるという印象です。
電力効率の飛躍的な改善がありますし、性能は前世代の最上位モデル(RTX 3090 Ti)をも大きく上回ることを考えると、ヘビーユーザーや予算が潤沢な人にとっては魅力的な選択肢となると思いますが、一般的な人には一概に良いとは言えない価格差になっていると思います。
12GBモデルについては参考価格が899ドル~で、日本のNVIDIA公式HPでは164,800円~で販売されると掲載されています。既存モデルで価格が近いのは、値下げ後に799ドルに設定された「RTX 3080 12GB」だと思いますが、それが今では10万円程度から購入できるので、やはりかなり高めの価格設定です。
16GBモデルは前世代の最上位の「RTX 3090 Ti」すらも大きく上回る性能があるため、多少高くても魅力がありましたが、RTX 4080 12GBモデルだとそこでの優位性を感じにくくなるので、発売時点でのこの価格は悩みどころです。192ビットのVRAMもやや気になります。
電力効率に関しては間違いなく大きな改善となるため、前世代と比較してそこを重視するなら十分に良い選択肢と言えますが、出来るだけ安く高いゲーミング性能という意味なら、RTX 4070を待ちたい仕上がりかなというのが正直な感想です。RTX 4070も高くても前世代から100ドル~150ドル程度の値上げでしょうし、仮に150ドル値上げの649ドルとしても250ドル差なので、安く見積もってもRTX 4080 12GBよりは4万円くらいは安くなると思われますから、大分安くなります。性能については詳細を待つ必要がありますが、手の届きやすさはかなり変わってくると思いますし、RTX 3070を大幅に上回る性能で電力効率が大きく改善することが間違いない時点で、10万円ちょっとくらいなら十分に価値を感じることが出来ると思います。
また、RTX 4080ではRTX 4090と同じく、補助電源コネクタは最新のPCIe 5.0規格の12+4ピンの「12VHPWR」が採用されています。既存の電源ユニットでは対応がほぼされていないですが、16GBモデルではPCIe 8ピンコネクタ×3、12GBモデルではPCIe 8ピンコネクタ×2の変換アダプタが同梱されるので、既存の電源ユニットでも利用することができます。
その他
その他、主にシリーズ共通と思われる仕様についても軽く触れています。
TSMC 4Nプロセス採用で電力効率が2倍に
プロセスについて、RTX 40シリーズはTSMC 4Nで製造されます。RTX 30シリーズではサムスンの8nmでしたが、TSMC製の5nmカスタムと言われている4Nプロセスとなり、大きく微細化が進んでいます。サムスンの半導体はTSMCより質が劣るという噂というか憶測がありましたが、これがTSMCへと変更になった上にプロセスルールも大きく微細化が進むことになりました。
TSMCとサムスンの半導体の質の良し悪しについては特に語りませんが、それを除いても8nm→5nmというだけで大きな躍進です。プロセス微細化は特に電力効率の改善においては大きく貢献すると言われており、これが前世代から2倍となった電力効率にも貢献しているはずです。
RTコアが第3世代に、前世代から最大2倍の性能に
レイトレーシング用のRTコアが第3世代へと更新し、前世代から最大2倍の性能になったようです。ハイエンドモデルでは一気に普通に実用レベルになったと思います。
Tensorコアが第4世代になり、DLSS 3が登場。最大2倍の性能に
NVIDIAのアップスケリーング技術であるDLSSですが、従来のDLSS 2からバージョンアップしたDLSS 3が登場するようです。そして、それを利用すると前世代比で最大2倍の性能になるらしいです。
ただし、DLSS 3を利用できるのは、RTX 40シリーズ(および恐らくそれ以降)で導入される第4世代のTensorコアのみとなる点に注意が必要です。前世代までのTensorコアではサポートされないようです。
DLSS 3はDLSS 2の基盤の上で構築されているため、DLSS 2対応ゲームでは簡単にDLSS 3に対応できるらしいですが、ゲーム側およびハード要件もあるDLSSがそもそもまだ多くのゲームでメジャーとは言えないと思いますし、更に対応が狭くなるDLSS 3を優先するゲームは多くないと思いますので、当分はDLSS 3がメジャーにはならないような気はします。
AV1エンコードに対応で、性能も大幅に向上
主にクリエイティブ用途で重要な要件として、エンコード機能が大幅に強化された件があります。
AV1デコードには前世代の時点で対応していましたが、RTX 40でエンコードにも対応しました。更に、ハードウェアエンコーダは新しい世代の第8世代NVEncを2基搭載となり、前世代から見て2倍以上の性能となっているようです。ゲーム面ばかりが注目されますが、ここもかなり大きな躍進です。
当面はRTX 30シリーズと併せて販売
次世代のRTX 40シリーズの登場となった訳ですが、当面はRTX 30シリーズも併せて販売されることも発表されました。
RTX 30シリーズの在庫が過剰に残っているという話もありますし、発表されたハイエンドモデルが高額すぎるので、低価格帯を埋めるにはまぁ当然の対応かなと思います。
RTX 4070については一切触れられなかったことも気になります。思ったよりも発売が遅れる可能性もありますし、まだ暫くRTX 30シリーズとは市場で顔合わせることになりそうです。
あとがき
多くは語りませんが、あとがきです。
遂に待ちに待った次世代GPUの発表でした。リークからRTX 4070と噂されていたモデルがRTX 4080の下位モデルとして登場したのは予想外でした。
性能に関してはやはり凄いの一言です。RTX 4090が従来の90番台と違って80番台よりも大きく高性能になり、ようやくちゃんとしたゲームでの最上位モデルになったなという印象でした。
RTX 4080 12GBモデルの性能についてはちょっとした怪しさも感じますが、どのモデルも電力効率は前世代から飛躍的に向上しているのは間違いないので、それだけで大きな価値はありますし、魅力的だと思います。
ですが、RTX 4070の発表が先送りになったのは非常に残念です。RTX 4090 / RTX 4080の価格がめちゃくちゃ高価だったので、尚更です。ある程度の値上がりは予想していましたが、元々RTX 4070だと思っていたモデルがRTX 4080になり、それが16万円台からというのは面食らってしまいました。円安怖いです。新世代GPUがきたらすぐ導入するぞ!と待ち望んでいた人も、さすがにちょっと考えるレベルの価格ではないかと思います。
RTX 4070の発売が大きく遅れるのが確実という訳ではないと思うので、割とすぐ発表されるのを期待したいと思います。
ただし、次世代GPUの電力効率の改善によってマイニングブームの再来の可能性も無くはないと思いますので、そうなるかはわかりませんが、その影響を出来るだけ避けられるように早く発表・発売して欲しいなと思います。
それでは、間にRyzen 7000シリーズCPUの発売とか、Radeon RX 7000シリーズの発表とかも挟まるかもしれませんが、発表モデルが登場したら実際の性能についても見ていきたいと思うので、楽しみに待ちたいと思います。
>TSMC 4nmプロセス採用
TSMC (N4ではなく)4N=5nmカスタムというのは情報追ってる人にはNVIDIAユーザー間でも初歩的な常識なんですがw
DLSSありきで、素の性能で語らないのがインチキ臭いと感じました。画質はどうしても落ちますしね