Intel「GeForce RTX 5090」のざっくり性能比較・評価です。米国での発売予定日は2025年1月30日ですが、発売前にレビューが解禁されたので、海外レビューを参考に性能をざっくりと確認していきます。
本記事の情報は記事執筆時点(2025年1月27日)のものです。ご覧になっている際には異なる可能性があるため注意してください。
仕様
まずは主要な仕様を表にまとめて載せています。
※価格は2025年1月27日時点での米での希望小売価格です(判明しているもののみ)。
※GPU名のリンクはAmazonのものです。
GPU | シェーダー ユニット数 | メモリタイプ | VRAM速度 VRAM帯域幅 | レイトレ用 ユニット数 | ダイサイズ (おおよそ) | 消費電力 (TGP等) | 希望小売 価格 |
---|---|---|---|---|---|---|---|
RTX 5090 | 21760 | GDDR7 32GB 512bit | 28.0Gbps 1792GB/s | 170 | 750㎟ | 575W | 1,999ドル |
RTX 4090 | 16384 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 128 | 608㎟ | 450W | 1,599ドル |
RTX 5080 | 10752 | GDDR7 16GB 256bit | 30.0Gbps 960GB/s | 84? | ?㎟ | 360W | 999ドル |
RTX 4080 SUPER | 10240 | GDDR6X 16GB 256bit | 23.0Gbps 736.3GB/s | 80 | 380㎟ | 320W | 999ドル |
RTX 4080 | 9728 | GDDR6X 16GB 256bit | 22.4Gbps 716.8GB/s | 76 | 380㎟ | 320W | 1,199ドル →市場廃止 |
RTX 5070 Ti | 8960 | GDDR7 16GB 256bit | 28.0Gbps 896GB/s | 70? | ?㎟ | 300W | 749ドル |
RX 7900 XTX | 6144 | GDDR6 24GB 384bit | 20Gbps 960GB/s | 96 | 36.6㎟*6 + 300㎟ | 355W | 969ドル |
RX 7900 XT | 5376 | GDDR6 20GB 320bit | 20Gbps 800GB/s | 84 | 36.6㎟*6 + 300㎟ | 315W | 799ドル →749ドル? |
RTX 4070 Ti SUPER | 8448 | GDDR6X 16GB 256bit | 21.0Gbps 672GB/s | 66 | 295㎟ | 285W | 799ドル |
RTX 4070 Ti | 7680 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 60 | 295㎟ | 285W | 799ドル →市場廃止 |
RTX 5070 | 6144 | GDDR7 12GB 192bit | 28?Gbps 672GB/s | 48? | ?㎟ | 250W | 549ドル |
RTX 3090 Ti | 10752 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 84 | 628.4㎟ | 450W | 1,499ドル |
RTX 3090 | 10496 | GDDR6X 24GB 384bit | 19.5Gbps 936GB/s | 82 | 628.4㎟ | 350W | 1,299ドル |
RX 7900 GRE | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 36.6㎟*6 + 300㎟ | 260W | 549ドル |
RX 6950 XT | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 519㎟ | 335W | 949ドル |
RX 6900 XT | 5120 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 80 | 519㎟ | 300W | 699ドル |
RTX 3080 Ti | 10240 | GDDR6X 12GB 384bit | 19Gbps 912GB/s | 80 | 628.4㎟ | 350W | 1,099ドル |
RTX 3080 10GB | 8704 | GDDR6X 10GB 320bit | 19Gbps 760GB/s | 68 | 628.4㎟ | 320W | 699ドル |
RTX 4070 SUPER | 7168 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 56 | 295㎟ | 220W | 599ドル |
RTX 4070 | 5888 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 46 | 295㎟ | 200W | 549ドル 前:599ドル |
RX 7800 XT | 3840 | GDDR6 16GB 256bit | 19.5Gbps 624GB/s | 60 | 37.5㎟*4 + 200㎟ | 263W | 499ドル |
RX 6800 XT | 4608 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 72 | 519㎟ | 300W | 599ドル |
RTX 3070 Ti | 6144 | GDDR6X 8GB 256bit | 19Gbps 608GB/s | 48 | 392㎟ | 290W | 599ドル |
RX 6800 | 3840 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 60 | 519㎟ | 250W | 549ドル |
RX 7700 XT | 3456 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 54 | 37.5㎟*4 + 200㎟ | 245W | 419ドル 前:449ドル |
RTX 4060 Ti 8GB | 4352 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 34 | 190㎟ | 160W | 399ドル |
RTX 3070 | 5888 | GDDR6 8GB 256bit | 14Gbps 448GB/s | 46 | 392㎟ | 220W | 499ドル |
RX 6750 XT | 2560 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 40 | 336㎟ | 250W | 419ドル |
RTX 3060 Ti | 4864 | GDDR6 8GB 192bit | 14Gbps 448GB/s | 38 | 392㎟ | 200W | 399ドル |
RX 6700 XT | 2560 | GDDR6 12GB 192bit | 16Gbps 384GB/s | 40 | 336㎟ | 230W | 379ドル |
Arc A770 16GB | 4096 | GDDR6 16GB 256bit | 17.5Gbps 560GB/s | 32 | 406㎟ | 225W | 349ドル |
Arc A770 8GB | 4096 | GDDR6 8GB 256bit | 16Gbps 512GB/s | 32 | 406㎟ | 225W | 329ドル |
Arc B580 | 2560 | GDDR6 12GB 192bit | 19Gbps 456GB/s | 20 | 272㎟ | 190W | 249ドル |
RX 7600 XT | 2048 | GDDR6 16GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 190W | 329ドル |
RTX 4060 | 3072 | GDDR6 8GB 128bit | 17Gbps 272GB/s | 24 | 156㎟ | 115W | 299ドル |
Arc B570 | 2304 | GDDR6 10GB 160bit | 19Gbps 380GB/s | 18 | 272㎟ | 150W | 219ドル |
RX 6650 XT | 2048 | GDDR6 8GB 128bit | 17.5Gbps 288GB/s | 32 | 237㎟ | 180W | 299ドル |
RX 7600 | 2048 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 165W | 269ドル |
RX 6600 XT | 2048 | GDDR6 8GB 128bit | 16Gbps 256GB/s | 32 | 237㎟ | 160W | – |
Arc A750 | 3584 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 28 | 406㎟ | 225W | 289ドル |
RX 6600 | 1792 | GDDR6 8GB 128bit | 14Gbps 224GB/s | 28 | 237㎟ | 132W | 239ドル |
RTX 3060 12GB | 3584 | GDDR6 12GB 192bit | 15Gbps 360GB/s | 28 | 276㎟ | 170W | 329ドル |
RTX 3050 | 2560 | GDDR6 8GB 128bit | 15Gbps 224GB/s | 20 | 276㎟ | 130W | 249ドル |
「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。
RTX 50シリーズでは前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われますが、元々コア性能が上がっても向上を感じられないコア数表記は問題がある部分だったので、表記を切り替える良い機会になったのかなと思います。
GPU | 希望 小売価格 | GPU | VRAM | TGP | |||||
---|---|---|---|---|---|---|---|---|---|
CUDAコア | Tensorコア (AI TOPS) | RTコア (TFLOPS) | クロック 最大(GHz) | 容量/タイプ | バス幅 | 帯域幅(GB/s) | |||
RTX 5090 | 1999ドル | 21760 | 3352 | 318 | 2.41 | 32GB GDDR7 | 512bit | 1792 | 575W |
RTX 4090 | 1599ドル | 16384 | 1321 | 191 | 2.52 | 24GB GDDR6X | 384bit | 1008 | 450W |
RTX 5080 | 999ドル | 10752 | 1801 | 171 | 2.62 | 16GB GDDR7 | 256bit | 960 | 360W |
RTX 4080 SUPER | 999ドル | 10240 | 836 | 121 | 2.55 | 16GB GDDR6X | 256bit | 736 | 320W |
RTX 5070 Ti | 749ドル | 8960 | 1406 | 133 | 2.45 | 16GB GDDR7 | 256bit | 896 | 300W |
RTX 4070 Ti SUPER | 799ドル | 8448 | 780 | 102 | 2.61 | 16GB GDDR6X | 256bit | 672 | 285W |
RTX 4070 SUPER | 599ドル | 7168 | 568 | 93 | 2.48 | 12GB GDDR6X | 192bit | 504 | 220W |
RTX 5070 | 549ドル | 6144 | 988 | 94 | 2.51 | 12GB GDDR7 | 192bit | 672 | 250W |
RTX 4070 | 549ドル | 5888 | 466 | 67 | 2.48 | 12GB GDDR6X 12GB GDDR6 | 192bit | 504 | 200W |
今回見ていくのはNVIDIA「GeForce RTX 5090」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」の最上位のハイエンドモデルです。
希望小売価格は1,999ドルで、国内想定価格は393,800円~となっています。ただし、想定価格は少数在庫のいわゆる”アリバイ価格”とも言われており、初期在庫を逃すと数か月は更に高額な状態が続くとも噂されている点に注意です。
CUDAコア数は21,760という圧倒的な数を誇り、「RTX 4080 SUPER」の2倍以上という驚異的なコア数です。「RTX 4090」と比較すると32.8%上回るコア数で、RTコアやTensorコアなどの各コア類も基本32.8%ほど多い数です。VRAMも24GBから32GBに増量されています。
「RTX 4090」が現在でも他GPUを圧倒するGPUだったにも関わらず、それをも更に大きく超える規格外のウルトラハイエンドGPUとなっています。
また、コア・ユニット数の増加だけでなく、RTX 50では各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。
特に気になるのはTensorコアのAI性能で、NVIDIA公表の「RTX 5090」の理論性能(INT8)は 3352 TOPSとなっており、これは「RTX 4090」の約2.54倍という驚異的な向上率です。Tensorコア数は他コアと同じで約32.8%の増量ですから、それでこの向上率は凄いです。
そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されましたし、AIをとにかく重視するという姿勢がよく見て取れるのが「RTX 50シリーズ」となっています。
VRAMもGDDR7へとアップグレードされており、「RTX 5090」では32GBという圧倒的大容量が搭載されます。バス幅も512bitまで拡張され、帯域幅は1792 GB/sとなっています。圧倒的大容量かつ高速なメモリシステムとなっています。
レイトレーシングや生成AIやメタバースなど、最近利用が進んでいる用途はどれもVRAMが非常に重要なので、特にそれらの性能を最大限高めたい人向けのGPUとなっています。
ただし、「RTX 50シリーズ」はプロセス面に関しては前世代からほとんど進化していない点は覚えておいて良いかもしれません。
製造プロセスは前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも「5nm EUV」で製造されているという噂です。
そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」で微細化はされていない可能性が高そうです。そのため、主に電力効率(ワットパフォーマンス)面では大きな改善が見られないかもしれないのが懸念点です。
その辺りとも関連性もある部分として、気になるのはやはり消費電力と価格です。
まず消費電力について、「RTX 5090」のTGPは575Wとなっています。「RTX 4090」の450Wを約28%上回る超高消費電力です。ケーブル1本で600Wまで対応できる「12VHPWR / 12V-2×6」が登場したのは記憶に新しいと思いますが、その制限のギリギリです。
単純な消費電力の多さがネックなのはもちろんですが、気になるのは効率です。コア類の増加が約32.8%なのに対し、電力増加が約28%ということで、その差はわずか5%程度です。
性能の大幅向上はほぼ間違いないものの、ワットパフォーマンスではさほど変わらないのかなという印象を受けます。
次に価格ですが、希望小売価格が1,999ドルで国内想定価格が393,800円~と超高額です。日本においては円安が高額さに拍車をかけているのも厳しいところです。
ただし、実は「RTX 4090(1,599ドル)」と比較すると割と良心的な価格です。コア類およびVRAM容量の増加は約1.33倍ですが、価格は約1.25倍に留まっています。
AMDのRadeon RXがハイエンドモデルを出さないのがほぼ確実視されている上、AI需要も凄いですから、多少高くても間違いなく売れる状況なのにも関わらずに、この価格設定は良心的だと思います。前述のプロセスがほぼ据え置きに近い形というのも価格を上げずに済んだ理由なのかもしれません。
とはいえ、ほとんどの人にとっては超絶オーバースペックということもあり、約40万円~というとんでもなく高い価格はデメリットかなと思います。
DLSS 4、ニューラルレンダリング
「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。
まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。
DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。
また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。
マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。
次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。
従来はグラフィックスAPI内でTensorコア(AI)を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。
これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。
DLSSやFSRといった別機能ではなく、グラフィックスAPI(DirectX)の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR(レイトレーシング)単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。
といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。
ゲーミング性能(ラスタライズ)
ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。
まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能(ラスター性能)を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。
使用されたグラフィックボードは「NVIDIA GeForce RTX 5090 Founders Edition(通称FE版)」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。
フルHD(1920×1080)
フルHD(1920×1080)です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 7900 XTX | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RTX 4070 | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc B570 | |
RX 7600 | |
Arc A770 16GB | |
RX 6600 XT | |
RTX 3060 12GB | |
RX 6600 | |
Arc A580 | |
RTX 3050 8GB |
フルHDは低負荷すぎて参考性能だけど、圧倒的な性能
フルHDのラスタライズは「RTX 5090」にとっては低負荷すぎて、ほとんどのゲームではCPUなどのボトルネックが先にきてしまうので参考レベルの性能です。
しかし、その性能はやはり圧倒的で「RTX 4090」を約11.6%上回っています。重いゲームが中心かつ最高設定ながら、平均fpsは251に達しています。
1440p(2560×1440)
WQHD(2560×1440)です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 7900 XTX | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RTX 4070 | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 | |
RTX 3060 12GB | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
1440pでは「RTX 4090」を約21%上回り、RTX 4070 SUPERの約2倍の性能
ここからが本番です。1440pでは「RTX 4090」を約21%上回り、「RTX 4070 SUPER」の約2倍という圧巻の性能です。
従来なら大分ヘビーな条件(1440pで重量級のゲームを最高設定)だとしてもどのタイトルでも基本快適です。DLSSなどのアップスケーリングやフレーム生成も無しでこの性能なので、とんでもないです。
4K(3840×2160)
「超高解像度の代名詞」という感じの解像度の4K(3840×2160)です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RX 7900 XTX | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 3090 | |
RTX 4070 SUPER | |
RX 7900 GRE | |
RTX 3080 10GB | |
RX 7800 XT | |
RTX 4070 | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
Arc B580 | |
RTX 3060 Ti | |
RX 6700 XT | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 XT | |
RTX 4060 | |
RTX 3060 12GB | |
RX 7600 | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
4Kでは「RTX 4090」を約34.7%上回る性能で、1440pから更に大きく差を広げる
4Kでは更に凄い性能となっており、「RTX 4090」を約34.7%上回る性能です。1440pから差を14%近くも広げています。コアの増量分である32.8%も超えた向上率となっています。
アーキテクチャに更新による向上も少しはあると思うものの、製造プロセスの質は恐らくほぼ変わらないず、最大クロックもわずかに低下していますから、それで1440pから4Kでこの向上率ということは、現状では1440pですら「RTX 5090」にとっては低負荷で、大きなボトルネックになってしまっているということだと思われます。
比較対象の「RTX 4090」が現在でも十分なウルトラハイエンドGPUなのに、これだけの差を付けているのが驚きです。「RTX 4090」でもフルHDや1440pでは多少のボトルネックが発生しているとは思うのですが、それを感じさせないくらい大きな性能差があります。
試しに他GPUと比べてみると、「RTX 4070 Ti SUPER」の約2倍の性能だったりなど、信じられないくらいの高性能となっています。
重量級ゲームの4Kでの高フレームレート運用を目指すのであれば、非常に魅力的なGPUだと思います。
電力関連
消費電力
ゲームプレイ時(高負荷時)の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」で、解像度は「3840×2160(4K)」です。
GPU名称 | 消費電力 |
---|---|
RTX 4060 | |
RTX 3050 8GB | |
RTX 4060 Ti 8GB | |
RX 6600 XT | |
Arc B570 | |
RX 7600 | |
RTX 4060 Ti 16GB | |
RTX 3060 12GB | |
Arc B580 | |
RX 7600 XT | |
RTX 4070 | |
RTX 3060 Ti | |
Arc A580 | |
RX 6700 XT | |
RTX 4070 SUPER | |
RTX 3070 | |
RX 6800 | |
Arc A770 16GB | |
RX 7700 XT | |
RX 7800 XT | |
RX 7900 GRE | |
RTX 4070 Ti | |
RX 6800 XT | |
RTX 4080 SUPER | |
RTX 4070 Ti SUPER | |
RTX 4080 | |
RX 7900 XT | |
RTX 3080 10GB | |
RX 7900 XTX | |
RTX 3090 | |
RTX 4090 | |
RTX 5090 |
消費電力はやはり多すぎる
ゲーム時の平均消費電力は587Wとなっており、TGPの575Wに違わない圧倒的な消費電力です。電源ユニットも超大容量&高品質なものが必須となっています。
NVIDIA公式の必要システム電力は1000Wとなっていますが、変換時のロスやハイエンドPCの他パーツの消費電力も加味すると、実際には最低でも1200Wは欲しいかなという感じだと思います。
300W前後のGPUなら750W~850W程度で済むと考えて費用を比較すると、1万円~3万円くらいの追加費用が掛かることになると思いますが、GPU自体の金額を考えると小さな追加費用だと錯覚しそうなのが怖いですね。
また、表には載せていませんが、アイドル時や軽負荷な処理時の消費電力が他のGPUと比べると高いのも弱点です。
アイドル時でも約30Wと多めの電力を消費し、「RTX 4090」でも22W程度、他のRTX 40でも大体10W前半だったことを考えると、非常に多いです。また、ビデオ再生時にも似たような傾向の差の消費電力を必要とします。
超大量のコアと超大容量VRAMを持っているため、軽負荷でも稼働するためにはそれなりの電力が必要になります。大きなネックとなるほどではないと思いますが、重い処理をしないのなら、やはり微妙なGPUです。
ワットパフォーマンス
ワットパフォーマンス(電力効率)を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています
環境は消費電力はおよび4Kは「Cyberpunk 2077(Ultra/レイトレ無効)」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 4070 SUPER | |
RTX 4060 Ti 8GB | |
RTX 4070 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4060 | |
RTX 4060 Ti 16GB | |
RTX 4070 Ti | |
RTX 4070 Ti SUPER | |
RTX 4090 | |
RX 7900 GRE | |
RX 7900 XT | |
RX 7800 XT | |
RX 7900 XTX | |
Arc B570 | |
RX 7700 XT | |
RX 7600 | |
RX 6800 | |
RX 6600 XT | |
Arc B580 | |
RTX 3070 | |
RTX 3060 Ti | |
RX 6800 XT | |
RTX 5090(参考) | |
RX 6700 XT | |
RX 7600 XT | |
RTX 3090 | |
RTX 3080 10GB | |
RTX 3060 12GB | |
RTX 3050 8GB | |
Arc A770 16GB | |
Arc A580 |
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 SUPER | |
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX | |
RTX 4060 Ti 8GB | |
RTX 4070 | |
RX 7900 XT | |
Arc B570 | |
RTX 4070 Ti | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 4070 Ti SUPER | |
Arc B580 | |
RTX 4060 Ti 16GB | |
RTX 4060 | |
RX 7600 | |
RX 7700 XT | |
RTX 3070 | |
RX 6800 | |
RTX 3060 Ti | |
RTX 3090 | |
RX 6800 XT | |
RTX 3080 10GB | |
RX 7600 XT | |
RX 6600 XT | |
Arc A770 16GB | |
RX 6700 XT | |
RTX 3060 12GB | |
RTX 3050 8GB | |
Arc A580 |
4Kの効率は良いけど、RTX 4090~RTX 4070 SUPERとほぼ変わらず
4Kゲーミング時のワットパフォーマンスは非常に良いです。しかし、前世代のRTX 4090~RTX 4070 SUPERとほぼ同等レベルとなっています。
消費電力増の影響もあるかもしれませんが、やはり製造プロセスがほぼ変わらないっぽいのが大きいのかなという印象です。ただ、全ての仕様が規格外のハイエンドモデルなので、これを「RTX 50シリーズの効率」として見て良いかはちょっと微妙なところです。シリーズとしての評価は他モデルを見てからにしたいところですね。
また、フルHDのときの効率に関しては参考値ではあるものの、4Kと比べると悪化しています。参考値とはいえ、ボトルネックによりパフォーマンスが制限されるケースが増えて効率が低下する事態は多くなるとは思うので、フルHDで使うのは電力効率的にもやや勿体ないGPUとなると思います。
ただし、「RTX 4090」も登場時には今よりもフルHDでは微妙に見えましたが、それから「Ryzen 7 7800X3D / 9800X3D」といったゲームで非常に強力なCPUが登場して、少しコスパが改善されたみたいなことがあり、今後も同様のことが起きる可能性があります。
レイトレーシング性能
レイトレーシング性能
リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。
また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。
※従来は各ゲームの幾何平均fpsの値を再計算して載せていたのですが、参考ページで全GPUの詳細fps値が示されなかったため、今回は相対性能を見ていきます。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 4070 Ti | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 XTX | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 XT | |
RX 7900 GRE | |
RTX 4060 Ti 16GB | |
RX 7800 XT | |
RTX 4060 Ti 8GB | |
RTX 3070 | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RTX 4060 | |
RX 6800 | |
Arc A770 16GB | |
RTX 3060 12GB | |
RX 6700 XT | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 6600 | |
RX 7600 |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 4070 Ti | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RX 7900 XTX | |
RTX 3090 | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 XT | |
RX 7900 GRE | |
RTX 4060 Ti 16GB | |
RX 7800 XT | |
RX 6800 XT | |
RX 7700 XT | |
Arc B580 | |
RTX 3070 | |
RX 6800 | |
RTX 4060 Ti 8GB | |
RTX 3060 Ti | |
Arc A770 16GB | |
RTX 4060 | |
RTX 3060 12GB | |
RX 6700 XT | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 7600 | |
RX 6600 | |
RX 6600 XT |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 3090 Ti | |
RTX 3090 | |
RX 7900 XTX | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RX 7900 XT | |
RTX 4070 | |
RX 7900 GRE | |
RTX 3080 10GB | |
RX 7800 XT | |
RTX 4060 Ti 16GB | |
RX 6800 XT | |
RX 7700 XT | |
RX 6800 | |
Arc A770 16GB | |
RTX 3070 | |
RTX 4060 Ti 8GB | |
RTX 3060 Ti | |
RX 6700 XT | |
RTX 4060 | |
Arc B580 | |
RTX 3060 12GB | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 7600 | |
RX 6600 |
驚異的なレイトレーシング性能
レイトレーシング性能も驚異的です。「RTX 4090」と比較するとフルHDでも約19%上回る性能となっており、やはり圧倒的な性能です。
また、ラスタライズのフルHDでは約11.6%の差だったので、高負荷なレイトレーシングではフルHDでもラスタライズよりはボトルネックが発生していないことがわかります。
ラスターでも4Kなら十分に性能を活かすことは可能なものの、まだ大体の人はゲーミングモニターはフルHDもしくは1440pのものを使っていると思うので、その環境ならやはりレイトレーシングの方が性能を余すことなく使いやすいです。
そのため、ゲームでは基本レイトレーシング前提で考える方が良いレベルの規格外のGPUとなっています。
DLSS
DLSS有効時のゲーム性能
DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要となるため、GeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。
4Kでレイトレーシング有効&最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能(幾何平均)を見ていきます。
GPU名称 | 幾何平均fps |
---|---|
RTX 5090 フレーム生成x4 | |
RTX 5090 フレーム生成x3 | |
RTX 5090 フレーム生成x2 | |
RTX 5090 DLSS Quality | |
RTX 4090 フレーム生成x2 | |
RTX 4090 DLSS Quality | |
RTX 5090 ネイティブ | |
RTX 4090 ネイティブ | |
RX 7900 XTX FSR Quality | |
RX 7900 XTX ネイティブ |
マルチフレーム生成の効果は絶大
マルチフレーム生成の効果は非常に大きいです。一つずつ向上率を見ていくと、まずDLSSの通常のアップスケーリングをQuality設定で有効にすると、フレームレートは約1.48倍になります。
フレーム生成をオンにした場合、ネイティブと比較すると、x2のとき約1.77倍、x3のとき約2.59倍、x4のとき約3.32倍となります。
当たり前と言えば当たり前ですが、生成倍率が増えても、向上率がほぼ変わらないのが凄いです。しかし、このパフォーマンスは圧倒的な処理性能を持つ「RTX 5090」だからという可能性もあるので、詳しい評価は他のGPUの到着を待ちたいと思います。
しかし、マルチフレーム生成の効果は絶大なのは確かであり、フルで活用できれば「今までは何だったんだ」というレベルの向上率を手にできることになりそうです。
コストパフォーマンス
上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。各GPUの価格は、記事執筆時点のおおよその市場最安値価格です。ラスタライズとレイトレーシング時の両方を見ていきます。
元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。
1フレームあたりの価格(ラスタライズ)
まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
Arc A580 | ¥24,800 | |
RX 6600 | ¥28,800 | |
Arc A770 16GB | ¥39,800 | |
RX 7600 | ¥36,980 | |
RTX 4060 | ¥41,980 | |
RX 7700 XT | ¥62,980 | |
RX 7800 XT | ¥75,800 | |
RTX 3060 12GB | ¥39,980 | |
Arc B580 | ¥49,800 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 3050 8GB | ¥28,800 | |
Arc B570 | ¥44,980 | |
RTX 3080 10GB | ¥84,800 | |
RTX 4070 | ¥86,800 | |
RX 7900 XT | ¥116,800 | |
RX 6800 XT | ¥89,800 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RTX 4070 SUPER | ¥109,980 | |
RX 7900 XTX | ¥154,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RTX 4080 SUPER | ¥169,800 | |
RTX 4090 | ¥323,800 | |
RTX 5090 | ¥393,800 |
コスパは非常に悪い
価格が圧倒的な高さなので仕方ありませんが、コスパは非常に悪いです。「RTX 4090」とほぼ同じです。4Kでの算出ならもう少しマシにはなりますが、それでも非常に悪いのは変わりません。
コスパを求めるGPUではないので当たり前ではありますが、少なくとも消費者レベルでは需要は予算が潤沢な人以外では選択肢に入らないことが基本です。
1フレームあたりの価格(レイトレーシング)
次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
Arc A580 | ¥24,800 | |
Arc A770 16GB | ¥39,800 | |
Arc B580 | ¥49,800 | |
RTX 3060 12GB | ¥39,980 | |
Arc B570 | ¥44,980 | |
RTX 4060 | ¥41,980 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RX 7700 XT | ¥62,980 | |
RTX 3050 8GB | ¥28,800 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RTX 4080 SUPER | ¥169,800 | |
RX 7900 XT | ¥116,800 | |
RX 7600 XT | ¥50,800 | |
RX 7900 XTX | ¥154,800 | |
RX 7600 | ¥36,980 | |
RTX 5090 | ¥393,800 | |
RTX 4090 | ¥323,800 |
レイトレーシングでもコスパは悪い
コスパに関してはレイトレーシングでも悪いです。ラスターよりは少し差が縮まってはいるものの、最下位クラスという立ち位置は変わっていません。
ただし、レイトレーシングの高解像度&高設定で高いパフォーマンスを期待できるGPUは「RTX 5090」以外にほとんどないという利点があるため、コスパを度外視しても選ぶ理由は一応あるかなと思います。
AI・クリエイティブ用途
比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。
一般的な動画編集等の基準性能としてFP32(単精度浮動小数点演算)の理論演算性能、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」の性能をそれぞれ見ていきたいと思います。
また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー(HotHardware)を参考にしています。「Ryzen 7 9800X3D」と「DDR5-6000 CL28 32GB(16GBx2)」が使用されています。他の条件について気になる方は上述の参考リンクをご覧ください。
理論演算性能(FP32)
FP32(単精度浮動小数点演算)は、理論演算性能を示す一つの指標です。単位はTFLOPS(テラフロップス)を用います。実際のテストから算出するものではなく、シェーダーユニット数(対応の演算器の数)とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。
一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能(データ量が多い処理の場合)によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います(完全に一致する訳ではないので注意)。
GPU名称 | FP32(TFLOPS) |
---|---|
RTX 5090 32GB 1792GB/s | |
RTX 4090 24GB 1008GB/s | |
RX 7900 XTX 24GB 960GB/s | |
RTX 4080 SUPER 16GB 736.3GB/s | |
RX 7900 XT 20GB 800GB/s | |
RTX 4080 16GB 716.8GB/s | |
RX 7900 GRE 16GB 576GB/s | |
RTX 4070 Ti SUPER 16GB 672GB/s | |
RTX 4070 Ti 12GB 504GB/s | |
RX 7800 XT 16GB 624GB/s | |
RTX 4070 SUPER 12GB 504GB/s | |
RX 7700 XT 12GB 432GB/s | |
RTX 3080 10GB 760GB/s | |
RTX 4070 12GB 504GB/s | |
RX 7600 XT 16GB 288GB/s | |
RTX 4060 Ti 8GB / 16GB 288GB/s | |
RTX 3070 Ti 8GB 608GB/s | |
RX 7600 8GB 288GB/s | |
RX 6800 XT 16GB 512GB/s | |
RTX 3070 8GB 448GB/s | |
Arc A770 16GB 16GB 560GB/s | |
RTX 3060 Ti 8GB 448GB/s | |
RX 6800 16GB 512GB/s | |
RTX 4060 8GB 272GB/s | |
Arc B580 12GB 456GB/s | |
RX 6700 XT 12GB 384GB/s | |
RTX 3060 12GB 12GB 360GB/s | |
Arc B570 10GB 380GB/s | |
RX 6600 XT 8GB 256GB/s | |
RTX 3050 8GB 224GB/s | |
RX 6600 8GB 224GB/s |
ゲーム性能ほどではないけど、理論性能コスパも悪い
「RTX 5090」のFP32(単精度浮動小数点演算)の理論性能は驚異の100TFLOPS超えです。凄まじい性能です。そして、やはり価格が高すぎるので、理論性能コスパも当然悪いです。
「RTX 4090」からの向上率は約27%となっており、価格の増加率の25%とほぼ一致するため、コスパは同等レベルです。
ただし、理論性能ではボトルネックなどを考えないため、上述の1440p以下のゲーム性能コスパよりは悪くない立ち位置です。
ゲームにおいても、CPUの性能向上やゲーム側の最適化が進めば理論性能と同じくらいの差に近付いていくと思うので、将来的にはコスパが少し改善される未来が見える指標にはなっているかもしれません。
Blender(GPUレンダリング)
「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。
「Blender 4.3」では、Nvidia Optix、Intel OpenAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX |
Blenderのレンダリングは「RTX 4090」を約36.1%上回る
BlenderのGPUレンダリング性能では「RTX 4090」を約36.1%も上回りました。
シェーダーユニット数が重要な処理なので、非常に強力です。重いレンダリング処理を日常的に大量に行うのであれば、十分に価値を感じられるGPUだと思います。
MLPerf Client(AI性能)
「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。
幅広い環境で使えるONNX(DirectML)をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX |
ONNX(DirectML)でも圧倒的な性能で、RX 7900 XTXの2倍近い性能
Tensorコアに最適化されていない場合のAI処理(ONNX)でもその性能は非常に優れています。「RTX 4090」と比較すると約38.6%上回り、「RX 7900 XTX」と比較すると約92%も上回ります。
本来なら重いAI処理ではVRAM容量もネックとなることが多いですが、32GBを搭載する「RTX 5090」ではそこも懸念する必要がほとんど無いため、AIにおいては価格の高さを考慮しても魅力を感じられると思います。
Blackmagic RAW(デコード速度)
「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するCPU/GPUのベンチマークです。処理にはCPUも使用されますが、基本的にGPUの方が重要度は高いです。
また、圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率(12:1)での8Kおよび4Kのテストでのデコード速度(1秒あたりのフレーム数)を見ていきます。
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX |
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX |
「RTX 4090」を約24%上回るRAWデコード速度
RAWのデコード速度テストでは、「RTX 4090」を約24%上回る性能となっていました。非常に優れたメディアエンジン性能です。
しかし、このような処理は基本CPU処理も同時に多少必要だったり、圧縮率が低くなるとメモリの影響が大きくなったりなどして、ハイエンドGPUほどボトルネックになり易く恩恵を受けにくくなることもありますし、高すぎる価格もネックでコスパも良くはないので、4K以上の解像度でよほど高い圧縮率で常用している訳ではない限りは実用コスパは悪くなると思います。
Procyon Stable Diffusion(AIイラスト生成)
現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。
「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。
ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。
また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT(NVIDIA)、Open VINO(Intel)、ROCm(AMD)といったものがありますが、2024年12月時点ではROCm(AMD)は現状Windowsでのネイティブ動作に対応していません(Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど)。
そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML(ONNX)の3つとなっており、AMD製のGPU(Radeon等)のみ汎用のDirect ML(ONNX)を使わざるを得ず、低めの性能となっている点に注意が必要です。
※しかし、記事執筆時点ではRTX 50(Blackwell)がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。
GPU名称 | スコア |
---|---|
RTX 4090(Tensor RT) | |
RTX 5090(ONNX) | |
RTX 4090(ONNX) | |
RX 7900 XTX(ONNX) |
TensorRT無しでも「RTX 4090」並みの生成速度
Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。
しかし、代わりに汎用のONNX(DirectML)でテストしてみても非常に優れた性能を発揮し、「RTX 4090(TensorRT)」と同等です。
ONNX同士の比較では約27.3%上回る結果となっており、コアの増加率とほぼ一致します。
まとめ
GeForce RTX 5090
- あらゆる面でダントツの圧倒的な処理性能
- 4Kレイトレーシングなどの超高負荷処理でも高いパフォーマンス
- 32GB VRAM(1792GB/s)
- 高負荷時の電力効率が非常に良い
- DLSS 4のマルチフレーム生成対応で、非常に優れた向上率
- 非常に優れたメディアエンジン
- 高すぎる価格(想定価格:約40万円~)
- 消費電力がものすごく多い(TGP:575W)
- アイドル時・ビデオ再生時の消費電力が多い
- 非常に大型(消費電力の割には小さめではあるとは思うけど)
- フルHDでは負荷が軽すぎて、パフォーマンスが制限されることが多い(今後CPUの向上等で改善する可能性は有)
RTX 5090:圧倒的な性能と消費電力と価格のウルトラハイエンドGPU
「RTX 5090」は32GB VRAMを搭載し、「RTX 4090」をも大きく上回る性能を持ち、価格は1,999ドル(国内想定価格:約40万円~)で、TGPは575Wという、あらゆる面で圧倒的なウルトラハイエンドGPUです。
「RTX 4090」と比較すると各コア類が約32.8%多くなっており、他要素がボトルネックにならない前提であれば、大体35%~39%程度の性能向上が見られました。
「RTX 5090」の登場前でも圧倒的な性能だった「RTX 4090」を更に大幅に上回る性能という、とんでもないGPUです。
「RTX 4090」が元々圧倒的な性能なので差が伝わりにくいかもしれませんが、「RTX 4070 Ti SUPER」と比較して4Kゲームで約2倍の性能になっていると聞くと、その凄さがより伝わり易いかもしれません。
しかし、あまりの高性能さのせいで、フルHDゲームでは他の要素が大きなボトルネックとなり性能が伸び悩むという弱点がある点は注意が必要です。1440pですらボトルネックをやや大きめに感じるレベルなど、凄いGPUとなっています。
大体の人のゲーミングモニターはフルHDもしくは1440pであろうことを考慮すると、レイトレーシングを前提として考えるのが性能を活かす上で妥当という感じのGPUとなのかなと思います。
ボトルネック面は今後は改善していく可能性こそあるものの、現状では性能を持て余すケースが多くて扱いも評価も難しいGPUだと思います。
また、ゲーム以外のクリエイティブ用途やAI関連の処理でも当然高性能です。
他要素がボトルネックになりにくい場合のGPUレンダリングやAI性能テストでは、「RTX 4090」をおおよそ36%~39%上回るという圧倒的な性能が見て取れました。
更に恐ろしいのが、登場直後ではBlackwellに対応・最適化していないAI関連ソフトが多いため、Tensorコア込みでの性能を測るテストでの比較がほぼ無い状態でこれだけの差があったことです。
NVIDIAの公表値を信じるなら、「RTX 5090」のTensorコアのAI処理性能は「RTX 4090」の約2.54倍という驚異的な向上率となっているので、更に性能差が広がる可能性があります。
このように、処理性能ではとにかく圧倒的なのが「RTX 5090」ですが、気になるのはやはり消費電力と価格です。
まず消費電力ですが、性能を考えれば575Wという消費電力の多さは仕方ないにしても、電力効率で向上が見られなかったのが残念です。4Kゲームでの効率は非常に優れていたものの、前世代の「RTX 4090」~「RTX 4070 SUPER」とほぼ同水準でした。
考えられる要因としては、製造プロセスが恐らく微細化されておらず「TSMC 5nm」のままだと言われている点があります。
「RTX 5090」はコア数やVRAMが圧倒的すぎるので、例外的な数値になっている可能性は一応考えられるものの、少なくとも前世代からプロセスで大幅な改善には至ってはいないというのは有力になったかなと思います。
とはいえ、電力面で向上が無かったとしても、そもそも前世代の時点で競合よりも明らかに優れた効率を発揮していて、その水準を維持しているのなら悪くはないです。要するに、電力面で向上が無かったのは残念だけど、別に悪い訳ではないです。
次に価格です。国内想定で約40万円~という高額さになっています。この価格はコア数や状況を考えれば良心的ではあるものの、そもそも「RTX 5090」ほどの性能が必要な人はごくわずかであり、ほとんどの人にとってはオーバースペックなので、40万円では選択肢に入らないことがほとんどです。
更に、噂によると40万円という価格すら“その価格で売ったという実績”を作るためのいわゆる”アリバイ価格”だという話があったりもします。
AI性能(Tensorコアの理論性能)に関しては価格を考えても十分に正当化できるレベルの飛躍的な向上があるので、DLSS 4やニューラルレンダリングのことを考えるならRTX 5090の魅力も当然非常に大きいものの、使用感や対応状況がまだ不明瞭なので評価もし辛い点です。
それに、DLSS 4のマルチフレーム生成やニューラルレンダリングによるフレームレート向上は、むしろやや低性能なGPUだからこそ恩恵を感じやすい部分なので、そういう意味ではコアをたくさん積んだ「RTX 5090」を導入するのは損をしているようにも感じられてしまうので、色んな意味で評価が難しいGPUだなと思いました。
といった感じで、本記事は以上になります。ご覧いただきありがとうございました。