Intel「GeForce RTX 5080」のざっくり性能比較・評価です。米国での発売予定日は2025年1月30日ですが、発売前にレビューが解禁されているので、海外レビューを参考に性能をざっくりと確認していきます。
本記事の情報は記事執筆時点(2025年1月30日)のものです。ご覧になっている際には異なる可能性があるため注意してください。
仕様
まずは主要な仕様を表にまとめて載せています。
※価格は2025年1月30日時点での米での希望小売価格です(判明しているもののみ)。
※GPU名のリンクはAmazonのものです。
GPU | シェーダー ユニット数 | メモリタイプ | VRAM速度 VRAM帯域幅 | レイトレ用 ユニット数 | ダイサイズ (おおよそ) | 消費電力 (TGP等) | 希望小売 価格 |
---|---|---|---|---|---|---|---|
RTX 5090 | 21760 | GDDR7 32GB 512bit | 28.0Gbps 1792GB/s | 170 | 750㎟ | 575W | 1,999ドル |
RTX 4090 | 16384 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 128 | 608㎟ | 450W | 1,599ドル |
RTX 5080 | 10752 | GDDR7 16GB 256bit | 30.0Gbps 960GB/s | 84 | 378㎟ | 360W | 999ドル |
RTX 4080 SUPER | 10240 | GDDR6X 16GB 256bit | 23.0Gbps 736.3GB/s | 80 | 380㎟ | 320W | 999ドル |
RTX 4080 | 9728 | GDDR6X 16GB 256bit | 22.4Gbps 716.8GB/s | 76 | 380㎟ | 320W | 1,199ドル →市場廃止 |
RTX 5070 Ti | 8960 | GDDR7 16GB 256bit | 28.0Gbps 896GB/s | 70? | ?㎟ | 300W | 749ドル |
RX 7900 XTX | 6144 | GDDR6 24GB 384bit | 20Gbps 960GB/s | 96 | 36.6㎟*6 + 300㎟ | 355W | 969ドル |
RX 7900 XT | 5376 | GDDR6 20GB 320bit | 20Gbps 800GB/s | 84 | 36.6㎟*6 + 300㎟ | 315W | 799ドル →749ドル? |
RTX 4070 Ti SUPER | 8448 | GDDR6X 16GB 256bit | 21.0Gbps 672GB/s | 66 | 295㎟ | 285W | 799ドル |
RTX 4070 Ti | 7680 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 60 | 295㎟ | 285W | 799ドル →市場廃止 |
RTX 5070 | 6144 | GDDR7 12GB 192bit | 28?Gbps 672GB/s | 48? | ?㎟ | 250W | 549ドル |
RTX 3090 Ti | 10752 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 84 | 628.4㎟ | 450W | 1,499ドル |
RTX 3090 | 10496 | GDDR6X 24GB 384bit | 19.5Gbps 936GB/s | 82 | 628.4㎟ | 350W | 1,299ドル |
RX 7900 GRE | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 36.6㎟*6 + 300㎟ | 260W | 549ドル |
RX 6950 XT | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 519㎟ | 335W | 949ドル |
RX 6900 XT | 5120 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 80 | 519㎟ | 300W | 699ドル |
RTX 3080 Ti | 10240 | GDDR6X 12GB 384bit | 19Gbps 912GB/s | 80 | 628.4㎟ | 350W | 1,099ドル |
RTX 3080 10GB | 8704 | GDDR6X 10GB 320bit | 19Gbps 760GB/s | 68 | 628.4㎟ | 320W | 699ドル |
RTX 4070 SUPER | 7168 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 56 | 295㎟ | 220W | 599ドル |
RTX 4070 | 5888 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 46 | 295㎟ | 200W | 549ドル 前:599ドル |
RX 7800 XT | 3840 | GDDR6 16GB 256bit | 19.5Gbps 624GB/s | 60 | 37.5㎟*4 + 200㎟ | 263W | 499ドル |
RX 6800 XT | 4608 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 72 | 519㎟ | 300W | 599ドル |
RTX 3070 Ti | 6144 | GDDR6X 8GB 256bit | 19Gbps 608GB/s | 48 | 392㎟ | 290W | 599ドル |
RX 6800 | 3840 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 60 | 519㎟ | 250W | 549ドル |
RX 7700 XT | 3456 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 54 | 37.5㎟*4 + 200㎟ | 245W | 419ドル 前:449ドル |
RTX 4060 Ti 8GB | 4352 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 34 | 190㎟ | 160W | 399ドル |
RTX 3070 | 5888 | GDDR6 8GB 256bit | 14Gbps 448GB/s | 46 | 392㎟ | 220W | 499ドル |
RX 6750 XT | 2560 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 40 | 336㎟ | 250W | 419ドル |
RTX 3060 Ti | 4864 | GDDR6 8GB 192bit | 14Gbps 448GB/s | 38 | 392㎟ | 200W | 399ドル |
RX 6700 XT | 2560 | GDDR6 12GB 192bit | 16Gbps 384GB/s | 40 | 336㎟ | 230W | 379ドル |
Arc A770 16GB | 4096 | GDDR6 16GB 256bit | 17.5Gbps 560GB/s | 32 | 406㎟ | 225W | 349ドル |
Arc A770 8GB | 4096 | GDDR6 8GB 256bit | 16Gbps 512GB/s | 32 | 406㎟ | 225W | 329ドル |
Arc B580 | 2560 | GDDR6 12GB 192bit | 19Gbps 456GB/s | 20 | 272㎟ | 190W | 249ドル |
RX 7600 XT | 2048 | GDDR6 16GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 190W | 329ドル |
RTX 4060 | 3072 | GDDR6 8GB 128bit | 17Gbps 272GB/s | 24 | 156㎟ | 115W | 299ドル |
Arc B570 | 2304 | GDDR6 10GB 160bit | 19Gbps 380GB/s | 18 | 272㎟ | 150W | 219ドル |
RX 6650 XT | 2048 | GDDR6 8GB 128bit | 17.5Gbps 288GB/s | 32 | 237㎟ | 180W | 299ドル |
RX 7600 | 2048 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 165W | 269ドル |
RX 6600 XT | 2048 | GDDR6 8GB 128bit | 16Gbps 256GB/s | 32 | 237㎟ | 160W | – |
Arc A750 | 3584 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 28 | 406㎟ | 225W | 289ドル |
RX 6600 | 1792 | GDDR6 8GB 128bit | 14Gbps 224GB/s | 28 | 237㎟ | 132W | 239ドル |
RTX 3060 12GB | 3584 | GDDR6 12GB 192bit | 15Gbps 360GB/s | 28 | 276㎟ | 170W | 329ドル |
RTX 3050 | 2560 | GDDR6 8GB 128bit | 15Gbps 224GB/s | 20 | 276㎟ | 130W | 249ドル |
「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。
RTX 50シリーズでは前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われますが、元々コア性能が上がっても向上を感じられないコア数表記は問題がある部分だったので、表記を切り替える良い機会になったのかなと思います。
GPU | 希望 小売価格 | GPU | VRAM | TGP | |||||
---|---|---|---|---|---|---|---|---|---|
CUDAコア | Tensorコア (AI TOPS) | RTコア (TFLOPS) | クロック 最大(GHz) | 容量/タイプ | バス幅 | 帯域幅(GB/s) | |||
RTX 5090 | 1999ドル | 21760 | 3352 | 318 | 2.41 | 32GB GDDR7 | 512bit | 1792 | 575W |
RTX 4090 | 1599ドル | 16384 | 1321 | 191 | 2.52 | 24GB GDDR6X | 384bit | 1008 | 450W |
RTX 5080 | 999ドル | 10752 | 1801 | 171 | 2.62 | 16GB GDDR7 | 256bit | 960 | 360W |
RTX 4080 SUPER | 999ドル | 10240 | 836 | 121 | 2.55 | 16GB GDDR6X | 256bit | 736 | 320W |
RTX 5070 Ti | 749ドル | 8960 | 1406 | 133 | 2.45 | 16GB GDDR7 | 256bit | 896 | 300W |
RTX 4070 Ti SUPER | 799ドル | 8448 | 780 | 102 | 2.61 | 16GB GDDR6X | 256bit | 672 | 285W |
RTX 4070 SUPER | 599ドル | 7168 | 568 | 93 | 2.48 | 12GB GDDR6X | 192bit | 504 | 220W |
RTX 5070 | 549ドル | 6144 | 988 | 94 | 2.51 | 12GB GDDR7 | 192bit | 672 | 250W |
RTX 4070 | 549ドル | 5888 | 466 | 67 | 2.48 | 12GB GDDR6X 12GB GDDR6 | 192bit | 504 | 200W |
今回見ていくのはNVIDIA「GeForce RTX 5080」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」のハイエンドモデルです。
メーカー希望小売価格は999ドルで、国内想定価格は198,800円~となっています。CUDAコア数は10,752となっており、「RTX 4080 SUPER」から5%の増加に留まっています。その他のコア・ユニット類も基本約5%程度の増加です。そのため、基本性能は先代からわずかしか向上していないかと懸念されているGPUでもあります。
ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。
特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5080」の理論性能(INT8)は 1801 TOPSとなっており、これは「RTX 4080 SUPER」の約2.15倍という凄まじい向上率です。Tensorコア数の向上率は他コアと同様に5%なので、それでこの向上率は凄いです。基盤設計の面で相当な改良が加えられていることがわかります。
そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されました。
AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。
また、性能に直接関係ないですが気を付けたいのは、「RTX 5080」は名前的には「RTX 5090」の一つ下に見えますが、「RTX 5090」の仕様が規格外すぎてコア数およびVRAM容量は半分程度となっており、性能は一段どころではなく圧倒的な差がある点に注意です。
その代わり、価格も半額の999ドル(国内想定価格:198,800円~)で、ベース価格は「RTX 4080 SUPER」と同じになっています。「RTX 5090」は約40万円~ということで価格も規格外なので、コスパ等も意識する上での実質的な最上位モデルはこの「RTX 5080」と言えるかもしれません。
ただ、ベース価格が同じなので、コア数の増加が微量なのは良いとしても、気になるのはVRAMです。「RTX 5080」のVRAM容量は16GBで、「RTX 4080 / 4080 SUPER」から据え置きとなっています。
前世代から価格の割にVRAMが少ないのは懸念点として挙げられていたと思いますが、そこは改善されなかったのは非常に残念です。GDDR6XからGDDR7になり、帯域幅が約736.3GB/sから960GB/sに向上はしているものの、現状はVRAM容量の方が重視される要素だと思いますので、999ドル(約20万円~)という価格で16GBはさすがに気になるところです。
また、後に発売予定の「RTX 4070 Ti」も容量は同じ16GB VRAMとなっているのも懸念点です。そちらの価格は約15万円~想定となっており、約5万円も安いですから、VRAM容量コスパを考えるなら明らかにそちらの方が優れています。
16GB VRAMという仕様自体は非常に強力ですし、ネックになる場面は限られてはいるものの、約20万円もの費用を出して後から調整不能な部分でのネックが残ってしまうのは残念かなと思います。
更に、「RTX 50シリーズ」はプロセス面に関しては前世代からほとんど進化していない可能性が高めなのも懸念点です。
製造プロセスは前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも「5nm EUV」で製造されているという噂です。
そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」で微細化はされていない可能性が高そうです。そのため、主に電力効率(ワットパフォーマンス)面では大きな改善が見られないかもしれないのが懸念点です。
その辺りとも関連性がある部分として、気になるのは消費電力です。
「RTX 5080」のTGPは360Wとなっています。「RTX 4080 SUPER」の320Wを約12.5%上回る消費電力です。
コア類の増加は約5%でクロック増加もわずかなので、カタログスペックだけ見ると電力効率は前世代から良くなっていないように見えます。
ただし、後述の内容を先に一部触れてしまうと、実際にはリファレンス仕様では平均では360Wほど消費せず、ゲーム時には320~330Wに留まっています。そのため、実際には消費電力は思ったより増えておらず、効率も若干良くなっています。
とはいえ、その差は小さいのも事実です。その辺りも含めて詳しい性能はこの後に触れていきたいと思いますが、カタログスペックだけ見れば、AIを活用する面を除いては「RTX 4080 / 4080 SUPER」からさほど変わらない性能のGPUとなりそうです。
DLSS 4、ニューラルレンダリング
「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。
まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。
DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。
また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。
マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。
次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。
従来はグラフィックスAPI内でTensorコア(AI)を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。
これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。
DLSSやFSRといった別機能ではなく、グラフィックスAPI(DirectX)の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR(レイトレーシング)単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。
といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。
ゲーミング性能(ラスタライズ)
ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。
まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能(ラスター性能)を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。
使用されたグラフィックボードは「NVIDIA GeForce RTX 5080 Founders Edition(通称FE版)」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。
フルHD(1920×1080)
フルHD(1920×1080)です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 7900 XTX | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RTX 4070 | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc B570 | |
RX 7600 | |
Arc A770 16GB | |
RX 6600 XT | |
RTX 3060 12GB | |
RX 6600 | |
Arc A580 | |
RTX 3050 8GB |
フルHDは低負荷感が強めで、RTX 4080 SUPERから約6.9%の向上
「RTX 4090 / 5090」ほどではないですが、フルHDのラスタライズは「RTX 5080」にとってもやや低負荷感が強めです。CPUなど他要素がボトルネックになり、フレームレートが伸び悩むゲームが多めの印象なので、やや参考程度の記録かなと思うことを先に触れておきます。
とはいえ、その性能自体は非常に高く、重いゲームが中心かつ最高設定でも平均fpsは200を超えました。「RTX 4080 SUPER」からの向上率は約6.9%と小さめですが、フルHDで不満を感じることはほぼ無いかと思います。
1440p(2560×1440)
WQHD(2560×1440)です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 7900 XTX | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RTX 4070 | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 | |
RTX 3060 12GB | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
1440pでは「RTX 4080 SUPER」を約9.5%上回る。新世代としては微妙な向上率
ここからが本番という感じの1440pですが、「RTX 4080 SUPER」からの向上率は約9.5%です。
性能自体は非常に高性能で、不満を感じる場面は少ないとは思うものの、新世代としては微妙な向上率かと思います。AIやレイトレーシング性能の向上を受けられない用途ではやはり「RTX 4080 SUPER」からの向上率は小さいです。
ただし、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば大きな差が付くであろうことを考えると評価が難しいです。
4K(3840×2160)
「超高解像度の代名詞」という感じの解像度の4K(3840×2160)です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RX 7900 XTX | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 3090 | |
RTX 4070 SUPER | |
RX 7900 GRE | |
RTX 3080 10GB | |
RX 7800 XT | |
RTX 4070 | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
Arc B580 | |
RTX 3060 Ti | |
RX 6700 XT | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 XT | |
RTX 4060 | |
RTX 3060 12GB | |
RX 7600 | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
4Kでは「RTX 4080 SUPER」を約13.1%上回る性能で、1440pから若干差を広げる
「RTX 4080 SUPER」と比較すると、4Kでは1440pから少し差を広げた約13.1%上回る性能でした。VRAMの帯域幅の向上が活きているのかもしれません。
フルHDや1440pよりは魅力を感じられる向上率ではあり、4K前提ならコスパは「RTX 4080 SUPER」と比べて劣ってはいないのかなと思います。とはいえ、やはり新世代GPUとしては小さな向上率という点は変わらない印象です。
とはいえ、やはりDLSS 4のマルチフレーム生成やニューラルレンダリングを活用できればもっと大きな差が付くと思われるので、そこをどう考えるか次第ではあります。
電力関連
消費電力
ゲームプレイ時(高負荷時)の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」で、解像度は「3840×2160(4K)」です。
GPU名称 | 消費電力 |
---|---|
RTX 4060 | |
RTX 3050 8GB | |
RTX 4060 Ti 8GB | |
RX 6600 XT | |
Arc B570 | |
RX 7600 | |
RTX 4060 Ti 16GB | |
RTX 3060 12GB | |
Arc B580 | |
RX 7600 XT | |
RTX 4070 | |
RTX 3060 Ti | |
Arc A580 | |
RX 6700 XT | |
RTX 4070 SUPER | |
RTX 3070 | |
RX 6800 | |
Arc A770 16GB | |
RX 7700 XT | |
RX 7800 XT | |
RX 7900 GRE | |
RTX 4070 Ti | |
RX 6800 XT | |
RTX 4080 SUPER | |
RTX 4070 Ti SUPER | |
RTX 4080 | |
RX 7900 XT | |
RTX 5080 | |
RTX 3080 10GB | |
RX 7900 XTX | |
RTX 3090 | |
RTX 4090 | |
RTX 5090 |
ゲーム時の平均消費電力はTGPよりもやや少なめな325W
ゲーム時の平均消費電力は325Wとなっており、TGPの360Wよりも少なめです。
前世代の「RTX 4080 SUPER」もTGPよりもやや少なめだったので、少し増加してはいますが、TGPの数値のまま受け取るよりは若干印象は良いです。用意する電源や排熱面の関係は大して変わらないと思います。
ワットパフォーマンス
ワットパフォーマンス(電力効率)を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています
環境は消費電力はおよび4Kは「Cyberpunk 2077(Ultra/レイトレ無効)」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 4070 SUPER | |
RTX 4060 Ti 8GB | |
RTX 4070 | |
RTX 4080 SUPER | |
RTX 5080(参考) | |
RTX 4080 | |
RTX 4060 | |
RTX 4060 Ti 16GB | |
RTX 4070 Ti | |
RTX 4070 Ti SUPER | |
RTX 4090 | |
RX 7900 GRE | |
RX 7900 XT | |
RX 7800 XT | |
RX 7900 XTX | |
Arc B570 | |
RX 7700 XT | |
RX 7600 | |
RX 6800 | |
RX 6600 XT | |
Arc B580 | |
RTX 3070 | |
RTX 3060 Ti | |
RX 6800 XT | |
RTX 5090 | |
RX 6700 XT | |
RX 7600 XT | |
RTX 3090 | |
RTX 3080 10GB | |
RTX 3060 12GB | |
RTX 3050 8GB | |
Arc A770 16GB | |
Arc A580 |
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 SUPER | |
RTX 5090 | |
RTX 4090 | |
RX 7900 XTX | |
RTX 4060 Ti 8GB | |
RTX 4070 | |
RX 7900 XT | |
Arc B570 | |
RTX 4070 Ti | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 4070 Ti SUPER | |
Arc B580 | |
RTX 4060 Ti 16GB | |
RTX 4060 | |
RX 7600 | |
RX 7700 XT | |
RTX 3070 | |
RX 6800 | |
RTX 3060 Ti | |
RTX 3090 | |
RX 6800 XT | |
RTX 3080 10GB | |
RX 7600 XT | |
RX 6600 XT | |
Arc A770 16GB | |
RX 6700 XT | |
RTX 3060 12GB | |
RTX 3050 8GB | |
Arc A580 |
ワットパフォーマンスは非常に良く、前世代を超えるけど、劇的な差でもない
ワットパフォーマンスは非常に良いです。4Kゲーム時の効率は前世代のトップ「RTX 4080 SUPER」よりも約10%良い数値となっており、「RTX 5090」よりもやや良いです。
先代から16GBというVRAMの容量こそ変わらなかったものの、GDDR7になり帯域幅も大きく向上したので、そのおかげで4Kでは効率が向上したのかなと思います。
よって、VRAMの帯域が重要な重い処理をする場合では発売時点ではトップのワットパフォーマンスの高効率GPUとなっています。
しかし、4Kにおいても10%という向上率は新世代としては物足りない感が強いです。前世代の例として「RTX 3070」から「RTX 4070」の比較を見てみると、25%~30%程度の向上となっています。
AI性能の向上があるので、そちらの活用次第では更に良い数値が期待はできるのかもしれませんが、GPUの基盤の効率自体は大きな向上に至っていないのは事実かなと思います。
レイトレーシング性能
レイトレーシング性能
リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。
また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。
※従来は各ゲームの幾何平均fpsの値を再計算して載せていたのですが、参考ページで全GPUの詳細fps値が示されなかったため、今回は相対性能を見ていきます。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 4070 Ti | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 XTX | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 XT | |
RX 7900 GRE | |
RTX 4060 Ti 16GB | |
RX 7800 XT | |
RTX 4060 Ti 8GB | |
RTX 3070 | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RTX 4060 | |
RX 6800 | |
Arc A770 16GB | |
RTX 3060 12GB | |
RX 6700 XT | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 6600 | |
RX 7600 |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 4070 Ti | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RX 7900 XTX | |
RTX 3090 | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 XT | |
RX 7900 GRE | |
RTX 4060 Ti 16GB | |
RX 7800 XT | |
RX 6800 XT | |
RX 7700 XT | |
Arc B580 | |
RTX 3070 | |
RX 6800 | |
RTX 4060 Ti 8GB | |
RTX 3060 Ti | |
Arc A770 16GB | |
RTX 4060 | |
RTX 3060 12GB | |
RX 6700 XT | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 7600 | |
RX 6600 | |
RX 6600 XT |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RTX 3090 Ti | |
RTX 3090 | |
RX 7900 XTX | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RX 7900 XT | |
RTX 4070 | |
RX 7900 GRE | |
RTX 3080 10GB | |
RTX 4060 Ti 16GB | |
RX 7800 XT | |
RX 6800 XT | |
RX 7700 XT | |
RX 6800 | |
Arc A770 16GB | |
RTX 3070 | |
RTX 4060 Ti 8GB | |
RTX 3060 Ti | |
RX 6700 XT | |
RTX 3060 12GB | |
RTX 4060 | |
Arc B580 | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 7600 | |
RX 6600 |
ラスタライズよりも若干小さめの向上率。VRAMが少しネックか
レイトレーシング性能を「RTX 4080 SUPER」と比較すると、向上率はフルHDで約5%程度、1440pで約7%程度、4Kで約11%といった感じです。向上率とは控えめですし、ラスタライズよりも差が若干小さくなっています。
レイトレーシングではVRAM容量が重要なので、そこが変わっていなかったのが少し影響していそうな気がします。
レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするので、約20万円~のGPUでそこのボトルネックが若干気になるというのは正直残念感が大きいかなと思います。
ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、最終的な性能としては大きく上回ることにはなると思われるので、やはり考え方次第ではあります。
DLSS
DLSS有効時のゲーム性能
DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要となるため、GeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。
4Kでレイトレーシング有効&最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能(幾何平均)を見ていきます。
※表の「FG」は「Frame Generation(フレーム生成)」の略称です。
GPU名称 | 平均fps |
---|---|
RTX 5090 FGx4 | |
RTX 5080 DLSS Performance / FGx4 | |
RTX 5080 DLSS Quality / FGx4 | |
RTX 5090 FGx3 | |
RTX 5080 FGx4 | |
RTX 4080 SUPER DLSS Performance / FGx2 | |
RTX 5090 FGx2 | |
RTX 5080 FGx3 | |
RTX 4080 SUPER DLSS Quality / FGx2 | |
RTX 5090 DLSS Quality | |
RTX 4090 FGx2 | |
RTX 5080 FGx2 | |
RTX 4090 DLSS Quality | |
RTX 4080 SUPER FGx2 | |
RTX 5090 ネイティブ | |
RTX 5080 DLSS Quality | |
RTX 4080 SUPER DLSS Quality | |
RTX 4090 ネイティブ | |
RX 7900 XTX FSR Quality | |
RTX 5080 ネイティブ | |
RTX 4080 SUPER ネイティブ | |
RX 7900 XTX ネイティブ |
マルチフレーム生成を考慮すれば、「RTX 4080 SUPER」の60%以上のパフォーマンス
やはりマルチフレーム生成の効果は非常に大きいです。
「RTX 4080 SUPER」は少なくとも2025年1月時点ではマルチフレーム生成に対応していないため、追加のフレーム生成は1つのみ(x2)となっているのに対し、「RTX 5080」は1つのフレームに対して最大3つの追加フレーム(x4)なので、圧倒的な差です。
「RTX 5080」と「RTX 4080 SUPER」をどちらも一番高いフレームレートが出せるDLSS設定で比較した場合、「RTX 5080」の方が約64.2%高いパフォーマンスとなります。
フレーム生成と通常のアップスケーリングのDLSSの両方をオンにした場合、若干ギャップが縮まるため、x2とx4で2倍の差にはならないものの、基本的に1.5倍以上の差は出るので、やはり圧倒的な差です。
とはいえ、「RTX 4080 SUPER」の従来のフレーム生成(x2)だけでも非常に優れたパフォーマンスを発揮できるので、そもそもこのレベルのハイエンドGPUで追加のフレーム生成機能が必要なのか、という点は議論が必要かもしれません。
実際、上記の性能は「4Kレイトレーシングの最高設定」というやり過ぎなくらいの高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。
実際の環境ではフルHD~1440pが中心でしょうし、そうなればフレームレートは一段上がることを考えれば「RTX 4080 SUPER」でもDLSSが使える環境ならほとんどの場合で十分な性能が得られます。発売からしばらくは「RTX 4080 SUPER」よりも高価な状態が続くであろうことを考えると実用コスパ的には疑問が残るかもしれません。
とはいえ、マルチフレーム生成の効果は絶大なのは確かであり、フルで活用できれば今までの常識を覆すレベルとなっています。
コストパフォーマンス
上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。各GPUの価格は、記事執筆時点のおおよその市場最安値価格です。ラスタライズとレイトレーシング時の両方を見ていきます。
元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。
1フレームあたりの価格(ラスタライズ)
まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
Arc A580 | ¥24,800 | |
RX 6600 | ¥28,800 | |
Arc A770 16GB | ¥39,800 | |
RX 7600 | ¥36,980 | |
RTX 4060 | ¥41,980 | |
RX 7700 XT | ¥62,980 | |
RX 7800 XT | ¥75,800 | |
RTX 3060 12GB | ¥39,980 | |
Arc B580 | ¥49,800 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 3050 8GB | ¥28,800 | |
Arc B570 | ¥44,980 | |
RTX 3080 10GB | ¥84,800 | |
RTX 4070 | ¥86,800 | |
RX 7900 XT | ¥116,800 | |
RX 6800 XT | ¥89,800 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RTX 4070 SUPER | ¥109,980 | |
RX 7900 XTX | ¥154,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RTX 4080 SUPER | ¥169,800 | |
RTX 5080 | ¥198,800 | |
RTX 4090 | ¥323,800 | |
RTX 5090 | ¥393,800 |
ラスタライズコスパは悪めで「RTX 4080 SUPER」と大差無し
価格が高価なハイエンドGPUは純粋なコスパでは悪い傾向があり、「RTX 5080」も悪いです。
円安が進んでいることも影響し、日本では「RTX 4080 SUPER」よりもやや高価となっていますし、ラスタライズの性能の向上率も10%前後の向上と小さいので、コスパも先代から少し悪化しています。
とはいえ、前世代で人気だった「RTX 4070 Ti SUPER」と比べて劇的に悪いというほどではないですし、「RTX 4090 / 5090」よりは遥かにマシな数値となっています。
DLSS 4のマルチフレーム生成やニューラルレンダリングのことを考えると、4K高設定などでは実用コスパはやや改善されると思いますし、4K高リフレッシュレート前提であれば有力な選択肢の一つにはなるかと思います。
1フレームあたりの価格(レイトレーシング)
次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
Arc A580 | ¥24,800 | |
Arc A770 16GB | ¥39,800 | |
Arc B580 | ¥49,800 | |
RTX 3060 12GB | ¥39,980 | |
Arc B570 | ¥44,980 | |
RTX 4060 | ¥41,980 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RX 7700 XT | ¥62,980 | |
RTX 3050 8GB | ¥28,800 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RTX 4080 SUPER | ¥169,800 | |
RX 7900 XT | ¥116,800 | |
RX 7600 XT | ¥50,800 | |
RTX 5080 | ¥198,800 | |
RX 7900 XTX | ¥154,800 | |
RX 7600 | ¥36,980 | |
RTX 5090 | ¥393,800 | |
RTX 4090 | ¥323,800 |
レイトレーシングでもコスパは悪く、「RTX 4080 SUPER」を少し下回るが、実用性能は高い
価格の高さが主な原因なので、コスパに関してはレイトレーシングでも悪いです。
しかし、レイトレーシングはマルチフレーム生成やニューラルレンダリングが大きく貢献しそうなので、それらを活用する前提なら実用性能は他のハイエンドGPUと比べても非常に高いです。そこも考慮すれば、一気に地位を上げることになります。
とはいえ、「RTX 4080 SUPER」の性能でも従来のフレーム生成(x2)は利用でき、それがあれば多くのゲームで快適な性能自体は手に入るので、そのあたりも含めての評価は難しいところです。
AI・クリエイティブ用途
比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。
一般的な動画編集等の基準性能としてFP32(単精度浮動小数点演算)の理論演算性能、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」の性能をそれぞれ見ていきたいと思います。
また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー(HotHardware)を参考にしています。「Ryzen 7 9800X3D」と「DDR5-6000 CL28 32GB(16GBx2)」が使用されています。他の条件について気になる方は上述の参考リンクをご覧ください。
理論演算性能(FP32)
FP32(単精度浮動小数点演算)は、理論演算性能を示す一つの指標です。単位はTFLOPS(テラフロップス)を用います。実際のテストから算出するものではなく、シェーダーユニット数(対応の演算器の数)とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。
一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能(データ量が多い処理の場合)によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います(完全に一致する訳ではないので注意)。
GPU名称 | FP32(TFLOPS) |
---|---|
RTX 5090 32GB 1792GB/s | |
RTX 4090 24GB 1008GB/s | |
RX 7900 XTX 24GB 960GB/s | |
RTX 5080 16GB 960GB/s | |
RTX 4080 SUPER 16GB 736.3GB/s | |
RX 7900 XT 20GB 800GB/s | |
RTX 4080 16GB 716.8GB/s | |
RX 7900 GRE 16GB 576GB/s | |
RTX 4070 Ti SUPER 16GB 672GB/s | |
RTX 4070 Ti 12GB 504GB/s | |
RX 7800 XT 16GB 624GB/s | |
RTX 4070 SUPER 12GB 504GB/s | |
RX 7700 XT 12GB 432GB/s | |
RTX 3080 10GB 760GB/s | |
RTX 4070 12GB 504GB/s | |
RX 7600 XT 16GB 288GB/s | |
RTX 4060 Ti 8GB / 16GB 288GB/s | |
RTX 3070 Ti 8GB 608GB/s | |
RX 7600 8GB 288GB/s | |
RX 6800 XT 16GB 512GB/s | |
RTX 3070 8GB 448GB/s | |
Arc A770 16GB 16GB 560GB/s | |
RTX 3060 Ti 8GB 448GB/s | |
RX 6800 16GB 512GB/s | |
RTX 4060 8GB 272GB/s | |
Arc B580 12GB 456GB/s | |
RX 6700 XT 12GB 384GB/s | |
RTX 3060 12GB 12GB 360GB/s | |
Arc B570 10GB 380GB/s | |
RX 6600 XT 8GB 256GB/s | |
RTX 3050 8GB 224GB/s | |
RX 6600 8GB 224GB/s |
理論性能コスパも悪い
「RTX 5080」のFP32(単精度浮動小数点演算)の理論性能は約56.28TFLOPSと非常に優れていますが、価格が非常に高価なのでコスパは悪いです。
VRAM容量も価格の割には少ないので、理論性能コスパ的には「RTX 5080」はかなり弱めです。
Blender(GPUレンダリング)
「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。
「Blender 4.3」では、Nvidia Optix、Intel OpenAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 | |
RX 7900 XTX |
Blenderのレンダリングは「RTX 4080 SUPER」とあまり変わらず
BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、「RTX 4080 SUPER」とあまり変わりません。わずか約6.3%上回る性能でした。
とはいえ、性能自体は非常に高性能で、高負荷時の効率も非常に優れているので、重いレンダリング処理を日常的に大量に行うのであれば、魅力は十分あると思います。
MLPerf Client(AI性能)
「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。
幅広い環境で使えるONNX(DirectML)をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 | |
RX 7900 XTX |
AIは汎用のONNX(DirectML)では「RTX 4080 SUPER」を約15%上回る
AIでは大きめの向上率が見られました。Tensorコアに最適化されていない場合のAI処理(ONNX)でも、「RTX 4080 SUPER」を約15%上回る性能でした。
マルチフレーム生成など、機能面での差がない項目としては、ここまでで一番大きな差です。
コア数の増加率(約5%)よりもやや大きめの向上率となっており、AI性能の効率が上がっていることは確かに感じられました。ただし、劇的な差かというとそうでもないです。
Blackmagic RAW(デコード速度)
「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するCPU/GPUのベンチマークです。処理にはCPUも使用されますが、基本的にGPUの方が重要度は高いです。
また、圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率(12:1)での8Kおよび4Kのテストでのデコード速度(1秒あたりのフレーム数)を見ていきます。
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 5080 | |
RTX 4090 | |
RTX 4080 | |
RX 7900 XTX |
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 5080 | |
RTX 4090 | |
RTX 4080 | |
RX 7900 XTX |
「RTX 4080」を約20%上回るRAWデコード速度
RAWのデコード速度テストでは、「RTX 4080」を20%ほど上回る性能となっていました。大きめの向上率です。
非常に優れたメディアエンジン性能で、「RTX 5090」との差も約10%台に留まっています。メディア関連の処理はGPU以外がボトルネックになり易いものも多く、特にハイエンドGPUでは他要素がネックになるケースも多めの印象なので、その影響が出ているかもしれません。
ハイエンドなメディア処理性能を求める上でコスパも多少意識するなら強力な選択肢の一つになると思います。ただし、特にクリエイティブ用途でのコスパを考える場合には価格の割には少ないVRAM容量にも注意が必要です。
Procyon Stable Diffusion(AIイラスト生成)
現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。
「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。
ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。
また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT(NVIDIA)、Open VINO(Intel)、ROCm(AMD)といったものがありますが、2024年12月時点ではROCm(AMD)は現状Windowsでのネイティブ動作に対応していません(Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど)。
そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML(ONNX)の3つとなっており、AMD製のGPU(Radeon等)のみ汎用のDirect ML(ONNX)を使わざるを得ず、低めの性能となっている点に注意が必要です。
※しかし、記事執筆時点ではRTX 50(Blackwell)がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。
GPU名称 | スコア |
---|---|
RTX 4090(Tensor RT) | |
RTX 5090(ONNX) | |
RTX 4090(ONNX) | |
RTX 4080(Tensor RT) | |
RTX 5080(ONNX) | |
RTX 4080(ONNX) | |
RX 7900 XTX(ONNX) |
TensorRTでなくても優れた性能で、「RTX 4080」よりも約16.8%高速
Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。
しかし、代わりに汎用のONNX(DirectML)での結果を確認してみても、非常に優れた性能を発揮することがわかります。ONNX同士の比較では「RTX 4080」よりも約16.8%高速で、「RX 7900 XTX」の約2倍の性能です。
先代からの向上率はコア数の増加率(約5%)よりもやや大きめの向上率となっており、やはりAI性能効率の強化を感じることができました。しかも、TensorRT無しでも高い向上率が感じられたのは素晴らしいです。
消費電力の増加率はそこまでには至っていないので、AIに関してのワットパフォーマンスはゲームよりもやや高くなることも期待できます。
ただし、やはり劇的な向上率かと言うとそうでもないですし、VRAM容量が重要な画像生成AIでは16GBでも余裕があるというほどでもありませんので、既存の「RTX 4070 Ti SUPER」やこれから出てくるであろう「RTX 5070 Ti」と比較して実用コスパでどうなのかという話にはなると思います。
まとめ
GeForce RTX 5080
- 「RTX 4080 SUPER」を少し上回る非常に優れた処理性能(AI関連はやや大きめの性能向上率)
- 希望小売価格は「RTX 4080 SUPER」と同じ(ただし、日本では円安で価格上昇)
- 非常に優れたワットパフォーマンス(特に重い処理)
- DLSS 4のマルチフレーム生成対応
- 非常に優れたメディアエンジン
- 非常に高価(想定価格:約20万円~)
- 価格の割には少ない16GB VRAM
- 消費電力が多い(TGP:360W)
- 「RTX 4080 SUPER」からの性能向上率は小さめ(マルチフレーム生成やAI面を除く)
- サイズが大型
- 非常に高性能なので、フルHDなど低負荷な環境ではパフォーマンスが制限されるケースがある
RTX 5080:AIの性能&新機能を考慮しなければ「RTX 4080 SUPER」から少しの向上
「RTX 5080」は「RTX 4080 SUPER」を上回る性能を発揮するハイエンドGPUです。1440pレイトレなどの重い処理でも十分実用的に運用できる高性能GPUです。
最近はAIの注目度が高いためハイエンドGPUは非常に需要があるにも関わらず、希望小売価格は「RTX 4080 SUPER」と同じ999ドルというのも良心的で嬉しいです。日本においてはRTX 40登場当時よりも円安が進行しているためにやや高価ですが、ベース価格が据え置きというのはかなり頑張った価格設定だと思います。
ただし、「RTX 4080 SUPER」と比較したコア増加率はわずか5%ほどで、VRAM容量も16GBのままなのは残念です。
DLSSを使用しない場合のゲーム性能を「RTX 4080 SUPER」と比較すると、おおよそ10%前後程度の向上に留まっています(設定やゲームタイトルによって多少前後)。基本性能は先代から小さな向上です。
製造プロセスがほぼ変わらないようなので、ある程度想定はできましたが、基本性能の向上は思ったよりも小さめだったのは残念でした。
そして、特にVRAM容量が16GBのままなのが非常に残念です。16GBという容量だけ見れば強力なのは確かですが、約20万円~のGPUとしては少ないです。
最近注目の用途であるレイトレーシングやAIやメタバースなどではVRAM容量が重要なことが多いので、今はハイエンド用途だと16GBでも余裕がある容量ではない時代になっています。VRAMはいくらあっても嬉しいレベルです。
20万円のGPUを購入してVRAMという変更ができない部分で不満を感じるのは渋いですから、もうちょっと頑張って欲しかったというのが本音です。
微妙な点を先に挙げてしまいましたが、前世代からAI性能が大きく強化されている点は魅力です。NVIDIA公表のTensorコアの理論性能では「RTX 4080 SUPER」を約2.15倍も上回っています。実際、AI関連処理では高めの向上率を記録しました。
特に、ゲームではDLSS 4(マルチフレーム生成含む)を最大限活用すれば、「RTX 4080 SUPER」を60%以上上回るフレームレートを出すことも可能であり、その場合には4Kレイトレすら十分実用的です。
ONNX(DirectML)を利用するゲーム以外の汎用的なAI処理においても、TensorRT無しで「RTX 4080 SUPER」を15%ほど上回る性能を発揮することが確認できました。
Tensorコアに対しての最適化が進めば更に高い性能となることも考えられますし、AI面では価格上昇を考慮しても価値を感じることはできるレベルにはなっているのではないかと思います。
また、電力面も優れています。TGPの360Wという数字を見たときは心配の方が大きかったですが、実際にはそこまで多くはなく、ゲーム時平均は320W~330Wでした(リファレンス仕様では)。
前世代の「RTX 4080 / 4080 SUPER」もTGP(320W)よりも消費電力がやや少ない傾向でしたので、先代と比べるとやはり増加はしているものの、思ったほどはネックではなく、電源や排熱面での扱いもほぼ同じで済みます。
ワットパフォーマンスでは、4Kゲーム(ラスタライズ)時で前世代トップの「RTX 4080 SUPER」よりも1割ほど良い数値を記録しました。2025年1月時点では高負荷な処理ではトップの効率のGPUに君臨しました。
…という感じで現状で優秀なのは間違いないですが、前世代のとき(RTX 30 → RTX 40)のときはDLSS無しのゲームでも30%近い向上が見られたりもしたので、それを考えると正直物足りない感はあったりもします。
ただし、一応擁護をしてみると、DLSS 4のマルチフレーム生成や、その他のAIで効率化できる処理なら更に差を付けることが出来るはずではあります。
そんな感じで、AI面をどう取り入れるかによって性能が大きく変わるので評価はし辛いですが、AIをフル活用する前提なら、「RTX 4080 SUPER」をやや大きめに上回りますし、DLSS 4のマルチフレーム生成まで考慮すれば圧倒的に上回るものの、AIをそこまで活用しないなら「RTX 4080 SUPER」からの向上率は小さいです。
「RTX 4080 SUPER」でも基本性能は十分に高く、フレーム生成も従来のものがあれば大体のゲームでは快適でしたから、実用性の差は現状ではほとんどの人にとって感じにくいのGPUではある思います。
といった感じで、本記事は以上になります。ご覧いただきありがとうございました。