「GeForce RTX 5080」ざっくり評価【性能比較】

Intel「GeForce RTX 5080」のざっくり性能比較・評価です。米国での発売予定日は2025年1月30日ですが、発売前にレビューが解禁されているので、海外レビューを参考に性能をざっくりと確認していきます。

注意

本記事の情報は記事執筆時点(2025年1月30日)のものです。ご覧になっている際には異なる可能性があるため注意してください。

仕様

まずは主要な仕様を表にまとめて載せています。

簡易比較表

※価格は2025年1月30日時点での米での希望小売価格です(判明しているもののみ)。
※GPU名のリンクはAmazonのものです。

GPUシェーダー
ユニット数
メモリタイプVRAM速度
VRAM帯域幅
レイトレ用
ユニット数
ダイサイズ
(おおよそ)
消費電力
(TGP等)
希望小売

RTX 509021760GDDR7
32GB 512bit
28.0Gbps
1792GB/s
170750㎟575W1,999ドル
RTX 409016384GDDR6X
24GB 384bit
21.0Gbps
1008GB/s
128608㎟450W1,599ドル
RTX 508010752GDDR7
16GB 256bit
30.0Gbps
960GB/s
84378㎟360W999ドル
RTX 4080 SUPER10240GDDR6X
16GB 256bit
23.0Gbps
736.3GB/s
80380㎟320W999ドル
RTX 40809728GDDR6X
16GB 256bit
22.4Gbps
716.8GB/s
76380㎟320W1,199ドル
→市場廃止
RTX 5070 Ti8960GDDR7
16GB 256bit
28.0Gbps
896GB/s
70??㎟300W749ドル
RX 7900 XTX6144GDDR6
24GB 384bit
20Gbps
960GB/s
9636.6㎟*6 +
300㎟
355W969ドル
RX 7900 XT5376GDDR6
20GB 320bit
20Gbps
800GB/s
8436.6㎟*6 +
300㎟
315W799ドル
→749ドル?
RTX 4070 Ti SUPER8448GDDR6X
16GB 256bit
21.0Gbps
672GB/s
66295㎟285W799ドル
RTX 4070 Ti7680GDDR6X
12GB 192bit
21.0Gbps
504GB/s
60295㎟285W799ドル
→市場廃止
RTX 50706144GDDR7
12GB 192bit
28?Gbps
672GB/s
48??㎟250W549ドル
RTX 3090 Ti10752GDDR6X
24GB 384bit
21.0Gbps
1008GB/s
84628.4㎟450W1,499ドル
RTX 309010496GDDR6X
24GB 384bit
19.5Gbps
936GB/s
82628.4㎟350W1,299ドル
RX 7900 GRE5120GDDR6
16GB 256bit
18Gbps
576GB/s
8036.6㎟*6 +
300㎟
260W549ドル
RX 6950 XT5120GDDR6
16GB 256bit
18Gbps
576GB/s
80519㎟335W949ドル
RX 6900 XT5120GDDR6
16GB 256bit
16Gbps
512GB/s
80519㎟300W699ドル
RTX 3080 Ti10240GDDR6X
12GB 384bit
19Gbps
912GB/s
80628.4㎟350W1,099ドル
RTX 3080 10GB8704GDDR6X
10GB 320bit
19Gbps
760GB/s
68628.4㎟320W699ドル
RTX 4070 SUPER7168GDDR6X
12GB 192bit
21.0Gbps
504GB/s
56295㎟220W599ドル
RTX 40705888GDDR6X
12GB 192bit
21.0Gbps
504GB/s
46295㎟200W549ドル
前:599ドル
RX 7800 XT3840GDDR6
16GB 256bit
19.5Gbps
624GB/s
6037.5㎟*4 +
200㎟
263W499ドル
RX 6800 XT4608GDDR6
16GB 256bit
16Gbps
512GB/s
72519㎟300W599ドル
RTX 3070 Ti6144GDDR6X
8GB 256bit
19Gbps
608GB/s
48392㎟290W599ドル
RX 68003840GDDR6
16GB 256bit
16Gbps
512GB/s
60519㎟250W549ドル
RX 7700 XT3456GDDR6
12GB 192bit
18Gbps
432GB/s
5437.5㎟*4 +
200㎟
245W419ドル
前:449ドル
RTX 4060 Ti 8GB4352GDDR6
8GB 128bit
18Gbps
288GB/s
34190㎟160W399ドル
RTX 30705888GDDR6
8GB 256bit
14Gbps
448GB/s
46392㎟220W499ドル
RX 6750 XT2560GDDR6
12GB 192bit
18Gbps
432GB/s
40336㎟250W419ドル
RTX 3060 Ti4864GDDR6
8GB 192bit
14Gbps
448GB/s
38392㎟200W399ドル
RX 6700 XT2560GDDR6
12GB 192bit
16Gbps
384GB/s
40336㎟230W379ドル
Arc A770 16GB4096GDDR6
16GB 256bit
17.5Gbps
560GB/s
32406㎟225W349ドル
Arc A770 8GB4096GDDR6
8GB 256bit
16Gbps
512GB/s
32406㎟225W329ドル
Arc B5802560GDDR6
12GB 192bit
19Gbps
456GB/s
20272㎟190W249ドル
RX 7600 XT2048GDDR6
16GB 128bit
18Gbps
288GB/s
32204㎟190W329ドル
RTX 40603072GDDR6
8GB 128bit
17Gbps
272GB/s
24156㎟115W299ドル
Arc B5702304GDDR6
10GB 160bit
19Gbps
380GB/s
18272㎟150W219ドル
RX 6650 XT2048GDDR6
8GB 128bit
17.5Gbps
288GB/s
32237㎟180W299ドル
RX 76002048GDDR6
8GB 128bit
18Gbps
288GB/s
32204㎟165W269ドル
RX 6600 XT2048GDDR6
8GB 128bit
16Gbps
256GB/s
32237㎟160W
Arc A7503584GDDR6
16GB 256bit
16Gbps
512GB/s
28406㎟225W289ドル
RX 66001792GDDR6
8GB 128bit
14Gbps
224GB/s
28237㎟132W239ドル
RTX 3060 12GB3584GDDR6
12GB 192bit
15Gbps
360GB/s
28276㎟170W329ドル
RTX 30502560GDDR6
8GB 128bit
15Gbps
224GB/s
20276㎟130W249ドル

前世代との比較

「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。

RTX 50シリーズでは前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われますが、元々コア性能が上がっても向上を感じられないコア数表記は問題がある部分だったので、表記を切り替える良い機会になったのかなと思います。

GPU希望
小売価格
GPUVRAMTGP
CUDAコアTensorコア
(AI TOPS)
RTコア
(TFLOPS)
クロック
最大(GHz)
容量/タイプバス幅帯域幅(GB/s)
RTX 50901999ドル2176033523182.4132GB GDDR7512bit1792575W
RTX 40901599ドル1638413211912.5224GB GDDR6X384bit1008450W
RTX 5080999ドル1075218011712.6216GB GDDR7256bit960360W
RTX 4080 SUPER999ドル102408361212.5516GB GDDR6X256bit736320W
RTX 5070 Ti749ドル896014061332.4516GB GDDR7256bit896300W
RTX 4070 Ti SUPER799ドル84487801022.6116GB GDDR6X256bit672285W
RTX 4070 SUPER599ドル7168568932.4812GB GDDR6X192bit504220W
RTX 5070549ドル6144988942.5112GB GDDR7192bit672250W
RTX 4070549ドル5888466672.4812GB GDDR6X
12GB GDDR6
192bit504200W

今回見ていくのはNVIDIA「GeForce RTX 5080」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」のハイエンドモデルです。

メーカー希望小売価格は999ドルで、国内想定価格は198,800円~となっています。CUDAコア数は10,752となっており、「RTX 4080 SUPER」から5%の増加に留まっています。その他のコア・ユニット類も基本約5%程度の増加です。そのため、基本性能は先代からわずかしか向上していないかと懸念されているGPUでもあります。

ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。

特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5080」の理論性能(INT8)は 1801 TOPSとなっており、これは「RTX 4080 SUPER」の約2.15倍という凄まじい向上率です。Tensorコア数の向上率は他コアと同様に5%なので、それでこの向上率は凄いです。基盤設計の面で相当な改良が加えられていることがわかります。

そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成ニューラルレンダリングなど、AIをフル活用する技術も追加されました。

AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。

また、性能に直接関係ないですが気を付けたいのは、「RTX 5080」は名前的には「RTX 5090」の一つ下に見えますが、「RTX 5090」の仕様が規格外すぎてコア数およびVRAM容量は半分程度となっており、性能は一段どころではなく圧倒的な差がある点に注意です。

その代わり、価格も半額の999ドル(国内想定価格:198,800円~)で、ベース価格は「RTX 4080 SUPER」と同じになっています。「RTX 5090」は約40万円~ということで価格も規格外なので、コスパ等も意識する上での実質的な最上位モデルはこの「RTX 5080」と言えるかもしれません。

ただ、ベース価格が同じなので、コア数の増加が微量なのは良いとしても、気になるのはVRAMです。「RTX 5080」のVRAM容量は16GBで、「RTX 4080 / 4080 SUPER」から据え置きとなっています。

前世代から価格の割にVRAMが少ないのは懸念点として挙げられていたと思いますが、そこは改善されなかったのは非常に残念です。GDDR6XからGDDR7になり、帯域幅が約736.3GB/sから960GB/sに向上はしているものの、現状はVRAM容量の方が重視される要素だと思いますので、999ドル(約20万円~)という価格で16GBはさすがに気になるところです。

また、後に発売予定の「RTX 4070 Ti」も容量は同じ16GB VRAMとなっているのも懸念点です。そちらの価格は約15万円~想定となっており、約5万円も安いですから、VRAM容量コスパを考えるなら明らかにそちらの方が優れています。

16GB VRAMという仕様自体は非常に強力ですし、ネックになる場面は限られてはいるものの、約20万円もの費用を出して後から調整不能な部分でのネックが残ってしまうのは残念かなと思います。

更に、「RTX 50シリーズ」はプロセス面に関しては前世代からほとんど進化していない可能性が高めなのも懸念点です。

製造プロセスは前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも「5nm EUV」で製造されているという噂です。

そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」で微細化はされていない可能性が高そうです。そのため、主に電力効率(ワットパフォーマンス)面では大きな改善が見られないかもしれないのが懸念点です。

その辺りとも関連性がある部分として、気になるのは消費電力です。

「RTX 5080」のTGPは360Wとなっています。「RTX 4080 SUPER」の320Wを約12.5%上回る消費電力です。

コア類の増加は約5%でクロック増加もわずかなので、カタログスペックだけ見ると電力効率は前世代から良くなっていないように見えます。

ただし、後述の内容を先に一部触れてしまうと、実際にはリファレンス仕様では平均では360Wほど消費せず、ゲーム時には320~330Wに留まっています。そのため、実際には消費電力は思ったより増えておらず、効率も若干良くなっています

とはいえ、その差は小さいのも事実です。その辺りも含めて詳しい性能はこの後に触れていきたいと思いますが、カタログスペックだけ見れば、AIを活用する面を除いては「RTX 4080 / 4080 SUPER」からさほど変わらない性能のGPUとなりそうです。

DLSS 4、ニューラルレンダリング

「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。

まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。

DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。

また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。

マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。

次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。

従来はグラフィックスAPI内でTensorコア(AI)を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。

これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。

DLSSやFSRといった別機能ではなく、グラフィックスAPI(DirectX)の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR(レイトレーシング)単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。

といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。

ゲーミング性能(ラスタライズ)

ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。

まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能(ラスター性能)を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。

使用されたグラフィックボードは「NVIDIA GeForce RTX 5080 Founders Edition(通称FE版)」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。


フルHD(1920×1080)

フルHD(1920×1080)です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。

平均FPS(1080p 最高設定)
GPU名称平均FPS
RTX 5090
251.1
RTX 4090
225.0
RTX 5080
203.5
RTX 4080 SUPER
190.3
RTX 4080
187.8
RX 7900 XTX
184.1
RTX 4070 Ti SUPER
166.8
RX 7900 XT
164.3
RTX 4070 Ti
160.0
RTX 4070 SUPER
148.0
RTX 3090
141.9
RX 7900 GRE
141.3
RTX 4070
129.8
RX 7800 XT
128.3
RTX 3080 10GB
127.2
RX 6800 XT
125.8
RX 7700 XT
110.6
RTX 3070
100.8
RTX 4060 Ti 16GB
99.9
RTX 4060 Ti 8GB
98.7
RX 6700 XT
88.7
RTX 3060 Ti
88.2
Arc B580
82.6
RX 7600 XT
78.9
RTX 4060
78.6
Arc B570
72.9
RX 7600
72.1
Arc A770 16GB
71.8
RX 6600 XT
68.8
RTX 3060 12GB
67.4
RX 6600
59.0
Arc A580
58.5
RTX 3050 8GB
48.3
参考:TechPowerUp

フルHDは低負荷感が強めで、RTX 4080 SUPERから約6.9%の向上

「RTX 4090 / 5090」ほどではないですが、フルHDのラスタライズは「RTX 5080」にとってもやや低負荷感が強めです。CPUなど他要素がボトルネックになり、フレームレートが伸び悩むゲームが多めの印象なので、やや参考程度の記録かなと思うことを先に触れておきます。

とはいえ、その性能自体は非常に高く、重いゲームが中心かつ最高設定でも平均fpsは200を超えました。「RTX 4080 SUPER」からの向上率は約6.9%と小さめですが、フルHDで不満を感じることはほぼ無いかと思います。


1440p(2560×1440)

WQHD(2560×1440)です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。

平均FPS(1440p 最高設定)
GPU名称平均FPS
RTX 5090
216.8
RTX 4090
179.1
RTX 5080
159.6
RTX 4080 SUPER
145.8
RTX 4080
143.4
RX 7900 XTX
142.9
RTX 4070 Ti SUPER
125.3
RX 7900 XT
123.8
RTX 4070 Ti
117.7
RTX 4070 SUPER
108.4
RTX 3090
107.6
RX 7900 GRE
104.5
RX 7800 XT
95.2
RTX 3080 10GB
95.3
RX 6800 XT
93.3
RTX 4070
94.0
RX 7700 XT
80.7
RTX 3070
73.8
RTX 4060 Ti 16GB
71.0
RTX 4060 Ti 8GB
70.4
RX 6700 XT
64.3
RTX 3060 Ti
64.3
Arc B580
61.4
RX 7600 XT
55.7
RTX 4060
55.5
Arc A770 16GB
54.6
Arc B570
53.4
RX 7600
49.7
RTX 3060 12GB
48.6
RX 6600 XT
47.7
Arc A580
43.4
RX 6600
40.8
RTX 3050 8GB
34.6
参考:TechPowerUp

1440pでは「RTX 4080 SUPER」を約9.5%上回る。新世代としては微妙な向上率

ここからが本番という感じの1440pですが、「RTX 4080 SUPER」からの向上率は約9.5%です。

性能自体は非常に高性能で、不満を感じる場面は少ないとは思うものの、新世代としては微妙な向上率かと思います。AIやレイトレーシング性能の向上を受けられない用途ではやはり「RTX 4080 SUPER」からの向上率は小さいです。

ただし、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば大きな差が付くであろうことを考えると評価が難しいです。


4K(3840×2160)

「超高解像度の代名詞」という感じの解像度の4K(3840×2160)です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。

平均FPS(4K 最高設定)
GPU名称平均FPS
RTX 5090
147.1
RTX 4090
109.2
RTX 5080
96.7
RTX 4080 SUPER
85.5
RX 7900 XTX
84.7
RTX 4080
84.1
RTX 4070 Ti SUPER
72.3
RX 7900 XT
71.5
RTX 4070 Ti
66.3
RTX 3090
64.5
RTX 4070 SUPER
60.9
RX 7900 GRE
59.3
RTX 3080 10GB
55.9
RX 7800 XT
54.5
RTX 4070
52.7
RX 6800 XT
53.1
RX 7700 XT
44.6
RTX 3070
42.0
RTX 4060 Ti 16GB
38.6
RTX 4060 Ti 8GB
38.5
Arc B580
36.2
RTX 3060 Ti
36.0
RX 6700 XT
35.6
Arc A770 16GB
31.8
Arc B570
30.9
RX 7600 XT
30.3
RTX 4060
29.7
RTX 3060 12GB
27.4
RX 7600
24.7
RX 6600 XT
24.7
Arc A580
24.6
RX 6600
20.7
RTX 3050 8GB
18.7
参考:TechPowerUp

4Kでは「RTX 4080 SUPER」を約13.1%上回る性能で、1440pから若干差を広げる

「RTX 4080 SUPER」と比較すると、4Kでは1440pから少し差を広げた約13.1%上回る性能でした。VRAMの帯域幅の向上が活きているのかもしれません。

フルHDや1440pよりは魅力を感じられる向上率ではあり、4K前提ならコスパは「RTX 4080 SUPER」と比べて劣ってはいないのかなと思います。とはいえ、やはり新世代GPUとしては小さな向上率という点は変わらない印象です。

とはいえ、やはりDLSS 4のマルチフレーム生成やニューラルレンダリングを活用できればもっと大きな差が付くと思われるので、そこをどう考えるか次第ではあります。

電力関連

消費電力

ゲームプレイ時(高負荷時)の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」で、解像度は「3840×2160(4K)」です。

GPU平均消費電力(ゲーミング)
GPU名称消費電力
RTX 4060
128
RTX 3050 8GB
132
RTX 4060 Ti 8GB
152
RX 6600 XT
152
Arc B570
154
RX 7600
154
RTX 4060 Ti 16GB
165
RTX 3060 12GB
183
Arc B580
185
RX 7600 XT
198
RTX 4070
201
RTX 3060 Ti
205
Arc A580
209
RX 6700 XT
217
RTX 4070 SUPER
218
RTX 3070
232
RX 6800
233
Arc A770 16GB
235
RX 7700 XT
236
RX 7800 XT
250
RX 7900 GRE
265
RTX 4070 Ti
277
RX 6800 XT
294
RTX 4080 SUPER
302
RTX 4070 Ti SUPER
304
RTX 4080
304
RX 7900 XT
312
RTX 5080
325
RTX 3080 10GB
336
RX 7900 XTX
360
RTX 3090
368
RTX 4090
411
RTX 5090
587
参考:TechPowerUp

ゲーム時の平均消費電力はTGPよりもやや少なめな325W

ゲーム時の平均消費電力は325Wとなっており、TGPの360Wよりも少なめです。

前世代の「RTX 4080 SUPER」もTGPよりもやや少なめだったので、少し増加してはいますが、TGPの数値のまま受け取るよりは若干印象は良いです。用意する電源や排熱面の関係は大して変わらないと思います。

ワットパフォーマンス

ワットパフォーマンス(電力効率)を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています

環境は消費電力はおよび4Kは「Cyberpunk 2077(Ultra/レイトレ無効)」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。

ワットパフォーマンス(1080p/25ゲーム平均)
GPU名称1フレームあたりの消費電力
RTX 4070 SUPER
1.47
RTX 4060 Ti 8GB
1.54
RTX 4070
1.55
RTX 4080 SUPER
1.59
RTX 5080(参考)
1.60
RTX 4080
1.62
RTX 4060
1.63
RTX 4060 Ti 16GB
1.65
RTX 4070 Ti
1.73
RTX 4070 Ti SUPER
1.82
RTX 4090
1.83
RX 7900 GRE
1.88
RX 7900 XT
1.90
RX 7800 XT
1.95
RX 7900 XTX
1.96
Arc B570
2.13
RX 7700 XT
2.13
RX 7600
2.14
RX 6800
2.19
RX 6600 XT
2.21
Arc B580
2.24
RTX 3070
2.30
RTX 3060 Ti
2.32
RX 6800 XT
2.34
RTX 5090
2.34
RX 6700 XT
2.44
RX 7600 XT
2.51
RTX 3090
2.60
RTX 3080 10GB
2.64
RTX 3060 12GB
2.67
RTX 3050 8GB
2.73
Arc A770 16GB
3.27
Arc A580
3.57
参考:TechPowerUp
ワットパフォーマンス(4K/Cyberpunk 2077)
GPU名称1フレームあたりの消費電力
RTX 5080
3.6
RTX 4080 SUPER
4.0
RTX 4080
4.0
RTX 4070 SUPER
4.1
RTX 5090
4.2
RTX 4090
4.2
RX 7900 XTX
4.4
RTX 4060 Ti 8GB
4.5
RTX 4070
4.5
RX 7900 XT
4.7
Arc B570
4.7
RTX 4070 Ti
4.7
RX 7900 GRE
4.8
RX 7800 XT
4.9
RTX 4070 Ti SUPER
4.9
Arc B580
4.9
RTX 4060 Ti 16GB
5.1
RTX 4060
5.3
RX 7600
5.7
RX 7700 XT
5.7
RTX 3070
6.0
RX 6800
6.1
RTX 3060 Ti
6.2
RTX 3090
6.3
RX 6800 XT
6.5
RTX 3080 10GB
6.5
RX 7600 XT
6.9
RX 6600 XT
6.9
Arc A770 16GB
7.3
RX 6700 XT
7.4
RTX 3060 12GB
7.5
RTX 3050 8GB
8.0
Arc A580
8.2
参考:TechPowerUp

ワットパフォーマンスは非常に良く、前世代を超えるけど、劇的な差でもない

ワットパフォーマンスは非常に良いです。4Kゲーム時の効率は前世代のトップ「RTX 4080 SUPER」よりも約10%良い数値となっており、「RTX 5090」よりもやや良いです。

先代から16GBというVRAMの容量こそ変わらなかったものの、GDDR7になり帯域幅も大きく向上したので、そのおかげで4Kでは効率が向上したのかなと思います。

よって、VRAMの帯域が重要な重い処理をする場合では発売時点ではトップのワットパフォーマンスの高効率GPUとなっています。

しかし、4Kにおいても10%という向上率は新世代としては物足りない感が強いです。前世代の例として「RTX 3070」から「RTX 4070」の比較を見てみると、25%~30%程度の向上となっています。

AI性能の向上があるので、そちらの活用次第では更に良い数値が期待はできるのかもしれませんが、GPUの基盤の効率自体は大きな向上に至っていないのは事実かなと思います。

レイトレーシング性能

レイトレーシング性能

リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。

また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。

※従来は各ゲームの幾何平均fpsの値を再計算して載せていたのですが、参考ページで全GPUの詳細fps値が示されなかったため、今回は相対性能を見ていきます。

レイトレーシングFPS(1080p 平均)
GPU名称平均FPS
RTX 5090
136
RTX 4090
115
RTX 5080
100
RTX 4080 SUPER
95
RTX 4080
94
RTX 4070 Ti SUPER
83
RTX 4070 Ti
79
RTX 3090 Ti
74
RTX 4070 SUPER
73
RTX 3090
68
RX 7900 XTX
68
RTX 4070
65
RTX 3080 10GB
61
RX 7900 XT
60
RX 7900 GRE
51
RTX 4060 Ti 16GB
49
RX 7800 XT
48
RTX 4060 Ti 8GB
48
RTX 3070
46
RX 6800 XT
43
RX 7700 XT
41
RTX 3060 Ti
39
Arc B580
39
RTX 4060
37
RX 6800
37
Arc A770 16GB
33
RTX 3060 12GB
31
RX 6700 XT
30
RX 7600 XT
27
Arc A580
26
RTX 3050 8GB
22
RX 6600 XT
21
RX 6600
18
RX 7600
17
参考:TechPowerUp
レイトレーシングFPS(1440p 平均)
GPU名称平均FPS
RTX 5090
146
RTX 4090
117
RTX 5080
100
RTX 4080 SUPER
93
RTX 4080
92
RTX 4070 Ti SUPER
80
RTX 4070 Ti
75
RTX 3090 Ti
72
RTX 4070 SUPER
69
RX 7900 XTX
66
RTX 3090
66
RTX 4070
61
RTX 3080 10GB
59
RX 7900 XT
57
RX 7900 GRE
48
RTX 4060 Ti 16GB
45
RX 7800 XT
43
RX 6800 XT
40
RX 7700 XT
37
Arc B580
37
RTX 3070
36
RX 6800
35
RTX 4060 Ti 8GB
34
RTX 3060 Ti
32
Arc A770 16GB
32
RTX 4060
29
RTX 3060 12GB
29
RX 6700 XT
27
RX 7600 XT
24
Arc A580
23
RTX 3050 8GB
18
RX 7600
15
RX 6600
15
RX 6600 XT
13
参考:TechPowerUp
レイトレーシングFPS(4K 平均)
GPU名称平均FPS
RTX 5090
156
RTX 4090
119
RTX 5080
100
RTX 4080 SUPER
90
RTX 4080
89
RTX 4070 Ti SUPER
77
RTX 3090 Ti
71
RTX 3090
64
RX 7900 XTX
62
RTX 4070 Ti
58
RTX 4070 SUPER
54
RX 7900 XT
53
RTX 4070
48
RX 7900 GRE
45
RTX 3080 10GB
44
RTX 4060 Ti 16GB
41
RX 7800 XT
40
RX 6800 XT
37
RX 7700 XT
36
RX 6800
31
Arc A770 16GB
30
RTX 3070
29
RTX 4060 Ti 8GB
27
RTX 3060 Ti
26
RX 6700 XT
26
RTX 3060 12GB
23
RTX 4060
23
Arc B580
21
RX 7600 XT
21
Arc A580
19
RTX 3050 8GB
9
RX 6600 XT
8
RX 7600
7
RX 6600
7
参考:TechPowerUp

ラスタライズよりも若干小さめの向上率。VRAMが少しネックか

レイトレーシング性能を「RTX 4080 SUPER」と比較すると、向上率はフルHDで約5%程度、1440pで約7%程度、4Kで約11%といった感じです。向上率とは控えめですし、ラスタライズよりも差が若干小さくなっています。

レイトレーシングではVRAM容量が重要なので、そこが変わっていなかったのが少し影響していそうな気がします。

レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするので、約20万円~のGPUでそこのボトルネックが若干気になるというのは正直残念感が大きいかなと思います。

ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、最終的な性能としては大きく上回ることにはなると思われるので、やはり考え方次第ではあります。

DLSS

DLSS有効時のゲーム性能

DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要となるため、GeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。

4Kでレイトレーシング有効&最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能(幾何平均)を見ていきます。

※表の「FG」は「Frame Generation(フレーム生成)」の略称です。

DLSS有効時のゲームfps(4K/RT Ultra)
GPU名称平均fps
RTX 5090
FGx4
187.8
RTX 5080
DLSS Performance / FGx4
185.2
RTX 5080
DLSS Quality / FGx4
154.7
RTX 5090
FGx3
146.8
RTX 5080
FGx4
127.1
RTX 4080 SUPER
DLSS Performance / FGx2
112.8
RTX 5090
FGx2
100.1
RTX 5080
FGx3
93.6
RTX 4080 SUPER
DLSS Quality / FGx2
90.6
RTX 5090
DLSS Quality
83.8
RTX 4090
FGx2
73.4
RTX 5080
FGx2
64.8
RTX 4090
DLSS Quality
64.4
RTX 4080 SUPER
FGx2
60.1
RTX 5090
ネイティブ
56.6
RTX 5080
DLSS Quality
56.3
RTX 4080 SUPER
DLSS Quality
53.7
RTX 4090
ネイティブ
42.1
RX 7900 XTX
FSR Quality
39.9
RTX 5080
ネイティブ
36.2
RTX 4080 SUPER
ネイティブ
33.5
RX 7900 XTX
ネイティブ
23.6

マルチフレーム生成を考慮すれば、「RTX 4080 SUPER」の60%以上のパフォーマンス

やはりマルチフレーム生成の効果は非常に大きいです。

「RTX 4080 SUPER」は少なくとも2025年1月時点ではマルチフレーム生成に対応していないため、追加のフレーム生成は1つのみ(x2)となっているのに対し、「RTX 5080」は1つのフレームに対して最大3つの追加フレーム(x4)なので、圧倒的な差です。

「RTX 5080」と「RTX 4080 SUPER」をどちらも一番高いフレームレートが出せるDLSS設定で比較した場合、「RTX 5080」の方が約64.2%高いパフォーマンスとなります。

フレーム生成と通常のアップスケーリングのDLSSの両方をオンにした場合、若干ギャップが縮まるため、x2とx4で2倍の差にはならないものの、基本的に1.5倍以上の差は出るので、やはり圧倒的な差です。

とはいえ、「RTX 4080 SUPER」の従来のフレーム生成(x2)だけでも非常に優れたパフォーマンスを発揮できるので、そもそもこのレベルのハイエンドGPUで追加のフレーム生成機能が必要なのか、という点は議論が必要かもしれません。

実際、上記の性能は「4Kレイトレーシングの最高設定」というやり過ぎなくらいの高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。

実際の環境ではフルHD~1440pが中心でしょうし、そうなればフレームレートは一段上がることを考えれば「RTX 4080 SUPER」でもDLSSが使える環境ならほとんどの場合で十分な性能が得られます。発売からしばらくは「RTX 4080 SUPER」よりも高価な状態が続くであろうことを考えると実用コスパ的には疑問が残るかもしれません。

とはいえ、マルチフレーム生成の効果は絶大なのは確かであり、フルで活用できれば今までの常識を覆すレベルとなっています。


コストパフォーマンス

上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。各GPUの価格は、記事執筆時点のおおよその市場最安値価格です。ラスタライズとレイトレーシング時の両方を見ていきます。

元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。


1フレームあたりの価格(ラスタライズ)

まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。

1fあたりの価格(1440p@RT無し)
GPU名称1フレームあたりの価格参考価格
Arc A580
571
¥24,800
RX 6600
706
¥28,800
Arc A770 16GB
729
¥39,800
RX 7600
744
¥36,980
RTX 4060
756
¥41,980
RX 7700 XT
780
¥62,980
RX 7800 XT
796
¥75,800
RTX 3060 12GB
800
¥39,980
Arc B580
811
¥49,800
RTX 4060 Ti 8GB
821
¥57,800
RTX 3050 8GB
832
¥28,800
Arc B570
842
¥44,980
RTX 3080 10GB
890
¥84,800
RTX 4070
923
¥86,800
RX 7900 XT
943
¥116,800
RX 6800 XT
962
¥89,800
RTX 4060 Ti 16GB
976
¥69,280
RTX 4070 SUPER
1015
¥109,980
RX 7900 XTX
1083
¥154,800
RTX 4070 Ti SUPER
1140
¥142,800
RTX 4080 SUPER
1165
¥169,800
RTX 5080
1246
¥198,800
RTX 4090
1808
¥323,800
RTX 5090
1816
¥393,800
参考:TechPowerUp

ラスタライズコスパは悪めで「RTX 4080 SUPER」と大差無し

価格が高価なハイエンドGPUは純粋なコスパでは悪い傾向があり、「RTX 5080」も悪いです。

円安が進んでいることも影響し、日本では「RTX 4080 SUPER」よりもやや高価となっていますし、ラスタライズの性能の向上率も10%前後の向上と小さいので、コスパも先代から少し悪化しています。

とはいえ、前世代で人気だった「RTX 4070 Ti SUPER」と比べて劇的に悪いというほどではないですし、「RTX 4090 / 5090」よりは遥かにマシな数値となっています。

DLSS 4のマルチフレーム生成やニューラルレンダリングのことを考えると、4K高設定などでは実用コスパはやや改善されると思いますし、4K高リフレッシュレート前提であれば有力な選択肢の一つにはなるかと思います。


1フレームあたりの価格(レイトレーシング)

次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。

1fあたりの価格(1440p@RT)
GPU名称1フレームあたりの価格参考価格
Arc A580
925
¥24,800
Arc A770 16GB
1188
¥39,800
Arc B580
1258
¥49,800
RTX 3060 12GB
1351
¥39,980
Arc B570
1371
¥44,980
RTX 4060
1510
¥41,980
RTX 4060 Ti 16GB
1546
¥69,280
RX 7700 XT
1559
¥62,980
RTX 3050 8GB
1591
¥28,800
RTX 4060 Ti 8GB
1661
¥57,800
RTX 4070 Ti SUPER
1828
¥142,800
RTX 4080 SUPER
1862
¥169,800
RX 7900 XT
1887
¥116,800
RX 7600 XT
1917
¥50,800
RTX 5080
2035
¥198,800
RX 7900 XTX
2190
¥154,800
RX 7600
2465
¥36,980
RTX 5090
2787
¥393,800
RTX 4090
2946
¥323,800
参考:TechPowerUp

レイトレーシングでもコスパは悪く、「RTX 4080 SUPER」を少し下回るが、実用性能は高い

価格の高さが主な原因なので、コスパに関してはレイトレーシングでも悪いです。

しかし、レイトレーシングはマルチフレーム生成やニューラルレンダリングが大きく貢献しそうなので、それらを活用する前提なら実用性能は他のハイエンドGPUと比べても非常に高いです。そこも考慮すれば、一気に地位を上げることになります。

とはいえ、「RTX 4080 SUPER」の性能でも従来のフレーム生成(x2)は利用でき、それがあれば多くのゲームで快適な性能自体は手に入るので、そのあたりも含めての評価は難しいところです。

AI・クリエイティブ用途

比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。

一般的な動画編集等の基準性能としてFP32(単精度浮動小数点演算)の理論演算性能、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」の性能をそれぞれ見ていきたいと思います。

また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー(HotHardware)を参考にしています。「Ryzen 7 9800X3D」と「DDR5-6000 CL28 32GB(16GBx2)」が使用されています。他の条件について気になる方は上述の参考リンクをご覧ください。

理論演算性能(FP32)

FP32(単精度浮動小数点演算)は、理論演算性能を示す一つの指標です。単位はTFLOPS(テラフロップス)を用います。実際のテストから算出するものではなく、シェーダーユニット数(対応の演算器の数)とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。

一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能(データ量が多い処理の場合)によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います(完全に一致する訳ではないので注意)。

FP32(単精度浮動小数点演算)
GPU名称FP32(TFLOPS)
RTX 5090
32GB 1792GB/s
104.8
RTX 4090
24GB 1008GB/s
82.58
RX 7900 XTX
24GB 960GB/s
61.42
RTX 5080
16GB 960GB/s
56.28
RTX 4080 SUPER
16GB 736.3GB/s
52.22
RX 7900 XT
20GB 800GB/s
51.48
RTX 4080
16GB 716.8GB/s
48.74
RX 7900 GRE
16GB 576GB/s
45.98
RTX 4070 Ti SUPER
16GB 672GB/s
44.10
RTX 4070 Ti
12GB 504GB/s
40.09
RX 7800 XT
16GB 624GB/s
37.32
RTX 4070 SUPER
12GB 504GB/s
35.48
RX 7700 XT
12GB 432GB/s
35.17
RTX 3080
10GB 760GB/s
29.77
RTX 4070
12GB 504GB/s
29.15
RX 7600 XT
16GB 288GB/s
22.57
RTX 4060 Ti
8GB / 16GB  288GB/s
22.06
RTX 3070 Ti
8GB 608GB/s
21.75
RX 7600
8GB 288GB/s
21.75
RX 6800 XT
16GB 512GB/s
20.74
RTX 3070
8GB 448GB/s
20.31
Arc A770 16GB
16GB 560GB/s
17.20
RTX 3060 Ti
8GB 448GB/s
16.20
RX 6800
16GB 512GB/s
16.17
RTX 4060
8GB 272GB/s
15.11
Arc B580
12GB 456GB/s
13.67
RX 6700 XT
12GB 384GB/s
13.21
RTX 3060 12GB
12GB 360GB/s
12.74
Arc B570
10GB 380GB/s
11.52
RX 6600 XT
8GB 256GB/s
10.61
RTX 3050
8GB 224GB/s
9.10
RX 6600
8GB 224GB/s
8.93

理論性能コスパも悪い

「RTX 5080」のFP32(単精度浮動小数点演算)の理論性能は約56.28TFLOPSと非常に優れていますが、価格が非常に高価なのでコスパは悪いです。

VRAM容量も価格の割には少ないので、理論性能コスパ的には「RTX 5080」はかなり弱めです。


Blender(GPUレンダリング)

「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。

「Blender 4.3」では、Nvidia Optix、Intel OpenAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。

Blender Benchmarks(4.3.0)
GPU名称総合スコア(幾何平均)
RTX 5090
4769
RTX 4090
3503
RTX 5080
2819
RTX 4080
2653
RX 7900 XTX
1324
参考:HotHardware

Blenderのレンダリングは「RTX 4080 SUPER」とあまり変わらず

BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、「RTX 4080 SUPER」とあまり変わりません。わずか約6.3%上回る性能でした。

とはいえ、性能自体は非常に高性能で、高負荷時の効率も非常に優れているので、重いレンダリング処理を日常的に大量に行うのであれば、魅力は十分あると思います。


MLPerf Client(AI性能)

「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。

幅広い環境で使えるONNX(DirectML)をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。

MLPerf Client 総合スコア(幾何平均)
GPU名称総合スコア(幾何平均)
RTX 5090
244.68
RTX 4090
176.57
RTX 5080
155.06
RTX 4080
134.76
RX 7900 XTX
127.44
参考:HotHardware

AIは汎用のONNX(DirectML)では「RTX 4080 SUPER」を約15%上回る

AIでは大きめの向上率が見られました。Tensorコアに最適化されていない場合のAI処理(ONNX)でも、「RTX 4080 SUPER」を約15%上回る性能でした。

マルチフレーム生成など、機能面での差がない項目としては、ここまでで一番大きな差です。

コア数の増加率(約5%)よりもやや大きめの向上率となっており、AI性能の効率が上がっていることは確かに感じられました。ただし、劇的な差かというとそうでもないです。


Blackmagic RAW(デコード速度)

「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するCPU/GPUのベンチマークです。処理にはCPUも使用されますが、基本的にGPUの方が重要度は高いです。

また、圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率(12:1)での8Kおよび4Kのテストでのデコード速度(1秒あたりのフレーム数)を見ていきます。

Blackmagic RAW 4.3.1 デコード速度(8K/12:1)
GPU名称スコア
RTX 5090
251
RTX 5080
216
RTX 4090
202
RTX 4080
180
RX 7900 XTX
108
参考:HotHardware
Blackmagic RAW 4.3.1 デコード速度(4K/12:1)
GPU名称スコア
RTX 5090
1005
RTX 5080
867
RTX 4090
810
RTX 4080
721
RX 7900 XTX
433
参考:HotHardware

「RTX 4080」を約20%上回るRAWデコード速度

RAWのデコード速度テストでは、「RTX 4080」を20%ほど上回る性能となっていました。大きめの向上率です。

非常に優れたメディアエンジン性能で、「RTX 5090」との差も約10%台に留まっています。メディア関連の処理はGPU以外がボトルネックになり易いものも多く、特にハイエンドGPUでは他要素がネックになるケースも多めの印象なので、その影響が出ているかもしれません。

ハイエンドなメディア処理性能を求める上でコスパも多少意識するなら強力な選択肢の一つになると思います。ただし、特にクリエイティブ用途でのコスパを考える場合には価格の割には少ないVRAM容量にも注意が必要です。


Procyon Stable Diffusion(AIイラスト生成)

現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。

「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。

ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。

また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT(NVIDIA)、Open VINO(Intel)、ROCm(AMD)といったものがありますが、2024年12月時点ではROCm(AMD)は現状Windowsでのネイティブ動作に対応していません(Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど)。

そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML(ONNX)の3つとなっており、AMD製のGPU(Radeon等)のみ汎用のDirect ML(ONNX)を使わざるを得ず、低めの性能となっている点に注意が必要です。

※しかし、記事執筆時点ではRTX 50(Blackwell)がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。

Procyon Stable Diffusion XL 総合スコア(1024×1024)
GPU名称スコア
RTX 4090(Tensor RT)
5073
RTX 5090(ONNX)
5073
RTX 4090(ONNX)
3985
RTX 4080(Tensor RT)
3437
RTX 5080(ONNX)
2920
RTX 4080(ONNX)
2499
RX 7900 XTX(ONNX)
1458
参考:HotHardware

TensorRTでなくても優れた性能で、「RTX 4080」よりも約16.8%高速

Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。

しかし、代わりに汎用のONNX(DirectML)での結果を確認してみても、非常に優れた性能を発揮することがわかります。ONNX同士の比較では「RTX 4080」よりも約16.8%高速で、「RX 7900 XTX」の約2倍の性能です。

先代からの向上率はコア数の増加率(約5%)よりもやや大きめの向上率となっており、やはりAI性能効率の強化を感じることができました。しかも、TensorRT無しでも高い向上率が感じられたのは素晴らしいです。

消費電力の増加率はそこまでには至っていないので、AIに関してのワットパフォーマンスはゲームよりもやや高くなることも期待できます。

ただし、やはり劇的な向上率かと言うとそうでもないですし、VRAM容量が重要な画像生成AIでは16GBでも余裕があるというほどでもありませんので、既存の「RTX 4070 Ti SUPER」やこれから出てくるであろう「RTX 5070 Ti」と比較して実用コスパでどうなのかという話にはなると思います。

まとめ

GeForce RTX 5080

良い点
  • 「RTX 4080 SUPER」を少し上回る非常に優れた処理性能(AI関連はやや大きめの性能向上率)
  • 希望小売価格は「RTX 4080 SUPER」と同じ(ただし、日本では円安で価格上昇)
  • 非常に優れたワットパフォーマンス(特に重い処理)
  • DLSS 4のマルチフレーム生成対応
  • 非常に優れたメディアエンジン

気になる点
  • 非常に高価(想定価格:約20万円~)
  • 価格の割には少ない16GB VRAM
  • 消費電力が多い(TGP:360W)
  • 「RTX 4080 SUPER」からの性能向上率は小さめ(マルチフレーム生成やAI面を除く)
  • サイズが大型
  • 非常に高性能なので、フルHDなど低負荷な環境ではパフォーマンスが制限されるケースがある

RTX 5080:AIの性能&新機能を考慮しなければ「RTX 4080 SUPER」から少しの向上

「RTX 5080」は「RTX 4080 SUPER」を上回る性能を発揮するハイエンドGPUです。1440pレイトレなどの重い処理でも十分実用的に運用できる高性能GPUです。

最近はAIの注目度が高いためハイエンドGPUは非常に需要があるにも関わらず、希望小売価格は「RTX 4080 SUPER」と同じ999ドルというのも良心的で嬉しいです。日本においてはRTX 40登場当時よりも円安が進行しているためにやや高価ですが、ベース価格が据え置きというのはかなり頑張った価格設定だと思います。

ただし、「RTX 4080 SUPER」と比較したコア増加率はわずか5%ほどで、VRAM容量も16GBのままなのは残念です。

DLSSを使用しない場合のゲーム性能を「RTX 4080 SUPER」と比較すると、おおよそ10%前後程度の向上に留まっています(設定やゲームタイトルによって多少前後)基本性能は先代から小さな向上です。

製造プロセスがほぼ変わらないようなので、ある程度想定はできましたが、基本性能の向上は思ったよりも小さめだったのは残念でした。

そして、特にVRAM容量が16GBのままなのが非常に残念です。16GBという容量だけ見れば強力なのは確かですが、約20万円~のGPUとしては少ないです。

最近注目の用途であるレイトレーシングやAIやメタバースなどではVRAM容量が重要なことが多いので、今はハイエンド用途だと16GBでも余裕がある容量ではない時代になっています。VRAMはいくらあっても嬉しいレベルです。

20万円のGPUを購入してVRAMという変更ができない部分で不満を感じるのは渋いですから、もうちょっと頑張って欲しかったというのが本音です。

微妙な点を先に挙げてしまいましたが、前世代からAI性能が大きく強化されている点は魅力です。NVIDIA公表のTensorコアの理論性能では「RTX 4080 SUPER」を約2.15倍も上回っています。実際、AI関連処理では高めの向上率を記録しました。

特に、ゲームではDLSS 4(マルチフレーム生成含む)を最大限活用すれば、「RTX 4080 SUPER」を60%以上上回るフレームレートを出すことも可能であり、その場合には4Kレイトレすら十分実用的です。

ONNX(DirectML)を利用するゲーム以外の汎用的なAI処理においても、TensorRT無しで「RTX 4080 SUPER」を15%ほど上回る性能を発揮することが確認できました。

Tensorコアに対しての最適化が進めば更に高い性能となることも考えられますし、AI面では価格上昇を考慮しても価値を感じることはできるレベルにはなっているのではないかと思います。

また、電力面も優れています。TGPの360Wという数字を見たときは心配の方が大きかったですが、実際にはそこまで多くはなく、ゲーム時平均は320W~330Wでした(リファレンス仕様では)

前世代の「RTX 4080 / 4080 SUPER」もTGP(320W)よりも消費電力がやや少ない傾向でしたので、先代と比べるとやはり増加はしているものの、思ったほどはネックではなく、電源や排熱面での扱いもほぼ同じで済みます。

ワットパフォーマンスでは、4Kゲーム(ラスタライズ)時で前世代トップの「RTX 4080 SUPER」よりも1割ほど良い数値を記録しました。2025年1月時点では高負荷な処理ではトップの効率のGPUに君臨しました。

…という感じで現状で優秀なのは間違いないですが、前世代のとき(RTX 30 → RTX 40)のときはDLSS無しのゲームでも30%近い向上が見られたりもしたので、それを考えると正直物足りない感はあったりもします。

ただし、一応擁護をしてみると、DLSS 4のマルチフレーム生成や、その他のAIで効率化できる処理なら更に差を付けることが出来るはずではあります。

そんな感じで、AI面をどう取り入れるかによって性能が大きく変わるので評価はし辛いですが、AIをフル活用する前提なら、「RTX 4080 SUPER」をやや大きめに上回りますし、DLSS 4のマルチフレーム生成まで考慮すれば圧倒的に上回るものの、AIをそこまで活用しないなら「RTX 4080 SUPER」からの向上率は小さいです。

「RTX 4080 SUPER」でも基本性能は十分に高く、フレーム生成も従来のものがあれば大体のゲームでは快適でしたから、実用性の差は現状ではほとんどの人にとって感じにくいのGPUではある思います。

といった感じで、本記事は以上になります。ご覧いただきありがとうございました。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です