「GeForce RTX 5080」ざっくり評価【性能比較】

当サイトはアフィリエイト広告を利用しています

この記事には広告を含む場合があります。

記事内で紹介する商品を購入することで、当サイトに売り上げの一部が還元されることがあります。

「GeForce RTX 5080」のざっくり性能比較・評価です。米国での発売予定日は2025年1月30日ですが、発売前にレビューが解禁されているので、海外レビューを参考に性能をざっくりと確認していきます。

注意

本記事の情報は記事執筆時点（2025年1月30日）のものです。ご覧になっている際には異なる可能性があるため注意してください。

参考

https://www.nvidia.com/ja-jp/geforce/graphics-cards/50-series/

https://www.techpowerup.com/review/nvidia-geforce-rtx-5080-founders-edition/

https://hothardware.com/reviews/nvidia-geforce-rtx-5080-blackwell-review

目次非表示

仕様
ゲーミング性能（ラスタライズ）
電力関連
- 消費電力
- ワットパフォーマンス
レイトレーシング性能
- レイトレーシング性能
DLSS
- DLSS有効時のゲーム性能
コストパフォーマンス
- 1フレームあたりの価格（ラスタライズ）
- 1フレームあたりの価格（レイトレーシング）
AI・クリエイティブ用途
まとめ

目次へ

仕様

まずは主要な仕様を表にまとめて載せています。

簡易比較表

※価格は2025年1月30日時点での米での希望小売価格です（判明しているもののみ）。
※GPU名のリンクはAmazonのものです。

GPU	シェーダーユニット数	メモリタイプ	VRAM速度 VRAM帯域幅	レイトレ用ユニット数	ダイサイズ（おおよそ）	消費電力 (TGP等)	希望小売価格
RTX 5090	21760	GDDR7 32GB 512bit	28.0Gbps 1792GB/s	170	750㎟	575W	1,999ドル
RTX 4090	16384	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	128	608㎟	450W	1,599ドル
RTX 5080	10752	GDDR7 16GB 256bit	30.0Gbps 960GB/s	84	378㎟	360W	999ドル
RTX 4080 SUPER	10240	GDDR6X 16GB 256bit	23.0Gbps 736.3GB/s	80	380㎟	320W	999ドル
RTX 4080	9728	GDDR6X 16GB 256bit	22.4Gbps 716.8GB/s	76	380㎟	320W	1,199ドル →市場廃止
RTX 5070 Ti	8960	GDDR7 16GB 256bit	28.0Gbps 896GB/s	70?	?㎟	300W	749ドル
RX 7900 XTX	6144	GDDR6 24GB 384bit	20Gbps 960GB/s	96	36.6㎟*6 + 300㎟	355W	999ドル
RX 7900 XT	5376	GDDR6 20GB 320bit	20Gbps 800GB/s	84	36.6㎟*6 + 300㎟	315W	799ドル →749ドル?
RTX 4070 Ti SUPER	8448	GDDR6X 16GB 256bit	21.0Gbps 672GB/s	66	295㎟	285W	799ドル
RTX 4070 Ti	7680	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	60	295㎟	285W	799ドル →市場廃止
RTX 5070	6144	GDDR7 12GB 192bit	28?Gbps 672GB/s	48?	?㎟	250W	549ドル
RTX 3090 Ti	10752	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	84	628.4㎟	450W	1,499ドル
RTX 3090	10496	GDDR6X 24GB 384bit	19.5Gbps 936GB/s	82	628.4㎟	350W	1,299ドル
RX 7900 GRE	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	36.6㎟*6 + 300㎟	260W	549ドル
RX 6950 XT	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	519㎟	335W	949ドル
RX 6900 XT	5120	GDDR6 16GB 256bit	16Gbps 512GB/s	80	519㎟	300W	699ドル
RTX 3080 Ti	10240	GDDR6X 12GB 384bit	19Gbps 912GB/s	80	628.4㎟	350W	1,099ドル
RTX 3080 10GB	8704	GDDR6X 10GB 320bit	19Gbps 760GB/s	68	628.4㎟	320W	699ドル
RTX 4070 SUPER	7168	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	56	295㎟	220W	599ドル
RTX 4070	5888	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	46	295㎟	200W	549ドル前：599ドル
RX 7800 XT	3840	GDDR6 16GB 256bit	19.5Gbps 624GB/s	60	37.5㎟*4 + 200㎟	263W	499ドル
RX 6800 XT	4608	GDDR6 16GB 256bit	16Gbps 512GB/s	72	519㎟	300W	599ドル
RTX 3070 Ti	6144	GDDR6X 8GB 256bit	19Gbps 608GB/s	48	392㎟	290W	599ドル
RX 6800	3840	GDDR6 16GB 256bit	16Gbps 512GB/s	60	519㎟	250W	549ドル
RX 7700 XT	3456	GDDR6 12GB 192bit	18Gbps 432GB/s	54	37.5㎟*4 + 200㎟	245W	419ドル前:449ドル
RTX 4060 Ti 8GB	4352	GDDR6 8GB 128bit	18Gbps 288GB/s	34	190㎟	160W	399ドル
RTX 3070	5888	GDDR6 8GB 256bit	14Gbps 448GB/s	46	392㎟	220W	499ドル
RX 6750 XT	2560	GDDR6 12GB 192bit	18Gbps 432GB/s	40	336㎟	250W	419ドル
RTX 3060 Ti	4864	GDDR6 8GB 192bit	14Gbps 448GB/s	38	392㎟	200W	399ドル
RX 6700 XT	2560	GDDR6 12GB 192bit	16Gbps 384GB/s	40	336㎟	230W	379ドル
Arc A770 16GB	4096	GDDR6 16GB 256bit	17.5Gbps 560GB/s	32	406㎟	225W	349ドル
Arc A770 8GB	4096	GDDR6 8GB 256bit	16Gbps 512GB/s	32	406㎟	225W	329ドル
Arc B580	2560	GDDR6 12GB 192bit	19Gbps 456GB/s	20	272㎟	190W	249ドル
RX 7600 XT	2048	GDDR6 16GB 128bit	18Gbps 288GB/s	32	204㎟	190W	329ドル
RTX 4060	3072	GDDR6 8GB 128bit	17Gbps 272GB/s	24	156㎟	115W	299ドル
Arc B570	2304	GDDR6 10GB 160bit	19Gbps 380GB/s	18	272㎟	150W	219ドル
RX 6650 XT	2048	GDDR6 8GB 128bit	17.5Gbps 288GB/s	32	237㎟	180W	299ドル
RX 7600	2048	GDDR6 8GB 128bit	18Gbps 288GB/s	32	204㎟	165W	269ドル
RX 6600 XT	2048	GDDR6 8GB 128bit	16Gbps 256GB/s	32	237㎟	160W	–
Arc A750	3584	GDDR6 16GB 256bit	16Gbps 512GB/s	28	406㎟	225W	289ドル
RX 6600	1792	GDDR6 8GB 128bit	14Gbps 224GB/s	28	237㎟	132W	239ドル
RTX 3060 12GB	3584	GDDR6 12GB 192bit	15Gbps 360GB/s	28	276㎟	170W	329ドル
RTX 3050	2560	GDDR6 8GB 128bit	15Gbps 224GB/s	20	276㎟	130W	249ドル

前世代との比較

「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。

RTX 50シリーズではTensorコアが「FP4」に新たに対応したことで、前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われます。

コア数による表記は、コア性能が上がっても向上を感じられないという問題があったので、表記を切り替える良い機会になったのかなと思います。

ただし、RTX 40 シリーズのAI性能は「FP8」の数値なのに対し、RTX 50 シリーズのAI性能は「FP4」なので、精度が低下している点には注意してください（ただし、FP4でも十分な精度だと言われている）。

GPU	希望小売価格	GPU				VRAM			TGP
GPU	希望小売価格	CUDAコア	Tensorコア (AI TOPS)	RTコア (TFLOPS)	クロック最大(GHz)	容量/タイプ	バス幅	帯域幅(GB/s)	TGP
RTX 5090	1999ドル	21760	3352	318	2.41	32GB GDDR7	512bit	1792	575W
RTX 4090	1599ドル	16384	1321	191	2.52	24GB GDDR6X	384bit	1008	450W
RTX 5080	999ドル	10752	1801	171	2.62	16GB GDDR7	256bit	960	360W
RTX 4080 SUPER	999ドル	10240	836	121	2.55	16GB GDDR6X	256bit	736	320W
RTX 5070 Ti	749ドル	8960	1406	133	2.45	16GB GDDR7	256bit	896	300W
RTX 4070 Ti SUPER	799ドル	8448	780	102	2.61	16GB GDDR6X	256bit	672	285W
RTX 4070 SUPER	599ドル	7168	568	93	2.48	12GB GDDR6X	192bit	504	220W
RTX 5070	549ドル	6144	988	94	2.51	12GB GDDR7	192bit	672	250W
RTX 4070	549ドル	5888	466	67	2.48	12GB GDDR6X 12GB GDDR6	192bit	504	200W

今回見ていくのはNVIDIA「GeForce RTX 5080」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」のハイエンドモデルです。

メーカー希望小売価格は999ドルで、国内想定価格は198,800円～となっています。CUDAコア数は10,752となっており、「RTX 4080 SUPER」から5%の増加に留まっています。その他のコア・ユニット類も基本約5%程度の増加です。そのため、基本性能は先代からわずかしか向上していないかと懸念されているGPUでもあります。

ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。

特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5080」の理論性能（FP4）は 1801 TOPSとなっており、これは「RTX 4080 SUPER」の約2.15倍という凄まじい向上率です。

前世代ではFP8（8ビット）までの対応だったのが、FP4（4ビット）に対応したことで性能が飛躍的に向上しました。精度は落ちるものの、FP4でも十分な精度が得られると言われています。

そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されました。

AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。

また、性能に直接関係ないですが気を付けたいのは、「RTX 5080」は名前的には「RTX 5090」の一つ下に見えますが、「RTX 5090」の仕様が規格外すぎてコア数およびVRAM容量は半分程度となっており、性能は一段どころではなく圧倒的な差がある点に注意です。

その代わり、価格も半額の999ドル（国内想定価格：198,800円～）で、ベース価格は「RTX 4080 SUPER」と同じになっています。「RTX 5090」は約40万円～ということで価格も規格外なので、コスパ等も意識する上での実質的な最上位モデルはこの「RTX 5080」と言えるかもしれません。

ただ、ベース価格が同じなので、コア数の増加が微量なのは良いとしても、気になるのはVRAMです。「RTX 5080」のVRAM容量は16GBで、「RTX 4080 / 4080 SUPER」から据え置きとなっています。

前世代から価格の割にVRAMが少ないのは懸念点として挙げられていたと思いますが、そこは改善されなかったのは非常に残念です。GDDR6XからGDDR7になり、帯域幅が約736.3GB/sから960GB/sに向上はしているものの、現状はVRAM容量の方が重視される要素だと思いますので、999ドル（約20万円～）という価格で16GBはさすがに気になるところです。

また、後に発売予定の「RTX 4070 Ti」も容量は同じ16GB VRAMとなっているのも懸念点です。そちらの価格は約15万円～想定となっており、約5万円も安いですから、VRAM容量コスパを考えるなら明らかにそちらの方が優れています。

16GB VRAMという仕様自体は非常に強力ですし、ネックになる場面は限られてはいるものの、約20万円もの費用を出して後から調整不能な部分でのネックが残ってしまうのは残念かなと思います。

更に、「RTX 50シリーズ」はプロセス面に関しては前世代からほとんど進化していない可能性が高めなのも懸念点です。

製造プロセスは前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも「5nm EUV」で製造されているという噂です。

そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」で微細化はされていない可能性が高そうです。そのため、主に電力効率（ワットパフォーマンス）面では大きな改善が見られないかもしれないのが懸念点です。

その辺りとも関連性がある部分として、気になるのは消費電力です。

「RTX 5080」のTGPは360Wとなっています。「RTX 4080 SUPER」の320Wを約12.5%上回る消費電力です。

コア類の増加は約5%でクロック増加もわずかなので、カタログスペックだけ見ると電力効率は前世代から良くなっていないように見えます。

ただし、後述の内容を先に一部触れてしまうと、実際にはリファレンス仕様では平均では360Wほど消費せず、ゲーム時には320～330Wに留まっています。そのため、実際には消費電力は思ったより増えておらず、効率も若干良くなっています。

とはいえ、その差は小さいのも事実です。その辺りも含めて詳しい性能はこの後に触れていきたいと思いますが、カタログスペックだけ見れば、AIを活用する面を除いては「RTX 4080 / 4080 SUPER」からさほど変わらない性能のGPUとなりそうです。

DLSS 4、ニューラルレンダリング

「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。

まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。

DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。

また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。

マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。

次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。

従来はグラフィックスAPI内でTensorコア（AI）を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。

これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。

DLSSやFSRといった別機能ではなく、グラフィックスAPI（DirectX）の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR（レイトレーシング）単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。

といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。

ゲーミング性能（ラスタライズ）

ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。

まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能（ラスター性能）を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。

使用されたグラフィックボードは「NVIDIA GeForce RTX 5080 Founders Edition（通称FE版）」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。

フルHD（1920×1080）

フルHD（1920×1080）です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。

平均FPS(1080p 最高設定)
GPU名称	平均FPS
RTX 5090	251.1
RTX 4090	225.0
RTX 5080	203.5
RTX 4080 SUPER	190.3
RTX 4080	187.8
RX 7900 XTX	184.1
RTX 4070 Ti SUPER	166.8
RX 7900 XT	164.3
RTX 4070 Ti	160.0
RTX 4070 SUPER	148.0
RTX 3090	141.9
RX 7900 GRE	141.3
RTX 4070	129.8
RX 7800 XT	128.3
RTX 3080 10GB	127.2
RX 6800 XT	125.8
RX 7700 XT	110.6
RTX 3070	100.8
RTX 4060 Ti 16GB	99.9
RTX 4060 Ti 8GB	98.7
RX 6700 XT	88.7
RTX 3060 Ti	88.2
Arc B580	82.6
RX 7600 XT	78.9
RTX 4060	78.6
Arc B570	72.9
RX 7600	72.1
Arc A770 16GB	71.8
RX 6600 XT	68.8
RTX 3060 12GB	67.4
RX 6600	59.0
Arc A580	58.5
RTX 3050 8GB	48.3

参考：TechPowerUp

フルHDは低負荷感が強めで、RTX 4080 SUPERから約6.9%の向上

「RTX 4090 / 5090」ほどではないですが、フルHDのラスタライズは「RTX 5080」にとってもやや低負荷感が強めです。CPUなど他要素がボトルネックになり、フレームレートが伸び悩むゲームが多めの印象なので、やや参考程度の記録かなと思うことを先に触れておきます。

とはいえ、その性能自体は非常に高く、重いゲームが中心かつ最高設定でも平均fpsは200を超えました。「RTX 4080 SUPER」からの向上率は約6.9%と小さめですが、フルHDで不満を感じることはほぼ無いかと思います。

1440p（2560×1440）

WQHD（2560×1440）です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。

平均FPS（1440p 最高設定）
GPU名称	平均FPS
RTX 5090	216.8
RTX 4090	179.1
RTX 5080	159.6
RTX 4080 SUPER	145.8
RTX 4080	143.4
RX 7900 XTX	142.9
RTX 4070 Ti SUPER	125.3
RX 7900 XT	123.8
RTX 4070 Ti	117.7
RTX 4070 SUPER	108.4
RTX 3090	107.6
RX 7900 GRE	104.5
RX 7800 XT	95.2
RTX 3080 10GB	95.3
RX 6800 XT	93.3
RTX 4070	94.0
RX 7700 XT	80.7
RTX 3070	73.8
RTX 4060 Ti 16GB	71.0
RTX 4060 Ti 8GB	70.4
RX 6700 XT	64.3
RTX 3060 Ti	64.3
Arc B580	61.4
RX 7600 XT	55.7
RTX 4060	55.5
Arc A770 16GB	54.6
Arc B570	53.4
RX 7600	49.7
RTX 3060 12GB	48.6
RX 6600 XT	47.7
Arc A580	43.4
RX 6600	40.8
RTX 3050 8GB	34.6

参考：TechPowerUp

1440pでは「RTX 4080 SUPER」を約9.5%上回る。新世代としては微妙な向上率

ここからが本番という感じの1440pですが、「RTX 4080 SUPER」からの向上率は約9.5%です。

性能自体は非常に高性能で、不満を感じる場面は少ないとは思うものの、新世代としては微妙な向上率かと思います。AIやレイトレーシング性能の向上を受けられない用途ではやはり「RTX 4080 SUPER」からの向上率は小さいです。

ただし、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば大きな差が付くであろうことを考えると評価が難しいです。

4K（3840×2160）

「超高解像度の代名詞」という感じの解像度の4K（3840×2160）です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。

平均FPS(4K 最高設定)
GPU名称	平均FPS
RTX 5090	147.1
RTX 4090	109.2
RTX 5080	96.7
RTX 4080 SUPER	85.5
RX 7900 XTX	84.7
RTX 4080	84.1
RTX 4070 Ti SUPER	72.3
RX 7900 XT	71.5
RTX 4070 Ti	66.3
RTX 3090	64.5
RTX 4070 SUPER	60.9
RX 7900 GRE	59.3
RTX 3080 10GB	55.9
RX 7800 XT	54.5
RTX 4070	52.7
RX 6800 XT	53.1
RX 7700 XT	44.6
RTX 3070	42.0
RTX 4060 Ti 16GB	38.6
RTX 4060 Ti 8GB	38.5
Arc B580	36.2
RTX 3060 Ti	36.0
RX 6700 XT	35.6
Arc A770 16GB	31.8
Arc B570	30.9
RX 7600 XT	30.3
RTX 4060	29.7
RTX 3060 12GB	27.4
RX 7600	24.7
RX 6600 XT	24.7
Arc A580	24.6
RX 6600	20.7
RTX 3050 8GB	18.7

参考：TechPowerUp

4Kでは「RTX 4080 SUPER」を約13.1%上回る性能で、1440pから若干差を広げる

「RTX 4080 SUPER」と比較すると、4Kでは1440pから少し差を広げた約13.1%上回る性能でした。VRAMの帯域幅の向上が活きているのかもしれません。

フルHDや1440pよりは魅力を感じられる向上率ではあり、4K前提ならコスパは「RTX 4080 SUPER」と比べて劣ってはいないのかなと思います。とはいえ、やはり新世代GPUとしては小さな向上率という点は変わらない印象です。

とはいえ、やはりDLSS 4のマルチフレーム生成やニューラルレンダリングを活用できればもっと大きな差が付くと思われるので、そこをどう考えるか次第ではあります。

電力関連

消費電力

ゲームプレイ時（高負荷時）の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」で、解像度は「3840×2160（4K）」です。

GPU平均消費電力（ゲーミング）
GPU名称	消費電力
RTX 4060	128
RTX 3050 8GB	132
RTX 4060 Ti 8GB	152
RX 6600 XT	152
Arc B570	154
RX 7600	154
RTX 4060 Ti 16GB	165
RTX 3060 12GB	183
Arc B580	185
RX 7600 XT	198
RTX 4070	201
RTX 3060 Ti	205
Arc A580	209
RX 6700 XT	217
RTX 4070 SUPER	218
RTX 3070	232
RX 6800	233
Arc A770 16GB	235
RX 7700 XT	236
RX 7800 XT	250
RX 7900 GRE	265
RTX 4070 Ti	277
RX 6800 XT	294
RTX 4080 SUPER	302
RTX 4070 Ti SUPER	304
RTX 4080	304
RX 7900 XT	312
RTX 5080	325
RTX 3080 10GB	336
RX 7900 XTX	360
RTX 3090	368
RTX 4090	411
RTX 5090	587

参考：TechPowerUp

ゲーム時の平均消費電力はTGPよりもやや少なめな325W

ゲーム時の平均消費電力は325Wとなっており、TGPの360Wよりも少なめです。

前世代の「RTX 4080 SUPER」もTGPよりもやや少なめだったので、少し増加してはいますが、TGPの数値のまま受け取るよりは若干印象は良いです。用意する電源や排熱面の関係は大して変わらないと思います。

ワットパフォーマンス

ワットパフォーマンス（電力効率）を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています

環境は消費電力はおよび4Kは「Cyberpunk 2077（Ultra/レイトレ無効）」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。

ワットパフォーマンス（1080p/25ゲーム平均）
GPU名称	1フレームあたりの消費電力
RTX 4070 SUPER	1.47
RTX 4060 Ti 8GB	1.54
RTX 4070	1.55
RTX 4080 SUPER	1.59
RTX 5080（参考）	1.60
RTX 4080	1.62
RTX 4060	1.63
RTX 4060 Ti 16GB	1.65
RTX 4070 Ti	1.73
RTX 4070 Ti SUPER	1.82
RTX 4090	1.83
RX 7900 GRE	1.88
RX 7900 XT	1.90
RX 7800 XT	1.95
RX 7900 XTX	1.96
Arc B570	2.13
RX 7700 XT	2.13
RX 7600	2.14
RX 6800	2.19
RX 6600 XT	2.21
Arc B580	2.24
RTX 3070	2.30
RTX 3060 Ti	2.32
RX 6800 XT	2.34
RTX 5090	2.34
RX 6700 XT	2.44
RX 7600 XT	2.51
RTX 3090	2.60
RTX 3080 10GB	2.64
RTX 3060 12GB	2.67
RTX 3050 8GB	2.73
Arc A770 16GB	3.27
Arc A580	3.57

参考：TechPowerUp

ワットパフォーマンス（4K/Cyberpunk 2077）
GPU名称	1フレームあたりの消費電力
RTX 5080	3.6
RTX 4080 SUPER	4.0
RTX 4080	4.0
RTX 4070 SUPER	4.1
RTX 5090	4.2
RTX 4090	4.2
RX 7900 XTX	4.4
RTX 4060 Ti 8GB	4.5
RTX 4070	4.5
RX 7900 XT	4.7
Arc B570	4.7
RTX 4070 Ti	4.7
RX 7900 GRE	4.8
RX 7800 XT	4.9
RTX 4070 Ti SUPER	4.9
Arc B580	4.9
RTX 4060 Ti 16GB	5.1
RTX 4060	5.3
RX 7600	5.7
RX 7700 XT	5.7
RTX 3070	6.0
RX 6800	6.1
RTX 3060 Ti	6.2
RTX 3090	6.3
RX 6800 XT	6.5
RTX 3080 10GB	6.5
RX 7600 XT	6.9
RX 6600 XT	6.9
Arc A770 16GB	7.3
RX 6700 XT	7.4
RTX 3060 12GB	7.5
RTX 3050 8GB	8.0
Arc A580	8.2

参考：TechPowerUp

ワットパフォーマンスは非常に良く、前世代を超えるけど、劇的な差でもない

ワットパフォーマンスは非常に良いです。4Kゲーム時の効率は前世代のトップ「RTX 4080 SUPER」よりも約10%良い数値となっており、「RTX 5090」よりもやや良いです。

先代から16GBというVRAMの容量こそ変わらなかったものの、GDDR7になり帯域幅も大きく向上したので、そのおかげで4Kでは効率が向上したのかなと思います。

よって、VRAMの帯域が重要な重い処理をする場合では発売時点ではトップのワットパフォーマンスの高効率GPUとなっています。

しかし、4Kにおいても10%という向上率は新世代としては物足りない感が強いです。前世代の例として「RTX 3070」から「RTX 4070」の比較を見てみると、25%～30%程度の向上となっています。

AI性能の向上があるので、そちらの活用次第では更に良い数値が期待はできるのかもしれませんが、GPUの基盤の効率自体は大きな向上に至っていないのは事実かなと思います。

レイトレーシング性能

リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。

また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。

※従来は各ゲームの幾何平均fpsの値を再計算して載せていたのですが、参考ページで全GPUの詳細fps値が示されなかったため、今回は相対性能を見ていきます。

レイトレーシングFPS(1080p 平均)
GPU名称	平均FPS
RTX 5090	136
RTX 4090	115
RTX 5080	100
RTX 4080 SUPER	95
RTX 4080	94
RTX 4070 Ti SUPER	83
RTX 4070 Ti	79
RTX 3090 Ti	74
RTX 4070 SUPER	73
RTX 3090	68
RX 7900 XTX	68
RTX 4070	65
RTX 3080 10GB	61
RX 7900 XT	60
RX 7900 GRE	51
RTX 4060 Ti 16GB	49
RX 7800 XT	48
RTX 4060 Ti 8GB	48
RTX 3070	46
RX 6800 XT	43
RX 7700 XT	41
RTX 3060 Ti	39
Arc B580	39
RTX 4060	37
RX 6800	37
Arc A770 16GB	33
RTX 3060 12GB	31
RX 6700 XT	30
RX 7600 XT	27
Arc A580	26
RTX 3050 8GB	22
RX 6600 XT	21
RX 6600	18
RX 7600	17

参考：TechPowerUp

レイトレーシングFPS(1440p 平均)
GPU名称	平均FPS
RTX 5090	146
RTX 4090	117
RTX 5080	100
RTX 4080 SUPER	93
RTX 4080	92
RTX 4070 Ti SUPER	80
RTX 4070 Ti	75
RTX 3090 Ti	72
RTX 4070 SUPER	69
RX 7900 XTX	66
RTX 3090	66
RTX 4070	61
RTX 3080 10GB	59
RX 7900 XT	57
RX 7900 GRE	48
RTX 4060 Ti 16GB	45
RX 7800 XT	43
RX 6800 XT	40
RX 7700 XT	37
Arc B580	37
RTX 3070	36
RX 6800	35
RTX 4060 Ti 8GB	34
RTX 3060 Ti	32
Arc A770 16GB	32
RTX 4060	29
RTX 3060 12GB	29
RX 6700 XT	27
RX 7600 XT	24
Arc A580	23
RTX 3050 8GB	18
RX 7600	15
RX 6600	15
RX 6600 XT	13

参考：TechPowerUp

レイトレーシングFPS(4K 平均)
GPU名称	平均FPS
RTX 5090	156
RTX 4090	119
RTX 5080	100
RTX 4080 SUPER	90
RTX 4080	89
RTX 4070 Ti SUPER	77
RTX 3090 Ti	71
RTX 3090	64
RX 7900 XTX	62
RTX 4070 Ti	58
RTX 4070 SUPER	54
RX 7900 XT	53
RTX 4070	48
RX 7900 GRE	45
RTX 3080 10GB	44
RTX 4060 Ti 16GB	41
RX 7800 XT	40
RX 6800 XT	37
RX 7700 XT	36
RX 6800	31
Arc A770 16GB	30
RTX 3070	29
RTX 4060 Ti 8GB	27
RTX 3060 Ti	26
RX 6700 XT	26
RTX 3060 12GB	23
RTX 4060	23
Arc B580	21
RX 7600 XT	21
Arc A580	19
RTX 3050 8GB	9
RX 6600 XT	8
RX 7600	7
RX 6600	7

参考：TechPowerUp

ラスタライズよりも若干小さめの向上率。VRAMが少しネックか

レイトレーシング性能を「RTX 4080 SUPER」と比較すると、向上率はフルHDで約5%程度、1440pで約7%程度、4Kで約11%といった感じです。向上率とは控えめですし、ラスタライズよりも差が若干小さくなっています。

レイトレーシングではVRAM容量が重要なので、そこが変わっていなかったのが少し影響していそうな気がします。

レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするので、約20万円～のGPUでそこのボトルネックが若干気になるというのは正直残念感が大きいかなと思います。

ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、最終的な性能としては大きく上回ることにはなると思われるので、やはり考え方次第ではあります。

DLSS

DLSS有効時のゲーム性能

DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要となるため、GeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。

4Kでレイトレーシング有効＆最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能（幾何平均）を見ていきます。

※表の「FG」は「Frame Generation（フレーム生成）」の略称です。

DLSS有効時のゲームfps（4K/RT Ultra）
GPU名称	平均fps
RTX 5090 FGx4	187.8
RTX 5080 DLSS Performance / FGx4	185.2
RTX 5080 DLSS Quality / FGx4	154.7
RTX 5090 FGx3	146.8
RTX 5080 FGx4	127.1
RTX 4080 SUPER DLSS Performance / FGx2	112.8
RTX 5090 FGx2	100.1
RTX 5080 FGx3	93.6
RTX 4080 SUPER DLSS Quality / FGx2	90.6
RTX 5090 DLSS Quality	83.8
RTX 4090 FGx2	73.4
RTX 5080 FGx2	64.8
RTX 4090 DLSS Quality	64.4
RTX 4080 SUPER FGx2	60.1
RTX 5090 ネイティブ	56.6
RTX 5080 DLSS Quality	56.3
RTX 4080 SUPER DLSS Quality	53.7
RTX 4090 ネイティブ	42.1
RX 7900 XTX FSR Quality	39.9
RTX 5080 ネイティブ	36.2
RTX 4080 SUPER ネイティブ	33.5
RX 7900 XTX ネイティブ	23.6

マルチフレーム生成を考慮すれば、「RTX 4080 SUPER」の60%以上のパフォーマンス

やはりマルチフレーム生成の効果は非常に大きいです。

「RTX 4080 SUPER」は少なくとも2025年1月時点ではマルチフレーム生成に対応していないため、追加のフレーム生成は1つのみ（x2）となっているのに対し、「RTX 5080」は1つのフレームに対して最大3つの追加フレーム（x4）なので、圧倒的な差です。

「RTX 5080」と「RTX 4080 SUPER」をどちらも一番高いフレームレートが出せるDLSS設定で比較した場合、「RTX 5080」の方が約64.2%高いパフォーマンスとなります。

フレーム生成と通常のアップスケーリングのDLSSの両方をオンにした場合、若干ギャップが縮まるため、x2とx4で2倍の差にはならないものの、基本的に1.5倍以上の差は出るので、やはり圧倒的な差です。

とはいえ、「RTX 4080 SUPER」の従来のフレーム生成（x2）だけでも非常に優れたパフォーマンスを発揮できるので、そもそもこのレベルのハイエンドGPUで追加のフレーム生成機能が必要なのか、という点は議論が必要かもしれません。

実際、上記の性能は「4Kレイトレーシングの最高設定」というやり過ぎなくらいの高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。

実際の環境ではフルHD～1440pが中心でしょうし、そうなればフレームレートは一段上がることを考えれば「RTX 4080 SUPER」でもDLSSが使える環境ならほとんどの場合で十分な性能が得られます。発売からしばらくは「RTX 4080 SUPER」よりも高価な状態が続くであろうことを考えると実用コスパ的には疑問が残るかもしれません。

とはいえ、マルチフレーム生成の効果は絶大なのは確かであり、フルで活用できれば今までの常識を覆すレベルとなっています。

コストパフォーマンス

上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。各GPUの価格は、記事執筆時点のおおよその市場最安値価格です。ラスタライズとレイトレーシング時の両方を見ていきます。

元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。

1フレームあたりの価格（ラスタライズ）

まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。

1fあたりの価格（1440p@RT無し）
GPU名称	1フレームあたりの価格	参考価格
Arc A580	571	¥24,800
RX 6600	706	¥28,800
Arc A770 16GB	729	¥39,800
RX 7600	744	¥36,980
RTX 4060	756	¥41,980
RX 7700 XT	780	¥62,980
RX 7800 XT	796	¥75,800
RTX 3060 12GB	800	¥39,980
Arc B580	811	¥49,800
RTX 4060 Ti 8GB	821	¥57,800
RTX 3050 8GB	832	¥28,800
Arc B570	842	¥44,980
RTX 3080 10GB	890	¥84,800
RTX 4070	923	¥86,800
RX 7900 XT	943	¥116,800
RX 6800 XT	962	¥89,800
RTX 4060 Ti 16GB	976	¥69,280
RTX 4070 SUPER	1015	¥109,980
RX 7900 XTX	1083	¥154,800
RTX 4070 Ti SUPER	1140	¥142,800
RTX 4080 SUPER	1165	¥169,800
RTX 5080	1246	¥198,800
RTX 4090	1808	¥323,800
RTX 5090	1816	¥393,800

参考：TechPowerUp

ラスタライズコスパは悪めで「RTX 4080 SUPER」と大差無し

価格が高価なハイエンドGPUは純粋なコスパでは悪い傾向があり、「RTX 5080」も悪いです。

円安が進んでいることも影響し、日本では「RTX 4080 SUPER」よりもやや高価となっていますし、ラスタライズの性能の向上率も10%前後の向上と小さいので、コスパも先代から少し悪化しています。

とはいえ、前世代で人気だった「RTX 4070 Ti SUPER」と比べて劇的に悪いというほどではないですし、「RTX 4090 / 5090」よりは遥かにマシな数値となっています。

DLSS 4のマルチフレーム生成やニューラルレンダリングのことを考えると、4K高設定などでは実用コスパはやや改善されると思いますし、4K高リフレッシュレート前提であれば有力な選択肢の一つにはなるかと思います。

1フレームあたりの価格（レイトレーシング）

次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。

1fあたりの価格（1440p@RT）
GPU名称	1フレームあたりの価格	参考価格
Arc A580	925	¥24,800
Arc A770 16GB	1188	¥39,800
Arc B580	1258	¥49,800
RTX 3060 12GB	1351	¥39,980
Arc B570	1371	¥44,980
RTX 4060	1510	¥41,980
RTX 4060 Ti 16GB	1546	¥69,280
RX 7700 XT	1559	¥62,980
RTX 3050 8GB	1591	¥28,800
RTX 4060 Ti 8GB	1661	¥57,800
RTX 4070 Ti SUPER	1828	¥142,800
RTX 4080 SUPER	1862	¥169,800
RX 7900 XT	1887	¥116,800
RX 7600 XT	1917	¥50,800
RTX 5080	2035	¥198,800
RX 7900 XTX	2190	¥154,800
RX 7600	2465	¥36,980
RTX 5090	2787	¥393,800
RTX 4090	2946	¥323,800

参考：TechPowerUp

レイトレーシングでもコスパは悪く、「RTX 4080 SUPER」を少し下回るが、実用性能は高い

価格の高さが主な原因なので、コスパに関してはレイトレーシングでも悪いです。

しかし、レイトレーシングはマルチフレーム生成やニューラルレンダリングが大きく貢献しそうなので、それらを活用する前提なら実用性能は他のハイエンドGPUと比べても非常に高いです。そこも考慮すれば、一気に地位を上げることになります。

とはいえ、「RTX 4080 SUPER」の性能でも従来のフレーム生成（x2）は利用でき、それがあれば多くのゲームで快適な性能自体は手に入るので、そのあたりも含めての評価は難しいところです。

AI・クリエイティブ用途

比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。

一般的な動画編集等の基準性能としてFP32（単精度浮動小数点演算）の理論演算性能、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」の性能をそれぞれ見ていきたいと思います。

また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー（HotHardware）を参考にしています。「Ryzen 7 9800X3D」と「DDR5-6000 CL28 32GB（16GBx2）」が使用されています。他の条件について気になる方は上述の参考リンクをご覧ください。

理論演算性能（FP32）

FP32（単精度浮動小数点演算）は、理論演算性能を示す一つの指標です。単位はTFLOPS（テラフロップス）を用います。実際のテストから算出するものではなく、シェーダーユニット数（対応の演算器の数）とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。

一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能（データ量が多い処理の場合）によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います（完全に一致する訳ではないので注意）。

FP32（単精度浮動小数点演算）
GPU名称	FP32（TFLOPS）
RTX 5090 32GB 1792GB/s	104.8
RTX 4090 24GB 1008GB/s	82.58
RX 7900 XTX 24GB 960GB/s	61.42
RTX 5080 16GB 960GB/s	56.28
RTX 4080 SUPER 16GB 736.3GB/s	52.22
RX 7900 XT 20GB 800GB/s	51.48
RTX 4080 16GB 716.8GB/s	48.74
RX 7900 GRE 16GB 576GB/s	45.98
RTX 4070 Ti SUPER 16GB 672GB/s	44.10
RTX 4070 Ti 12GB 504GB/s	40.09
RX 7800 XT 16GB 624GB/s	37.32
RTX 4070 SUPER 12GB 504GB/s	35.48
RX 7700 XT 12GB 432GB/s	35.17
RTX 3080 10GB 760GB/s	29.77
RTX 4070 12GB 504GB/s	29.15
RX 7600 XT 16GB 288GB/s	22.57
RTX 4060 Ti 8GB / 16GB 288GB/s	22.06
RTX 3070 Ti 8GB 608GB/s	21.75
RX 7600 8GB 288GB/s	21.75
RX 6800 XT 16GB 512GB/s	20.74
RTX 3070 8GB 448GB/s	20.31
Arc A770 16GB 16GB 560GB/s	17.20
RTX 3060 Ti 8GB 448GB/s	16.20
RX 6800 16GB 512GB/s	16.17
RTX 4060 8GB 272GB/s	15.11
Arc B580 12GB 456GB/s	13.67
RX 6700 XT 12GB 384GB/s	13.21
RTX 3060 12GB 12GB 360GB/s	12.74
Arc B570 10GB 380GB/s	11.52
RX 6600 XT 8GB 256GB/s	10.61
RTX 3050 8GB 224GB/s	9.10
RX 6600 8GB 224GB/s	8.93

理論性能コスパも悪い

「RTX 5080」のFP32（単精度浮動小数点演算）の理論性能は約56.28TFLOPSと非常に優れていますが、価格が非常に高価なのでコスパは悪いです。

VRAM容量も価格の割には少ないので、理論性能コスパ的には「RTX 5080」はかなり弱めです。

Blender（GPUレンダリング）

「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。

「Blender 4.3」では、Nvidia Optix、Intel oneAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。

Blender Benchmarks（4.3.0）
GPU名称	総合スコア（幾何平均）
RTX 5090	4769
RTX 4090	3503
RTX 5080	2819
RTX 4080	2653
RX 7900 XTX	1324

参考：HotHardware

Blenderのレンダリングは「RTX 4080」とあまり変わらず

BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、「RTX 4080 SUPER」とあまり変わりません。わずか約6.3%上回る性能でした。

とはいえ、性能自体は非常に高性能で、高負荷時の効率も非常に優れているので、重いレンダリング処理を日常的に大量に行うのであれば、魅力は十分あると思います。

MLPerf Client（AI性能）

「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。

幅広い環境で使えるONNX（DirectML）をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。

MLPerf Client 総合スコア（幾何平均）
GPU名称	総合スコア（幾何平均）
RTX 5090	244.68
RTX 4090	176.57
RTX 5080	155.06
RTX 4080	134.76
RX 7900 XTX	127.44

参考：HotHardware

AIは汎用のONNX（DirectML）では「RTX 4080」を約15%上回る

AIでは大きめの向上率が見られました。Tensorコアに最適化されていない場合のAI処理（ONNX）でも、「RTX 4080 SUPER」を約15%上回る性能でした。

マルチフレーム生成など、機能面での差がない項目としては、ここまでで一番大きな差です。

コア数の増加率（約5%）よりもやや大きめの向上率となっており、AI性能の効率が上がっていることは確かに感じられました。ただし、劇的な差かというとそうでもないです。

Blackmagic RAW（デコード速度）

「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するベンチマークです。GPUを使用する場合にはCUDAかOpenCLを使うことになり、CUDAを使えるGeForceが有利な傾向があります。

また、このテストは圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率（12:1）での8Kおよび4Kのテストでのデコード速度（1秒あたりのフレーム数）を見ていきます。

Blackmagic RAW 4.3.1 デコード速度（8K/12:1）
GPU名称	スコア
RTX 5090	251
RTX 5080	216
RTX 4090	202
RTX 4080	180
RX 7900 XTX	108

参考：HotHardware

Blackmagic RAW 4.3.1 デコード速度（4K/12:1）
GPU名称	スコア
RTX 5090	1005
RTX 5080	867
RTX 4090	810
RTX 4080	721
RX 7900 XTX	433

参考：HotHardware

「RTX 4080」を約20%上回るRAWデコード速度

RAWのデコード速度テストでは、「RTX 4080」を20%ほど上回る性能となっていました。大きめの向上率です。

非常に優れたメディアエンジン性能で、「RTX 5090」との差も約10%台に留まっています。メディア関連の処理はGPU以外がボトルネックになり易いものも多く、特にハイエンドGPUでは他要素がネックになるケースも多めの印象なので、その影響が出ているかもしれません。

ハイエンドなメディア処理性能を求める上でコスパも多少意識するなら強力な選択肢の一つになると思います。ただし、特にクリエイティブ用途でのコスパを考える場合には価格の割には少ないVRAM容量にも注意が必要です。

ちなみに、このテストとは別の話になりますが、「RTX 5080」ではNVENCとNVDEC（エンコーダとデコーダ）が2基ずつ搭載されており、「RTX 4080」NVDECが1基だけだった先代よりも少し向上しているため、メディア性能を重視するならその点でも優れています。

Procyon Stable Diffusion（AIイラスト生成）

現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。

「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。

ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。

また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT（NVIDIA）、Open VINO（Intel）、ROCm（AMD）といったものがありますが、2024年12月時点ではROCm（AMD）は現状Windowsでのネイティブ動作に対応していません（Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど）。

そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML（ONNX）の3つとなっており、AMD製のGPU（Radeon等）のみ汎用のDirect ML（ONNX）を使わざるを得ず、低めの性能となっている点に注意が必要です。

※しかし、記事執筆時点ではRTX 50（Blackwell）がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。

Procyon Stable Diffusion XL 総合スコア（1024×1024）
GPU名称	スコア
RTX 4090（Tensor RT）	5073
RTX 5090（ONNX）	5073
RTX 4090（ONNX）	3985
RTX 4080（Tensor RT）	3437
RTX 5080（ONNX）	2920
RTX 4080（ONNX）	2499
RX 7900 XTX（ONNX）	1458

参考：HotHardware

TensorRTでなくても優れた性能で、「RTX 4080」よりも約16.8%高速

Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。

しかし、代わりに汎用のONNX（DirectML）での結果を確認してみても、非常に優れた性能を発揮することがわかります。ONNX同士の比較では「RTX 4080」よりも約16.8%高速で、「RX 7900 XTX」の約2倍の性能です。

先代からの向上率はコア数の増加率（約5%）よりもやや大きめの向上率となっており、やはりAI性能効率の強化を感じることができました。しかも、TensorRT無しでも高い向上率が感じられたのは素晴らしいです。

消費電力の増加率はそこまでには至っていないので、AIに関してのワットパフォーマンスはゲームよりもやや高くなることも期待できます。

ただし、やはり劇的な向上率かと言うとそうでもないですし、VRAM容量が重要な画像生成AIでは16GBでも余裕があるというほどでもありませんので、既存の「RTX 4070 Ti SUPER」やこれから出てくるであろう「RTX 5070 Ti」と比較して実用コスパでどうなのかという話にはなると思います。

まとめ

GeForce RTX 5080

良い点

「RTX 4080 SUPER」を少し上回る非常に優れた処理性能（AI関連はやや大きめの性能向上率）
希望小売価格は「RTX 4080 SUPER」と同じ（ただし、日本では円安で価格上昇）
非常に優れたワットパフォーマンス（特に重い処理）
DLSS 4のマルチフレーム生成対応
非常に優れたメディアエンジン

気になる点

非常に高価（想定価格：約20万円～）
価格の割には少ない16GB VRAM
消費電力が多い（TGP：360W）
「RTX 4080 SUPER」からの性能向上率は小さめ（マルチフレーム生成やAI面を除く）
サイズが大型
非常に高性能なので、フルHDなど低負荷な環境ではパフォーマンスが制限されるケースがある

RTX 5080：AIの性能＆新機能を考慮しなければ「RTX 4080 SUPER」から少しの向上

「RTX 5080」は「RTX 4080 SUPER」を上回る性能を発揮するハイエンドGPUです。1440pレイトレなどの重い処理でも十分実用的に運用できる高性能GPUです。

最近はAIの注目度が高いためハイエンドGPUは非常に需要があるにも関わらず、希望小売価格は「RTX 4080 SUPER」と同じ999ドルというのも良心的で嬉しいです。日本においてはRTX 40登場当時よりも円安が進行しているためにやや高価ですが、ベース価格が据え置きというのはかなり頑張った価格設定だと思います。

ただし、「RTX 4080 SUPER」と比較したコア増加率はわずか5%ほどで、VRAM容量も16GBのままなのは残念です。

DLSSを使用しない場合のゲーム性能を「RTX 4080 SUPER」と比較すると、おおよそ10%前後程度の向上に留まっています（設定やゲームタイトルによって多少前後）。基本性能は先代から小さな向上です。

製造プロセスがほぼ変わらないようなので、ある程度想定はできましたが、基本性能の向上は思ったよりも小さめだったのは残念でした。

そして、特にVRAM容量が16GBのままなのが非常に残念です。16GBという容量だけ見れば強力なのは確かですが、約20万円～のGPUとしては少ないです。

最近注目の用途であるレイトレーシングやAIやメタバースなどではVRAM容量が重要なことが多いので、今はハイエンド用途だと16GBでも余裕がある容量ではない時代になっています。VRAMはいくらあっても嬉しいレベルです。

20万円のGPUを購入してVRAMという変更ができない部分で不満を感じるのは渋いですから、もうちょっと頑張って欲しかったというのが本音です。

微妙な点を先に挙げてしまいましたが、前世代からAI性能が大きく強化されている点は魅力です。NVIDIA公表のTensorコアの理論性能では「RTX 4080 SUPER」を約2.15倍も上回っています。実際、AI関連処理では高めの向上率を記録しました。

特に、ゲームではDLSS 4（マルチフレーム生成含む）を最大限活用すれば、「RTX 4080 SUPER」を60%以上上回るフレームレートを出すことも可能であり、その場合には4Kレイトレすら十分実用的です。

ONNX（DirectML）を利用するゲーム以外の汎用的なAI処理においても、TensorRT無しで「RTX 4080 SUPER」を15%ほど上回る性能を発揮することが確認できました。

Tensorコアに対しての最適化が進めば更に高い性能となることも考えられますし、AI面では価格上昇を考慮しても価値を感じることはできるレベルにはなっているのではないかと思います。

また、電力面も優れています。TGPの360Wという数字を見たときは心配の方が大きかったですが、実際にはそこまで多くはなく、ゲーム時平均は320W～330Wでした（リファレンス仕様では）。

前世代の「RTX 4080 / 4080 SUPER」もTGP（320W）よりも消費電力がやや少ない傾向でしたので、先代と比べるとやはり増加はしているものの、思ったほどはネックではなく、電源や排熱面での扱いもほぼ同じで済みます。

ワットパフォーマンスでは、4Kゲーム（ラスタライズ）時で前世代トップの「RTX 4080 SUPER」よりも1割ほど良い数値を記録しました。2025年1月時点では高負荷な処理ではトップの効率のGPUに君臨しました。

…という感じで現状で優秀なのは間違いないですが、前世代のとき（RTX 30 → RTX 40）のときはDLSS無しのゲームでも30%近い向上が見られたりもしたので、それを考えると正直物足りない感はあったりもします。

ただし、一応擁護をしてみると、DLSS 4のマルチフレーム生成や、その他のAIで効率化できる処理なら更に差を付けることが出来るはずではあります。

そんな感じで、AI面をどう取り入れるかによって性能が大きく変わるので評価はし辛いですが、AIをフル活用する前提なら、「RTX 4080 SUPER」をやや大きめに上回りますし、DLSS 4のマルチフレーム生成まで考慮すれば圧倒的に上回るものの、AIをそこまで活用しないなら「RTX 4080 SUPER」からの向上率は小さいです。

「RTX 4080 SUPER」でも基本性能は十分に高く、フレーム生成も従来のものがあれば大体のゲームでは快適でしたから、実用性の差は現状ではほとんどの人にとって感じにくいのGPUではある思います。

といった感じで、本記事は以上になります。ご覧いただきありがとうございました。