「GeForce RTX 5090」ざっくり評価【性能比較】

当サイトはアフィリエイト広告を利用しています

この記事には広告を含む場合があります。

記事内で紹介する商品を購入することで、当サイトに売り上げの一部が還元されることがあります。

Intel「GeForce RTX 5090」のざっくり性能比較・評価です。米国での発売予定日は2025年1月30日ですが、発売前にレビューが解禁されたので、海外レビューを参考に性能をざっくりと確認していきます。

注意

本記事の情報は記事執筆時点（2025年1月27日）のものです。ご覧になっている際には異なる可能性があるため注意してください。

参考

https://www.nvidia.com/ja-jp/geforce/graphics-cards/50-series/

https://www.techpowerup.com/review/nvidia-geforce-rtx-5090-founders-edition/

https://hothardware.com/reviews/nvidia-geforce-rtx-5090-review

目次非表示

仕様
ゲーミング性能（ラスタライズ）
電力関連
- 消費電力
- ワットパフォーマンス
レイトレーシング性能
- レイトレーシング性能
DLSS
- DLSS有効時のゲーム性能
コストパフォーマンス
- 1フレームあたりの価格（ラスタライズ）
- 1フレームあたりの価格（レイトレーシング）
AI・クリエイティブ用途
まとめ

目次へ

仕様

まずは主要な仕様を表にまとめて載せています。

簡易比較表

※価格は2025年1月27日時点での米での希望小売価格です（判明しているもののみ）。
※GPU名のリンクはAmazonのものです。

GPU	シェーダーユニット数	メモリタイプ	VRAM速度 VRAM帯域幅	レイトレ用ユニット数	ダイサイズ（おおよそ）	消費電力 (TGP等)	希望小売価格
RTX 5090	21760	GDDR7 32GB 512bit	28.0Gbps 1792GB/s	170	750㎟	575W	1,999ドル
RTX 4090	16384	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	128	608㎟	450W	1,599ドル
RTX 5080	10752	GDDR7 16GB 256bit	30.0Gbps 960GB/s	84?	?㎟	360W	999ドル
RTX 4080 SUPER	10240	GDDR6X 16GB 256bit	23.0Gbps 736.3GB/s	80	380㎟	320W	999ドル
RTX 4080	9728	GDDR6X 16GB 256bit	22.4Gbps 716.8GB/s	76	380㎟	320W	1,199ドル →市場廃止
RTX 5070 Ti	8960	GDDR7 16GB 256bit	28.0Gbps 896GB/s	70?	?㎟	300W	749ドル
RX 7900 XTX	6144	GDDR6 24GB 384bit	20Gbps 960GB/s	96	36.6㎟*6 + 300㎟	355W	999ドル
RX 7900 XT	5376	GDDR6 20GB 320bit	20Gbps 800GB/s	84	36.6㎟*6 + 300㎟	315W	799ドル →749ドル?
RTX 4070 Ti SUPER	8448	GDDR6X 16GB 256bit	21.0Gbps 672GB/s	66	295㎟	285W	799ドル
RTX 4070 Ti	7680	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	60	295㎟	285W	799ドル →市場廃止
RTX 5070	6144	GDDR7 12GB 192bit	28?Gbps 672GB/s	48?	?㎟	250W	549ドル
RTX 3090 Ti	10752	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	84	628.4㎟	450W	1,499ドル
RTX 3090	10496	GDDR6X 24GB 384bit	19.5Gbps 936GB/s	82	628.4㎟	350W	1,299ドル
RX 7900 GRE	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	36.6㎟*6 + 300㎟	260W	549ドル
RX 6950 XT	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	519㎟	335W	949ドル
RX 6900 XT	5120	GDDR6 16GB 256bit	16Gbps 512GB/s	80	519㎟	300W	699ドル
RTX 3080 Ti	10240	GDDR6X 12GB 384bit	19Gbps 912GB/s	80	628.4㎟	350W	1,099ドル
RTX 3080 10GB	8704	GDDR6X 10GB 320bit	19Gbps 760GB/s	68	628.4㎟	320W	699ドル
RTX 4070 SUPER	7168	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	56	295㎟	220W	599ドル
RTX 4070	5888	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	46	295㎟	200W	549ドル前：599ドル
RX 7800 XT	3840	GDDR6 16GB 256bit	19.5Gbps 624GB/s	60	37.5㎟*4 + 200㎟	263W	499ドル
RX 6800 XT	4608	GDDR6 16GB 256bit	16Gbps 512GB/s	72	519㎟	300W	599ドル
RTX 3070 Ti	6144	GDDR6X 8GB 256bit	19Gbps 608GB/s	48	392㎟	290W	599ドル
RX 6800	3840	GDDR6 16GB 256bit	16Gbps 512GB/s	60	519㎟	250W	549ドル
RX 7700 XT	3456	GDDR6 12GB 192bit	18Gbps 432GB/s	54	37.5㎟*4 + 200㎟	245W	419ドル前:449ドル
RTX 4060 Ti 8GB	4352	GDDR6 8GB 128bit	18Gbps 288GB/s	34	190㎟	160W	399ドル
RTX 3070	5888	GDDR6 8GB 256bit	14Gbps 448GB/s	46	392㎟	220W	499ドル
RX 6750 XT	2560	GDDR6 12GB 192bit	18Gbps 432GB/s	40	336㎟	250W	419ドル
RTX 3060 Ti	4864	GDDR6 8GB 192bit	14Gbps 448GB/s	38	392㎟	200W	399ドル
RX 6700 XT	2560	GDDR6 12GB 192bit	16Gbps 384GB/s	40	336㎟	230W	379ドル
Arc A770 16GB	4096	GDDR6 16GB 256bit	17.5Gbps 560GB/s	32	406㎟	225W	349ドル
Arc A770 8GB	4096	GDDR6 8GB 256bit	16Gbps 512GB/s	32	406㎟	225W	329ドル
Arc B580	2560	GDDR6 12GB 192bit	19Gbps 456GB/s	20	272㎟	190W	249ドル
RX 7600 XT	2048	GDDR6 16GB 128bit	18Gbps 288GB/s	32	204㎟	190W	329ドル
RTX 4060	3072	GDDR6 8GB 128bit	17Gbps 272GB/s	24	156㎟	115W	299ドル
Arc B570	2304	GDDR6 10GB 160bit	19Gbps 380GB/s	18	272㎟	150W	219ドル
RX 6650 XT	2048	GDDR6 8GB 128bit	17.5Gbps 288GB/s	32	237㎟	180W	299ドル
RX 7600	2048	GDDR6 8GB 128bit	18Gbps 288GB/s	32	204㎟	165W	269ドル
RX 6600 XT	2048	GDDR6 8GB 128bit	16Gbps 256GB/s	32	237㎟	160W	–
Arc A750	3584	GDDR6 16GB 256bit	16Gbps 512GB/s	28	406㎟	225W	289ドル
RX 6600	1792	GDDR6 8GB 128bit	14Gbps 224GB/s	28	237㎟	132W	239ドル
RTX 3060 12GB	3584	GDDR6 12GB 192bit	15Gbps 360GB/s	28	276㎟	170W	329ドル
RTX 3050	2560	GDDR6 8GB 128bit	15Gbps 224GB/s	20	276㎟	130W	249ドル

前世代との比較

「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。

RTX 50シリーズではTensorコアが「FP4」に新たに対応したことで、前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われます。

コア数による表記は、コア性能が上がっても向上を感じられないという問題があったので、表記を切り替える良い機会になったのかなと思います。

ただし、RTX 40 シリーズのAI性能は「FP8」の数値なのに対し、RTX 50 シリーズのAI性能は「FP4」なので、精度が低下している点には注意してください（ただし、FP4でも十分な精度だと言われている）。

GPU	希望小売価格	GPU				VRAM			TGP
GPU	希望小売価格	CUDAコア	Tensorコア (AI TOPS)	RTコア (TFLOPS)	クロック最大(GHz)	容量/タイプ	バス幅	帯域幅(GB/s)	TGP
RTX 5090	1999ドル	21760	3352	318	2.41	32GB GDDR7	512bit	1792	575W
RTX 4090	1599ドル	16384	1321	191	2.52	24GB GDDR6X	384bit	1008	450W
RTX 5080	999ドル	10752	1801	171	2.62	16GB GDDR7	256bit	960	360W
RTX 4080 SUPER	999ドル	10240	836	121	2.55	16GB GDDR6X	256bit	736	320W
RTX 5070 Ti	749ドル	8960	1406	133	2.45	16GB GDDR7	256bit	896	300W
RTX 4070 Ti SUPER	799ドル	8448	780	102	2.61	16GB GDDR6X	256bit	672	285W
RTX 4070 SUPER	599ドル	7168	568	93	2.48	12GB GDDR6X	192bit	504	220W
RTX 5070	549ドル	6144	988	94	2.51	12GB GDDR7	192bit	672	250W
RTX 4070	549ドル	5888	466	67	2.48	12GB GDDR6X 12GB GDDR6	192bit	504	200W

今回見ていくのはNVIDIA「GeForce RTX 5090」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」の最上位のハイエンドモデルです。

希望小売価格は1,999ドルで、国内想定価格は393,800円～となっています。ただし、想定価格は少数在庫のいわゆる”アリバイ価格”とも言われており、初期在庫を逃すと数か月は更に高額な状態が続くとも噂されている点に注意です。

CUDAコア数は21,760という圧倒的な数を誇り、「RTX 4080 SUPER」の2倍以上という驚異的なコア数です。「RTX 4090」と比較すると32.8%上回るコア数で、RTコアやTensorコアなどの各コア類も基本32.8%ほど多い数です。VRAMも24GBから32GBに増量されています。

「RTX 4090」が現在でも他GPUを圧倒するGPUだったにも関わらず、それをも更に大きく超える規格外のウルトラハイエンドGPUとなっています。

また、コア・ユニット数の増加だけでなく、RTX 50では各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。

特に気になるのはTensorコアのAI性能で、NVIDIA公表の「RTX 5090」の理論性能（FP4）は 3352 TOPSとなっており、これは「RTX 4090」の約2.54倍という驚異的な向上率です。

前世代ではFP8（8ビット）までの対応だったのが、FP4（4ビット）に対応したことで性能が飛躍的に向上しました。精度は落ちるものの、FP4でも十分な精度が得られると言われています。

そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されましたし、AIをとにかく重視するという姿勢がよく見て取れるのが「RTX 50シリーズ」となっています。

VRAMもGDDR7へとアップグレードされており、「RTX 5090」では32GBという圧倒的大容量が搭載されます。バス幅も512bitまで拡張され、帯域幅は1792 GB/sとなっています。圧倒的大容量かつ高速なメモリシステムとなっています。

レイトレーシングや生成AIやメタバースなど、最近利用が進んでいる用途はどれもVRAMが非常に重要なので、特にそれらの性能を最大限高めたい人向けのGPUとなっています。

ただし、「RTX 50シリーズ」はプロセス面に関しては前世代からほとんど進化していない点は覚えておいて良いかもしれません。

製造プロセスは前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも「5nm EUV」で製造されているという噂です。

そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」で微細化はされていない可能性が高そうです。そのため、主に電力効率（ワットパフォーマンス）面では大きな改善が見られないかもしれないのが懸念点です。

その辺りとも関連性もある部分として、気になるのはやはり消費電力と価格です。

まず消費電力について、「RTX 5090」のTGPは575Wとなっています。「RTX 4090」の450Wを約28%上回る超高消費電力です。ケーブル1本で600Wまで対応できる「12VHPWR / 12V-2×6」が登場したのは記憶に新しいと思いますが、その制限のギリギリです。

単純な消費電力の多さがネックなのはもちろんですが、気になるのは効率です。コア類の増加が約32.8%なのに対し、電力増加が約28%ということで、その差はわずか5%程度です。

性能の大幅向上はほぼ間違いないものの、ワットパフォーマンスではさほど変わらないのかなという印象を受けます。

次に価格ですが、希望小売価格が1,999ドルで国内想定価格が393,800円～と超高額です。日本においては円安が高額さに拍車をかけているのも厳しいところです。

ただし、実は「RTX 4090（1,599ドル）」と比較すると割と良心的な価格です。コア類およびVRAM容量の増加は約1.33倍ですが、価格は約1.25倍に留まっています。

AMDのRadeon RXがハイエンドモデルを出さないのがほぼ確実視されている上、AI需要も凄いですから、多少高くても間違いなく売れる状況なのにも関わらずに、この価格設定は良心的だと思います。前述のプロセスがほぼ据え置きに近い形というのも価格を上げずに済んだ理由なのかもしれません。

とはいえ、ほとんどの人にとっては超絶オーバースペックということもあり、約40万円～というとんでもなく高い価格はデメリットかなと思います。

DLSS 4、ニューラルレンダリング

「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。

まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。

DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。

また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。

マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。

次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。

従来はグラフィックスAPI内でTensorコア（AI）を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。

これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。

DLSSやFSRといった別機能ではなく、グラフィックスAPI（DirectX）の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR（レイトレーシング）単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。

といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。

ゲーミング性能（ラスタライズ）

ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。

まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能（ラスター性能）を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。

使用されたグラフィックボードは「NVIDIA GeForce RTX 5090 Founders Edition（通称FE版）」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。

フルHD（1920×1080）

フルHD（1920×1080）です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。

平均FPS(1080p 最高設定)
GPU名称	平均FPS
RTX 5090	251.1
RTX 4090	225.0
RTX 4080 SUPER	190.3
RTX 4080	187.8
RX 7900 XTX	184.1
RTX 4070 Ti SUPER	166.8
RX 7900 XT	164.3
RTX 4070 Ti	160.0
RTX 4070 SUPER	148.0
RTX 3090	141.9
RX 7900 GRE	141.3
RTX 4070	129.8
RX 7800 XT	128.3
RTX 3080 10GB	127.2
RX 6800 XT	125.8
RX 7700 XT	110.6
RTX 3070	100.8
RTX 4060 Ti 16GB	99.9
RTX 4060 Ti 8GB	98.7
RX 6700 XT	88.7
RTX 3060 Ti	88.2
Arc B580	82.6
RX 7600 XT	78.9
RTX 4060	78.6
Arc B570	72.9
RX 7600	72.1
Arc A770 16GB	71.8
RX 6600 XT	68.8
RTX 3060 12GB	67.4
RX 6600	59.0
Arc A580	58.5
RTX 3050 8GB	48.3

参考：TechPowerUp

フルHDは低負荷すぎて参考性能だけど、圧倒的な性能

フルHDのラスタライズは「RTX 5090」にとっては低負荷すぎて、ほとんどのゲームではCPUなどのボトルネックが先にきてしまうので参考レベルの性能です。

しかし、その性能はやはり圧倒的で「RTX 4090」を約11.6%上回っています。重いゲームが中心かつ最高設定ながら、平均fpsは251に達しています。

1440p（2560×1440）

WQHD（2560×1440）です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。

平均FPS（1440p 最高設定）
GPU名称	平均FPS
RTX 5090	216.8
RTX 4090	179.1
RTX 4080 SUPER	145.8
RTX 4080	143.4
RX 7900 XTX	142.9
RTX 4070 Ti SUPER	125.3
RX 7900 XT	123.8
RTX 4070 Ti	117.7
RTX 4070 SUPER	108.4
RTX 3090	107.6
RX 7900 GRE	104.5
RX 7800 XT	95.2
RTX 3080 10GB	95.3
RX 6800 XT	93.3
RTX 4070	94.0
RX 7700 XT	80.7
RTX 3070	73.8
RTX 4060 Ti 16GB	71.0
RTX 4060 Ti 8GB	70.4
RX 6700 XT	64.3
RTX 3060 Ti	64.3
Arc B580	61.4
RX 7600 XT	55.7
RTX 4060	55.5
Arc A770 16GB	54.6
Arc B570	53.4
RX 7600	49.7
RTX 3060 12GB	48.6
RX 6600 XT	47.7
Arc A580	43.4
RX 6600	40.8
RTX 3050 8GB	34.6

参考：TechPowerUp

1440pでは「RTX 4090」を約21%上回り、RTX 4070 SUPERの約2倍の性能

ここからが本番です。1440pでは「RTX 4090」を約21%上回り、「RTX 4070 SUPER」の約2倍という圧巻の性能です。

従来なら大分ヘビーな条件（1440pで重量級のゲームを最高設定）だとしてもどのタイトルでも基本快適です。DLSSなどのアップスケーリングやフレーム生成も無しでこの性能なので、とんでもないです。

4K（3840×2160）

「超高解像度の代名詞」という感じの解像度の4K（3840×2160）です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。

平均FPS(4K 最高設定)
GPU名称	平均FPS
RTX 5090	147.1
RTX 4090	109.2
RTX 4080 SUPER	85.5
RX 7900 XTX	84.7
RTX 4080	84.1
RTX 4070 Ti SUPER	72.3
RX 7900 XT	71.5
RTX 4070 Ti	66.3
RTX 3090	64.5
RTX 4070 SUPER	60.9
RX 7900 GRE	59.3
RTX 3080 10GB	55.9
RX 7800 XT	54.5
RTX 4070	52.7
RX 6800 XT	53.1
RX 7700 XT	44.6
RTX 3070	42.0
RTX 4060 Ti 16GB	38.6
RTX 4060 Ti 8GB	38.5
Arc B580	36.2
RTX 3060 Ti	36.0
RX 6700 XT	35.6
Arc A770 16GB	31.8
Arc B570	30.9
RX 7600 XT	30.3
RTX 4060	29.7
RTX 3060 12GB	27.4
RX 7600	24.7
RX 6600 XT	24.7
Arc A580	24.6
RX 6600	20.7
RTX 3050 8GB	18.7

参考：TechPowerUp

4Kでは「RTX 4090」を約34.7%上回る性能で、1440pから更に大きく差を広げる

4Kでは更に凄い性能となっており、「RTX 4090」を約34.7%上回る性能です。1440pから差を14%近くも広げています。コアの増量分である32.8%も超えた向上率となっています。

アーキテクチャに更新による向上も少しはあると思うものの、製造プロセスの質は恐らくほぼ変わらないず、最大クロックもわずかに低下していますから、それで1440pから4Kでこの向上率ということは、現状では1440pですら「RTX 5090」にとっては低負荷で、大きなボトルネックになってしまっているということだと思われます。

比較対象の「RTX 4090」が現在でも十分なウルトラハイエンドGPUなのに、これだけの差を付けているのが驚きです。「RTX 4090」でもフルHDや1440pでは多少のボトルネックが発生しているとは思うのですが、それを感じさせないくらい大きな性能差があります。

試しに他GPUと比べてみると、「RTX 4070 Ti SUPER」の約2倍の性能だったりなど、信じられないくらいの高性能となっています。

重量級ゲームの4Kでの高フレームレート運用を目指すのであれば、非常に魅力的なGPUだと思います。

電力関連

消費電力

ゲームプレイ時（高負荷時）の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」で、解像度は「3840×2160（4K）」です。

GPU平均消費電力（ゲーミング）
GPU名称	消費電力
RTX 4060	128
RTX 3050 8GB	132
RTX 4060 Ti 8GB	152
RX 6600 XT	152
Arc B570	154
RX 7600	154
RTX 4060 Ti 16GB	165
RTX 3060 12GB	183
Arc B580	185
RX 7600 XT	198
RTX 4070	201
RTX 3060 Ti	205
Arc A580	209
RX 6700 XT	217
RTX 4070 SUPER	218
RTX 3070	232
RX 6800	233
Arc A770 16GB	235
RX 7700 XT	236
RX 7800 XT	250
RX 7900 GRE	265
RTX 4070 Ti	277
RX 6800 XT	294
RTX 4080 SUPER	302
RTX 4070 Ti SUPER	304
RTX 4080	304
RX 7900 XT	312
RTX 3080 10GB	336
RX 7900 XTX	360
RTX 3090	368
RTX 4090	411
RTX 5090	587

参考：TechPowerUp

消費電力はやはり多すぎる

ゲーム時の平均消費電力は587Wとなっており、TGPの575Wに違わない圧倒的な消費電力です。電源ユニットも超大容量＆高品質なものが必須となっています。

NVIDIA公式の必要システム電力は1000Wとなっていますが、変換時のロスやハイエンドPCの他パーツの消費電力も加味すると、実際には最低でも1200Wは欲しいかなという感じだと思います。

300W前後のGPUなら750W～850W程度で済むと考えて費用を比較すると、1万円～3万円くらいの追加費用が掛かることになると思いますが、GPU自体の金額を考えると小さな追加費用だと錯覚しそうなのが怖いですね。

また、表には載せていませんが、アイドル時や軽負荷な処理時の消費電力が他のGPUと比べると高いのも弱点です。

アイドル時でも約30Wと多めの電力を消費し、「RTX 4090」でも22W程度、他のRTX 40でも大体10W前半だったことを考えると、非常に多いです。また、ビデオ再生時にも似たような傾向の差の消費電力を必要とします。

超大量のコアと超大容量VRAMを持っているため、軽負荷でも稼働するためにはそれなりの電力が必要になります。大きなネックとなるほどではないと思いますが、重い処理をしないのなら、やはり微妙なGPUです。

ワットパフォーマンス

ワットパフォーマンス（電力効率）を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています

環境は消費電力はおよび4Kは「Cyberpunk 2077（Ultra/レイトレ無効）」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。

ワットパフォーマンス（1080p/25ゲーム平均）
GPU名称	1フレームあたりの消費電力
RTX 4070 SUPER	1.47
RTX 4060 Ti 8GB	1.54
RTX 4070	1.55
RTX 4080 SUPER	1.59
RTX 4080	1.62
RTX 4060	1.63
RTX 4060 Ti 16GB	1.65
RTX 4070 Ti	1.73
RTX 4070 Ti SUPER	1.82
RTX 4090	1.83
RX 7900 GRE	1.88
RX 7900 XT	1.90
RX 7800 XT	1.95
RX 7900 XTX	1.96
Arc B570	2.13
RX 7700 XT	2.13
RX 7600	2.14
RX 6800	2.19
RX 6600 XT	2.21
Arc B580	2.24
RTX 3070	2.30
RTX 3060 Ti	2.32
RX 6800 XT	2.34
RTX 5090（参考）	2.34
RX 6700 XT	2.44
RX 7600 XT	2.51
RTX 3090	2.60
RTX 3080 10GB	2.64
RTX 3060 12GB	2.67
RTX 3050 8GB	2.73
Arc A770 16GB	3.27
Arc A580	3.57

参考：TechPowerUp

ワットパフォーマンス（4K/Cyberpunk 2077）
GPU名称	1フレームあたりの消費電力
RTX 4080 SUPER	4.0
RTX 4080	4.0
RTX 4070 SUPER	4.1
RTX 5090	4.2
RTX 4090	4.2
RX 7900 XTX	4.4
RTX 4060 Ti 8GB	4.5
RTX 4070	4.5
RX 7900 XT	4.7
Arc B570	4.7
RTX 4070 Ti	4.7
RX 7900 GRE	4.8
RX 7800 XT	4.9
RTX 4070 Ti SUPER	4.9
Arc B580	4.9
RTX 4060 Ti 16GB	5.1
RTX 4060	5.3
RX 7600	5.7
RX 7700 XT	5.7
RTX 3070	6.0
RX 6800	6.1
RTX 3060 Ti	6.2
RTX 3090	6.3
RX 6800 XT	6.5
RTX 3080 10GB	6.5
RX 7600 XT	6.9
RX 6600 XT	6.9
Arc A770 16GB	7.3
RX 6700 XT	7.4
RTX 3060 12GB	7.5
RTX 3050 8GB	8.0
Arc A580	8.2

参考：TechPowerUp

4Kの効率は良いけど、RTX 4090～RTX 4070 SUPERとほぼ変わらず

4Kゲーミング時のワットパフォーマンスは非常に良いです。しかし、前世代のRTX 4090～RTX 4070 SUPERとほぼ同等レベルとなっています。

消費電力増の影響もあるかもしれませんが、やはり製造プロセスがほぼ変わらないっぽいのが大きいのかなという印象です。ただ、全ての仕様が規格外のハイエンドモデルなので、これを「RTX 50シリーズの効率」として見て良いかはちょっと微妙なところです。シリーズとしての評価は他モデルを見てからにしたいところですね。

また、フルHDのときの効率に関しては参考値ではあるものの、4Kと比べると悪化しています。参考値とはいえ、ボトルネックによりパフォーマンスが制限されるケースが増えて効率が低下する事態は多くなるとは思うので、フルHDで使うのは電力効率的にもやや勿体ないGPUとなると思います。

ただし、「RTX 4090」も登場時には今よりもフルHDでは微妙に見えましたが、それから「Ryzen 7 7800X3D / 9800X3D」といったゲームで非常に強力なCPUが登場して、少しコスパが改善されたみたいなことがあり、今後も同様のことが起きる可能性があります。

レイトレーシング性能

リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。

また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。

※従来は各ゲームの幾何平均fpsの値を再計算して載せていたのですが、参考ページで全GPUの詳細fps値が示されなかったため、今回は相対性能を見ていきます。

レイトレーシングFPS(1080p 平均)
GPU名称	平均FPS
RTX 5090	100
RTX 4090	84
RTX 4080 SUPER	70
RTX 4080	69
RTX 4070 Ti SUPER	61
RTX 4070 Ti	58
RTX 3090 Ti	54
RTX 4070 SUPER	53
RTX 3090	50
RX 7900 XTX	50
RTX 4070	48
RTX 3080 10GB	45
RX 7900 XT	44
RX 7900 GRE	38
RTX 4060 Ti 16GB	36
RX 7800 XT	35
RTX 4060 Ti 8GB	35
RTX 3070	34
RX 6800 XT	32
RX 7700 XT	30
RTX 3060 Ti	29
Arc B580	28
RTX 4060	27
RX 6800	27
Arc A770 16GB	24
RTX 3060 12GB	23
RX 6700 XT	22
RX 7600 XT	20
Arc A580	19
RTX 3050 8GB	16
RX 6600 XT	15
RX 6600	13
RX 7600	13

参考：TechPowerUp

レイトレーシングFPS(1440p 平均)
GPU名称	平均FPS
RTX 5090	100
RTX 4090	80
RTX 4080 SUPER	64
RTX 4080	63
RTX 4070 Ti SUPER	55
RTX 4070 Ti	52
RTX 3090 Ti	50
RTX 4070 SUPER	47
RX 7900 XTX	45
RTX 3090	45
RTX 4070	42
RTX 3080 10GB	40
RX 7900 XT	39
RX 7900 GRE	33
RTX 4060 Ti 16GB	31
RX 7800 XT	30
RX 6800 XT	27
RX 7700 XT	26
Arc B580	25
RTX 3070	25
RX 6800	24
RTX 4060 Ti 8GB	24
RTX 3060 Ti	22
Arc A770 16GB	22
RTX 4060	20
RTX 3060 12GB	20
RX 6700 XT	18
RX 7600 XT	17
Arc A580	16
RTX 3050 8GB	12
RX 7600	11
RX 6600	10
RX 6600 XT	9

参考：TechPowerUp

レイトレーシングFPS(4K 平均)
GPU名称	平均FPS
RTX 5090	100
RTX 4090	76
RTX 4080 SUPER	58
RTX 4080	57
RTX 4070 Ti SUPER	49
RTX 3090 Ti	45
RTX 3090	41
RX 7900 XTX	40
RTX 4070 Ti	37
RTX 4070 SUPER	34
RX 7900 XT	34
RTX 4070	31
RX 7900 GRE	29
RTX 3080 10GB	28
RX 7800 XT	26
RTX 4060 Ti 16GB	26
RX 6800 XT	24
RX 7700 XT	23
RX 6800	20
Arc A770 16GB	19
RTX 3070	19
RTX 4060 Ti 8GB	17
RTX 3060 Ti	17
RX 6700 XT	17
RTX 4060	15
Arc B580	13
RTX 3060 12GB	15
RX 7600 XT	14
Arc A580	12
RTX 3050 8GB	9
RX 6600 XT	8
RX 7600	7
RX 6600	7

参考：TechPowerUp

驚異的なレイトレーシング性能

レイトレーシング性能も驚異的です。「RTX 4090」と比較するとフルHDでも約19%上回る性能となっており、やはり圧倒的な性能です。

また、ラスタライズのフルHDでは約11.6%の差だったので、高負荷なレイトレーシングではフルHDでもラスタライズよりはボトルネックが発生していないことがわかります。

ラスターでも4Kなら十分に性能を活かすことは可能なものの、まだ大体の人はゲーミングモニターはフルHDもしくは1440pのものを使っていると思うので、その環境ならやはりレイトレーシングの方が性能を余すことなく使いやすいです。

そのため、ゲームでは基本レイトレーシング前提で考える方が良いレベルの規格外のGPUとなっています。

DLSS

DLSS有効時のゲーム性能

DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要となるため、GeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。

4Kでレイトレーシング有効＆最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能（幾何平均）を見ていきます。

DLSS有効時のゲームfps（4K/RT Ultra）
GPU名称	幾何平均fps
RTX 5090 フレーム生成x4	187.8
RTX 5090 フレーム生成x3	146.8
RTX 5090 フレーム生成x2	100.1
RTX 5090 DLSS Quality	83.8
RTX 4090 フレーム生成x2	73.4
RTX 4090 DLSS Quality	64.4
RTX 5090 ネイティブ	56.6
RTX 4090 ネイティブ	42.1
RX 7900 XTX FSR Quality	39.9
RX 7900 XTX ネイティブ	23.6

マルチフレーム生成の効果は絶大

マルチフレーム生成の効果は非常に大きいです。一つずつ向上率を見ていくと、まずDLSSの通常のアップスケーリングをQuality設定で有効にすると、フレームレートは約1.48倍になります。

フレーム生成をオンにした場合、ネイティブと比較すると、x2のとき約1.77倍、x3のとき約2.59倍、x4のとき約3.32倍となります。

当たり前と言えば当たり前ですが、生成倍率が増えても、向上率がほぼ変わらないのが凄いです。しかし、このパフォーマンスは圧倒的な処理性能を持つ「RTX 5090」だからという可能性もあるので、詳しい評価は他のGPUの到着を待ちたいと思います。

しかし、マルチフレーム生成の効果は絶大なのは確かであり、フルで活用できれば「今までは何だったんだ」というレベルの向上率を手にできることになりそうです。

コストパフォーマンス

上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。各GPUの価格は、記事執筆時点のおおよその市場最安値価格です。ラスタライズとレイトレーシング時の両方を見ていきます。

元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。

1フレームあたりの価格（ラスタライズ）

まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。

1fあたりの価格（1440p@RT無し）
GPU名称	1フレームあたりの価格	参考価格
Arc A580	571	¥24,800
RX 6600	706	¥28,800
Arc A770 16GB	729	¥39,800
RX 7600	744	¥36,980
RTX 4060	756	¥41,980
RX 7700 XT	780	¥62,980
RX 7800 XT	796	¥75,800
RTX 3060 12GB	800	¥39,980
Arc B580	811	¥49,800
RTX 4060 Ti 8GB	821	¥57,800
RTX 3050 8GB	832	¥28,800
Arc B570	842	¥44,980
RTX 3080 10GB	890	¥84,800
RTX 4070	923	¥86,800
RX 7900 XT	943	¥116,800
RX 6800 XT	962	¥89,800
RTX 4060 Ti 16GB	976	¥69,280
RTX 4070 SUPER	1015	¥109,980
RX 7900 XTX	1083	¥154,800
RTX 4070 Ti SUPER	1140	¥142,800
RTX 4080 SUPER	1165	¥169,800
RTX 4090	1808	¥323,800
RTX 5090	1816	¥393,800

参考：TechPowerUp

コスパは非常に悪い

価格が圧倒的な高さなので仕方ありませんが、コスパは非常に悪いです。「RTX 4090」とほぼ同じです。4Kでの算出ならもう少しマシにはなりますが、それでも非常に悪いのは変わりません。

コスパを求めるGPUではないので当たり前ではありますが、少なくとも消費者レベルでは需要は予算が潤沢な人以外では選択肢に入らないことが基本です。

1フレームあたりの価格（レイトレーシング）

次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。

1fあたりの価格（1440p@RT）
GPU名称	1フレームあたりの価格	参考価格
Arc A580	925	¥24,800
Arc A770 16GB	1188	¥39,800
Arc B580	1258	¥49,800
RTX 3060 12GB	1351	¥39,980
Arc B570	1371	¥44,980
RTX 4060	1510	¥41,980
RTX 4060 Ti 16GB	1546	¥69,280
RX 7700 XT	1559	¥62,980
RTX 3050 8GB	1591	¥28,800
RTX 4060 Ti 8GB	1661	¥57,800
RTX 4070 Ti SUPER	1828	¥142,800
RTX 4080 SUPER	1862	¥169,800
RX 7900 XT	1887	¥116,800
RX 7600 XT	1917	¥50,800
RX 7900 XTX	2190	¥154,800
RX 7600	2465	¥36,980
RTX 5090	2787	¥393,800
RTX 4090	2946	¥323,800

参考：TechPowerUp

レイトレーシングでもコスパは悪い

コスパに関してはレイトレーシングでも悪いです。ラスターよりは少し差が縮まってはいるものの、最下位クラスという立ち位置は変わっていません。

ただし、レイトレーシングの高解像度＆高設定で高いパフォーマンスを期待できるGPUは「RTX 5090」以外にほとんどないという利点があるため、コスパを度外視しても選ぶ理由は一応あるかなと思います。

AI・クリエイティブ用途

比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。

一般的な動画編集等の基準性能としてFP32（単精度浮動小数点演算）の理論演算性能、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」の性能をそれぞれ見ていきたいと思います。

また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー（HotHardware）を参考にしています。「Ryzen 7 9800X3D」と「DDR5-6000 CL28 32GB（16GBx2）」が使用されています。他の条件について気になる方は上述の参考リンクをご覧ください。

理論演算性能（FP32）

FP32（単精度浮動小数点演算）は、理論演算性能を示す一つの指標です。単位はTFLOPS（テラフロップス）を用います。実際のテストから算出するものではなく、シェーダーユニット数（対応の演算器の数）とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。

一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能（データ量が多い処理の場合）によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います（完全に一致する訳ではないので注意）。

FP32（単精度浮動小数点演算）
GPU名称	FP32（TFLOPS）
RTX 5090 32GB 1792GB/s	104.8
RTX 4090 24GB 1008GB/s	82.58
RX 7900 XTX 24GB 960GB/s	61.42
RTX 4080 SUPER 16GB 736.3GB/s	52.22
RX 7900 XT 20GB 800GB/s	51.48
RTX 4080 16GB 716.8GB/s	48.74
RX 7900 GRE 16GB 576GB/s	45.98
RTX 4070 Ti SUPER 16GB 672GB/s	44.10
RTX 4070 Ti 12GB 504GB/s	40.09
RX 7800 XT 16GB 624GB/s	37.32
RTX 4070 SUPER 12GB 504GB/s	35.48
RX 7700 XT 12GB 432GB/s	35.17
RTX 3080 10GB 760GB/s	29.77
RTX 4070 12GB 504GB/s	29.15
RX 7600 XT 16GB 288GB/s	22.57
RTX 4060 Ti 8GB / 16GB 288GB/s	22.06
RTX 3070 Ti 8GB 608GB/s	21.75
RX 7600 8GB 288GB/s	21.75
RX 6800 XT 16GB 512GB/s	20.74
RTX 3070 8GB 448GB/s	20.31
Arc A770 16GB 16GB 560GB/s	17.20
RTX 3060 Ti 8GB 448GB/s	16.20
RX 6800 16GB 512GB/s	16.17
RTX 4060 8GB 272GB/s	15.11
Arc B580 12GB 456GB/s	13.67
RX 6700 XT 12GB 384GB/s	13.21
RTX 3060 12GB 12GB 360GB/s	12.74
Arc B570 10GB 380GB/s	11.52
RX 6600 XT 8GB 256GB/s	10.61
RTX 3050 8GB 224GB/s	9.10
RX 6600 8GB 224GB/s	8.93

ゲーム性能ほどではないけど、理論性能コスパも悪い

「RTX 5090」のFP32（単精度浮動小数点演算）の理論性能は驚異の100TFLOPS超えです。凄まじい性能です。そして、やはり価格が高すぎるので、理論性能コスパも当然悪いです。

「RTX 4090」からの向上率は約27%となっており、価格の増加率の25%とほぼ一致するため、コスパは同等レベルです。

ただし、理論性能ではボトルネックなどを考えないため、上述の1440p以下のゲーム性能コスパよりは悪くない立ち位置です。

ゲームにおいても、CPUの性能向上やゲーム側の最適化が進めば理論性能と同じくらいの差に近付いていくと思うので、将来的にはコスパが少し改善される未来が見える指標にはなっているかもしれません。

Blender（GPUレンダリング）

「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。

「Blender 4.3」では、Nvidia Optix、Intel oneAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。

Blender Benchmarks（4.3.0）
GPU名称	総合スコア（幾何平均）
RTX 5090	4769
RTX 4090	3503
RX 7900 XTX	1324

参考：HotHardware

Blenderのレンダリングは「RTX 4090」を約36.1%上回る

BlenderのGPUレンダリング性能では「RTX 4090」を約36.1%も上回りました。

シェーダーユニット数が重要な処理なので、非常に強力です。重いレンダリング処理を日常的に大量に行うのであれば、十分に価値を感じられるGPUだと思います。

MLPerf Client（AI性能）

「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。

幅広い環境で使えるONNX（DirectML）をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。

MLPerf Client 総合スコア（幾何平均）
GPU名称	総合スコア（幾何平均）
RTX 5090	244.68
RTX 4090	176.57
RX 7900 XTX	127.44

参考：HotHardware

ONNX（DirectML）でも圧倒的な性能で、RX 7900 XTXの2倍近い性能

Tensorコアに最適化されていない場合のAI処理（ONNX）でもその性能は非常に優れています。「RTX 4090」と比較すると約38.6%上回り、「RX 7900 XTX」と比較すると約92%も上回ります。

本来なら重いAI処理ではVRAM容量もネックとなることが多いですが、32GBを搭載する「RTX 5090」ではそこも懸念する必要がほとんど無いため、AIにおいては価格の高さを考慮しても魅力を感じられると思います。

Blackmagic RAW（デコード速度）

「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するベンチマークです。GPUを使用する場合にはCUDAかOpenCLを使うことになり、CUDAを使えるGeForceが有利な傾向があります。

また、このテストは圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率（12:1）での8Kおよび4Kのテストでのデコード速度（1秒あたりのフレーム数）を見ていきます。

Blackmagic RAW 4.3.1 デコード速度（8K/12:1）
GPU名称	スコア
RTX 5090	251
RTX 4090	202
RX 7900 XTX	108

参考：HotHardware

Blackmagic RAW 4.3.1 デコード速度（4K/12:1）
GPU名称	スコア
RTX 5090	1005
RTX 4090	810
RX 7900 XTX	433

参考：HotHardware

「RTX 4090」を約24%上回るRAWデコード速度

RAWのデコード速度テストでは、「RTX 4090」を約24%上回る性能となっていました。非常に優れたメディアエンジン性能です。

しかし、このような処理は基本CPU処理も同時に多少必要だったり、圧縮率が低くなるとメモリの影響が大きくなったりなどして、ハイエンドGPUほどボトルネックになり易く恩恵を受けにくくなることもありますし、高すぎる価格もネックでコスパも良くはないので、4K以上の解像度でよほど高い圧縮率で常用している訳ではない限りは実用コスパは悪くなると思います。

Procyon Stable Diffusion（AIイラスト生成）

現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。

「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。

ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。

また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT（NVIDIA）、Open VINO（Intel）、ROCm（AMD）といったものがありますが、2024年12月時点ではROCm（AMD）は現状Windowsでのネイティブ動作に対応していません（Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど）。

そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML（ONNX）の3つとなっており、AMD製のGPU（Radeon等）のみ汎用のDirect ML（ONNX）を使わざるを得ず、低めの性能となっている点に注意が必要です。

※しかし、記事執筆時点ではRTX 50（Blackwell）がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。

Procyon Stable Diffusion XL 総合スコア（1024×1024）
GPU名称	スコア
RTX 4090（Tensor RT）	5073
RTX 5090（ONNX）	5073
RTX 4090（ONNX）	3985
RX 7900 XTX（ONNX）	1458

参考：HotHardware

TensorRT無しでも「RTX 4090」並みの生成速度

Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。

しかし、代わりに汎用のONNX（DirectML）でテストしてみても非常に優れた性能を発揮し、「RTX 4090（TensorRT）」と同等です。

ONNX同士の比較では約27.3%上回る結果となっており、コアの増加率とほぼ一致します。

まとめ

GeForce RTX 5090

良い点

あらゆる面でダントツの圧倒的な処理性能
4Kレイトレーシングなどの超高負荷処理でも高いパフォーマンス
32GB VRAM（1792GB/s）
高負荷時の電力効率が非常に良い
DLSS 4のマルチフレーム生成対応で、非常に優れた向上率
非常に優れたメディアエンジン

気になる点

高すぎる価格（想定価格：約40万円～）
消費電力がものすごく多い（TGP：575W）
アイドル時・ビデオ再生時の消費電力が多い
非常に大型（消費電力の割には小さめではあるとは思うけど）
フルHDでは負荷が軽すぎて、パフォーマンスが制限されることが多い（今後CPUの向上等で改善する可能性は有）

RTX 5090：圧倒的な性能と消費電力と価格のウルトラハイエンドGPU

「RTX 5090」は32GB VRAMを搭載し、「RTX 4090」をも大きく上回る性能を持ち、価格は1,999ドル（国内想定価格：約40万円～）で、TGPは575Wという、あらゆる面で圧倒的なウルトラハイエンドGPUです。

「RTX 4090」と比較すると各コア類が約32.8%多くなっており、他要素がボトルネックにならない前提であれば、大体35%～39%程度の性能向上が見られました。

「RTX 5090」の登場前でも圧倒的な性能だった「RTX 4090」を更に大幅に上回る性能という、とんでもないGPUです。

「RTX 4090」が元々圧倒的な性能なので差が伝わりにくいかもしれませんが、「RTX 4070 Ti SUPER」と比較して4Kゲームで約2倍の性能になっていると聞くと、その凄さがより伝わり易いかもしれません。

しかし、あまりの高性能さのせいで、フルHDゲームでは他の要素が大きなボトルネックとなり性能が伸び悩むという弱点がある点は注意が必要です。1440pですらボトルネックをやや大きめに感じるレベルなど、凄いGPUとなっています。

大体の人のゲーミングモニターはフルHDもしくは1440pであろうことを考慮すると、レイトレーシングを前提として考えるのが性能を活かす上で妥当という感じのGPUとなのかなと思います。

ボトルネック面は今後は改善していく可能性こそあるものの、現状では性能を持て余すケースが多くて扱いも評価も難しいGPUだと思います。

また、ゲーム以外のクリエイティブ用途やAI関連の処理でも当然高性能です。

他要素がボトルネックになりにくい場合のGPUレンダリングやAI性能テストでは、「RTX 4090」をおおよそ36%～39%上回るという圧倒的な性能が見て取れました。

更に恐ろしいのが、登場直後ではBlackwellに対応・最適化していないAI関連ソフトが多いため、Tensorコア込みでの性能を測るテストでの比較がほぼ無い状態でこれだけの差があったことです。

NVIDIAの公表値を信じるなら、「RTX 5090」のTensorコアのAI処理性能は「RTX 4090」の約2.54倍という驚異的な向上率となっているので、更に性能差が広がる可能性があります。

このように、処理性能ではとにかく圧倒的なのが「RTX 5090」ですが、気になるのはやはり消費電力と価格です。

まず消費電力ですが、性能を考えれば575Wという消費電力の多さは仕方ないにしても、電力効率で向上が見られなかったのが残念です。4Kゲームでの効率は非常に優れていたものの、前世代の「RTX 4090」～「RTX 4070 SUPER」とほぼ同水準でした。

考えられる要因としては、製造プロセスが恐らく微細化されておらず「TSMC 5nm」のままだと言われている点があります。

「RTX 5090」はコア数やVRAMが圧倒的すぎるので、例外的な数値になっている可能性は一応考えられるものの、少なくとも前世代からプロセスで大幅な改善には至ってはいないというのは有力になったかなと思います。

とはいえ、電力面で向上が無かったとしても、そもそも前世代の時点で競合よりも明らかに優れた効率を発揮していて、その水準を維持しているのなら悪くはないです。要するに、電力面で向上が無かったのは残念だけど、別に悪い訳ではないです。

次に価格です。国内想定で約40万円～という高額さになっています。この価格はコア数や状況を考えれば良心的ではあるものの、そもそも「RTX 5090」ほどの性能が必要な人はごくわずかであり、ほとんどの人にとってはオーバースペックなので、40万円では選択肢に入らないことがほとんどです。

更に、噂によると40万円という価格すら“その価格で売ったという実績”を作るためのいわゆる”アリバイ価格”だという話があったりもします。

AI性能（Tensorコアの理論性能）に関しては価格を考えても十分に正当化できるレベルの飛躍的な向上があるので、DLSS 4やニューラルレンダリングのことを考えるならRTX 5090の魅力も当然非常に大きいものの、使用感や対応状況がまだ不明瞭なので評価もし辛い点です。

それに、DLSS 4のマルチフレーム生成やニューラルレンダリングによるフレームレート向上は、むしろやや低性能なGPUだからこそ恩恵を感じやすい部分なので、そういう意味ではコアをたくさん積んだ「RTX 5090」を導入するのは損をしているようにも感じられてしまうので、色んな意味で評価が難しいGPUだなと思いました。

といった感じで、本記事は以上になります。ご覧いただきありがとうございました。