「GeForce RTX 5070 Ti」ざっくり評価【性能比較】

GPU	シェーダーユニット数	メモリタイプ	VRAM速度 VRAM帯域幅	レイトレ用ユニット数	ダイサイズ（おおよそ）	消費電力 (TGP等)	希望小売価格
RTX 5090	21760	GDDR7 32GB 512bit	28.0Gbps 1792GB/s	170	750㎟	575W	1,999ドル
RTX 4090	16384	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	128	608㎟	450W	1,599ドル
RTX 5080	10752	GDDR7 16GB 256bit	30.0Gbps 960GB/s	84	378㎟	360W	999ドル
RTX 4080 SUPER	10240	GDDR6X 16GB 256bit	23.0Gbps 736.3GB/s	80	380㎟	320W	999ドル
RTX 4080	9728	GDDR6X 16GB 256bit	22.4Gbps 716.8GB/s	76	380㎟	320W	1,199ドル →市場廃止
RTX 5070 Ti	8960	GDDR7 16GB 256bit	28.0Gbps 896GB/s	70	378㎟	300W	749ドル
RX 7900 XTX	6144	GDDR6 24GB 384bit	20Gbps 960GB/s	96	36.6㎟*6 + 300㎟	355W	969ドル
RX 7900 XT	5376	GDDR6 20GB 320bit	20Gbps 800GB/s	84	36.6㎟*6 + 300㎟	315W	799ドル →749ドル?
RTX 4070 Ti SUPER	8448	GDDR6X 16GB 256bit	21.0Gbps 672GB/s	66	295㎟	285W	799ドル
RTX 4070 Ti	7680	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	60	295㎟	285W	799ドル →市場廃止
RTX 5070	6144	GDDR7 12GB 192bit	28?Gbps 672GB/s	48?	?㎟	250W	549ドル
RTX 3090 Ti	10752	GDDR6X 24GB 384bit	21.0Gbps 1008GB/s	84	628.4㎟	450W	1,499ドル
RTX 3090	10496	GDDR6X 24GB 384bit	19.5Gbps 936GB/s	82	628.4㎟	350W	1,299ドル
RX 7900 GRE	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	36.6㎟*6 + 300㎟	260W	549ドル
RX 6950 XT	5120	GDDR6 16GB 256bit	18Gbps 576GB/s	80	519㎟	335W	949ドル
RX 6900 XT	5120	GDDR6 16GB 256bit	16Gbps 512GB/s	80	519㎟	300W	699ドル
RTX 3080 Ti	10240	GDDR6X 12GB 384bit	19Gbps 912GB/s	80	628.4㎟	350W	1,099ドル
RTX 3080 10GB	8704	GDDR6X 10GB 320bit	19Gbps 760GB/s	68	628.4㎟	320W	699ドル
RTX 4070 SUPER	7168	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	56	295㎟	220W	599ドル
RTX 4070	5888	GDDR6X 12GB 192bit	21.0Gbps 504GB/s	46	295㎟	200W	549ドル前：599ドル
RX 7800 XT	3840	GDDR6 16GB 256bit	19.5Gbps 624GB/s	60	37.5㎟*4 + 200㎟	263W	499ドル
RX 6800 XT	4608	GDDR6 16GB 256bit	16Gbps 512GB/s	72	519㎟	300W	599ドル
RTX 3070 Ti	6144	GDDR6X 8GB 256bit	19Gbps 608GB/s	48	392㎟	290W	599ドル
RX 6800	3840	GDDR6 16GB 256bit	16Gbps 512GB/s	60	519㎟	250W	549ドル
RX 7700 XT	3456	GDDR6 12GB 192bit	18Gbps 432GB/s	54	37.5㎟*4 + 200㎟	245W	419ドル前:449ドル
RTX 4060 Ti 8GB	4352	GDDR6 8GB 128bit	18Gbps 288GB/s	34	190㎟	160W	399ドル
RTX 3070	5888	GDDR6 8GB 256bit	14Gbps 448GB/s	46	392㎟	220W	499ドル
RX 6750 XT	2560	GDDR6 12GB 192bit	18Gbps 432GB/s	40	336㎟	250W	419ドル
RTX 3060 Ti	4864	GDDR6 8GB 192bit	14Gbps 448GB/s	38	392㎟	200W	399ドル
RX 6700 XT	2560	GDDR6 12GB 192bit	16Gbps 384GB/s	40	336㎟	230W	379ドル
Arc A770 16GB	4096	GDDR6 16GB 256bit	17.5Gbps 560GB/s	32	406㎟	225W	349ドル
Arc A770 8GB	4096	GDDR6 8GB 256bit	16Gbps 512GB/s	32	406㎟	225W	329ドル
Arc B580	2560	GDDR6 12GB 192bit	19Gbps 456GB/s	20	272㎟	190W	249ドル
RX 7600 XT	2048	GDDR6 16GB 128bit	18Gbps 288GB/s	32	204㎟	190W	329ドル
RTX 4060	3072	GDDR6 8GB 128bit	17Gbps 272GB/s	24	156㎟	115W	299ドル
Arc B570	2304	GDDR6 10GB 160bit	19Gbps 380GB/s	18	272㎟	150W	219ドル
RX 6650 XT	2048	GDDR6 8GB 128bit	17.5Gbps 288GB/s	32	237㎟	180W	299ドル
RX 7600	2048	GDDR6 8GB 128bit	18Gbps 288GB/s	32	204㎟	165W	269ドル
RX 6600 XT	2048	GDDR6 8GB 128bit	16Gbps 256GB/s	32	237㎟	160W	–
Arc A750	3584	GDDR6 16GB 256bit	16Gbps 512GB/s	28	406㎟	225W	289ドル
RX 6600	1792	GDDR6 8GB 128bit	14Gbps 224GB/s	28	237㎟	132W	239ドル
RTX 3060 12GB	3584	GDDR6 12GB 192bit	15Gbps 360GB/s	28	276㎟	170W	329ドル
RTX 3050	2560	GDDR6 8GB 128bit	15Gbps 224GB/s	20	276㎟	130W	249ドル

前世代との比較

「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。

RTX 50シリーズではTensorコアが「FP4」に新たに対応したことで、前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われます。

コア数による表記は、コア性能が上がっても向上を感じられないという問題があったので、表記を切り替える良い機会になったのかなと思います。

ただし、RTX 40 シリーズのAI性能は「FP8」の数値なのに対し、RTX 50 シリーズのAI性能は「FP4」なので、精度が低下している点には注意してください（ただし、FP4でも十分な精度だと言われている）。

GPU	希望小売価格	GPU				VRAM			TGP
GPU	希望小売価格	CUDAコア	Tensorコア (AI TOPS)	RTコア (TFLOPS)	クロック最大(GHz)	容量/タイプ	バス幅	帯域幅(GB/s)	TGP
RTX 5090	1999ドル	21760	3352	318	2.41	32GB GDDR7	512bit	1792	575W
RTX 4090	1599ドル	16384	1321	191	2.52	24GB GDDR6X	384bit	1008	450W
RTX 5080	999ドル	10752	1801	171	2.62	16GB GDDR7	256bit	960	360W
RTX 4080 SUPER	999ドル	10240	836	121	2.55	16GB GDDR6X	256bit	736	320W
RTX 5070 Ti	749ドル	8960	1406	133	2.45	16GB GDDR7	256bit	896	300W
RTX 4070 Ti SUPER	799ドル	8448	780	102	2.61	16GB GDDR6X	256bit	672	285W
RTX 4070 SUPER	599ドル	7168	568	93	2.48	12GB GDDR6X	192bit	504	220W
RTX 5070	549ドル	6144	988	94	2.51	12GB GDDR7	192bit	672	250W
RTX 4070	549ドル	5888	466	67	2.48	12GB GDDR6X 12GB GDDR6	192bit	504	200W

今回見ていくのはNVIDIA「GeForce RTX 5070 Ti」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」の準ハイエンドモデルです。

VRAM容量が「RTX 5080」と同じ16GBながら価格は大幅に安価ということで、非常に注目が集まるモデルとなっていると思います。

メーカー希望小売価格は749ドルで、国内想定価格は148,800円～となっています。「RTX 4070 Ti SUPER」の799ドルよりも50ドル安い設定となっていますが、以前よりも円安になっている他、AI需要が以前よりも高まっていることもあり、国内想定価格は「RTX 4070 Ti SUPER」の登場時（127,380円～）よりも約2万円ほど高い設定となっています。

また、148,800円～という価格は「アリバイ価格」などと呼ばれるごく少数の在庫しかないと言われていることもあり、価格は発売後どうなるか動向を見守りたいところです。

ダイには「RTX 5080」と同じGB203が使用されており、RTX 5080では84個の利用可能なストリーミングプロセッサ全てが有効となっていますが、「RTX 5070 Ti」では84個の内の70個が有効化されています。CUDAコア数は8,960となっており、「RTX 4070 Ti SUPER」と比較すると約6%のわずかな増量で、最大クロックはわずかに低下しています。

ここで触れておきたいのは、既に登場している「RTX 5080」を見る限り、RTX 40からのアーキテクチャ更新による基本性能の向上はわずかと考えられる点です。

考えられている主な理由は、製造プロセスがほぼ変わらないと噂されていることが挙げられます。前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも4Nと同じ「5nm EUV」で製造されていると言われています。

そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」なので、プロセスルールの微細化はされていない可能性が高そうという感じです。そのため、主に基本性能や電力効率（ワットパフォーマンス）面では大きな改善が見られないかもしれないのが懸念点です。

製造プロセスでの進化があまり見込めない上、コア数の上昇もわずかでクロックも下がっているので、性能向上率は小さいのではないかと発売前から不安視されていました。詳しいところはこの後見ていきます。

ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。

特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5070 Ti」のAIの理論上のピーク性能（FP4）は 1406 TOPSとなっており、これは「RTX 4070 Ti SUPER」の約1.8倍という大きな向上率です。

前世代ではFP8（8ビット）までの対応だったのが、FP4（4ビット）に対応したことで性能が飛躍的に向上しました。精度は落ちるものの、FP4でも十分な精度が得られると言われています。

そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されました。

AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。

そのAIでも重要なVRAMですが、「RTX 5070 Ti」では GDDR7 16GB、帯域幅は896 GB/sとなっています。「RTX 4070 Ti SUPER」と容量は同じで、帯域幅が向上しています。

強力なVRAMだとは思いますが、約15万円～のGPUとしては正直物足りなさもある仕様です。AMDの「RX 7800 XT」は16GB VRAMを搭載しつつ、安い時期では7万円台中盤で販売されていました。

しかし、少し後に登場する「RTX 5070」が12GBなので、ハイエンド用途でも十分な性能を維持したいなら「RTX 5070 Ti」を選びたいところなので、難しいところです。

「RTX 5070」より下位のGPUの展開は現状はまだ不明ですが、「RTX 4060 Ti 16GB」のように「RTX 5060 Ti 16GB」が投入され、前世代よりも10%以上の性能向上があるのなら、そちらへ人気が集中する可能性もあるかもしれません。

しかし、ここまでの向上率を見る限り、5060 Tiの性能は従来のアッパーミドルクラスの域を超えなさそうなので、高性能な16GB GPUが欲しかった人は、「RTX 4070 Ti SUPER」を安い時期に導入しておけば良かったと思っている人は結構多いかもしれません。

最後に消費電力ですが、「RTX 5070 Ti」のTGPは300Wとなっています。「RTX 4070 Ti SUPER」の285Wからわずかに上昇しています。

性能向上率もわずかな感じがすることも併せて考えると、ワットパフォーマンスも大して向上していない感じがカタログスペックの時点でも出ている気がします。

DLSS 4、ニューラルレンダリング

「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。ご存じの方は飛ばして貰って構いません。

まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。

DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。

また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。

マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。

次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。

従来はグラフィックスAPI内でTensorコア（AI）を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。

これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。

DLSSやFSRといった別機能ではなく、グラフィックスAPI（DirectX）の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR（レイトレーシング）単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。

といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。

ゲーミング性能（ラスタライズ）

ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。

まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能（ラスター性能）を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。

使用されたグラフィックボードは「MSI GeForce RTX 5070 Ti Ventus 3X OC」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。

フルHD（1920×1080）

フルHD（1920×1080）です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。

平均FPS(1080p 最高設定)
GPU名称	平均FPS
RTX 5090	251.1
RTX 4090	225.0
RTX 5080	203.5
RTX 4080 SUPER	190.3
RTX 4080	187.8
RTX 5070 Ti	184.2
RX 7900 XTX	184.1
RTX 4070 Ti SUPER	166.8
RX 7900 XT	164.3
RTX 4070 Ti	160.0
RTX 4070 SUPER	148.0
RTX 3090	141.9
RX 7900 GRE	141.3
RTX 4070	129.8
RX 7800 XT	128.3
RTX 3080 10GB	127.2
RX 6800 XT	125.8
RX 7700 XT	110.6
RTX 3070	100.8
RTX 4060 Ti 16GB	99.9
RTX 4060 Ti 8GB	98.7
RX 6700 XT	88.7
RTX 3060 Ti	88.2
Arc B580	82.6
RX 7600 XT	78.9
RTX 4060	78.6
Arc B570	72.9
RX 7600	72.1
Arc A770 16GB	71.8
RX 6600 XT	68.8
RTX 3060 12GB	67.4
RX 6600	59.0
Arc A580	58.5
RTX 3050 8GB	48.3

参考：TechPowerUp

フルHDは「RTX 4070 Ti SUPER」を約10.4%上回る性能

フルHDのラスタライズ性能は「RTX 4070 Ti SUPER」を約10.4%上回る性能となっています。事前の予測通り、新世代の向上率としてはやや控えめです。「RTX 4080 SUPER」と比較すると約3.2%下回る性能となっており、近い性能です。

米国（ドル）の希望小売価格は「RTX 4070 Ti SUPER」から50ドル安くなったものの、円安の影響もあって、初期の実売価格としては大幅に高くなってしまっているので、コスパは劇的には良くなっていなさそうです

また、「RTX 50シリーズ」目玉機能にはDLSS 4のマルチフレーム生成がありますが、「RTX 5070 Ti」レベルの性能であればフルHDならマルチフレーム生成が無くても十分なパフォーマンスが得られるので、フルHDにおいてはRTX 50だから有利という感じはあまり無いと思います。

1440p（2560×1440）

WQHD（2560×1440）です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。

平均FPS（1440p 最高設定）
GPU名称	平均FPS
RTX 5090	216.8
RTX 4090	179.1
RTX 5080	159.6
RTX 4080 SUPER	145.8
RTX 4080	143.4
RX 7900 XTX	142.9
RTX 5070 Ti	141.6
RTX 4070 Ti SUPER	125.3
RX 7900 XT	123.8
RTX 4070 Ti	117.7
RTX 4070 SUPER	108.4
RTX 3090	107.6
RX 7900 GRE	104.5
RX 7800 XT	95.2
RTX 3080 10GB	95.3
RX 6800 XT	93.3
RTX 4070	94.0
RX 7700 XT	80.7
RTX 3070	73.8
RTX 4060 Ti 16GB	71.0
RTX 4060 Ti 8GB	70.4
RX 6700 XT	64.3
RTX 3060 Ti	64.3
Arc B580	61.4
RX 7600 XT	55.7
RTX 4060	55.5
Arc A770 16GB	54.6
Arc B570	53.4
RX 7600	49.7
RTX 3060 12GB	48.6
RX 6600 XT	47.7
Arc A580	43.4
RX 6600	40.8
RTX 3050 8GB	34.6

参考：TechPowerUp

1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能

1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能となっています。帯域幅の向上が活きはじめたのか、フルHDよりも差が若干広がっています。

「RTX 4080 SUPER」との差は約2.9%とほぼ変わらず、近い性能となっています。

フルHDよりは負荷が高いためマルチフレーム生成が活きる場面はありそうなものの、ほとんどのゲームでは従来のフレーム生成でも十分なパフォーマンスが得られるとは思うので、やはり強みとしては小さめかなと思います。

4K（3840×2160）

「超高解像度の代名詞」という感じの解像度の4K（3840×2160）です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。

平均FPS(4K 最高設定)
GPU名称	平均FPS
RTX 5090	147.1
RTX 4090	109.2
RTX 5080	96.7
RTX 4080 SUPER	85.5
RTX 5070 Ti	85.0
RX 7900 XTX	84.7
RTX 4080	84.1
RTX 4070 Ti SUPER	72.3
RX 7900 XT	71.5
RTX 4070 Ti	66.3
RTX 3090	64.5
RTX 4070 SUPER	60.9
RX 7900 GRE	59.3
RTX 3080 10GB	55.9
RX 7800 XT	54.5
RTX 4070	52.7
RX 6800 XT	53.1
RX 7700 XT	44.6
RTX 3070	42.0
RTX 4060 Ti 16GB	38.6
RTX 4060 Ti 8GB	38.5
Arc B580	36.2
RTX 3060 Ti	36.0
RX 6700 XT	35.6
Arc A770 16GB	31.8
Arc B570	30.9
RX 7600 XT	30.3
RTX 4060	29.7
RTX 3060 12GB	27.4
RX 7600	24.7
RX 6600 XT	24.7
Arc A580	24.6
RX 6600	20.7
RTX 3050 8GB	18.7

参考：TechPowerUp

4Kでは「RTX 4080 SUPER」とほぼ同等の性能

4Kでは「RTX 4080 SUPER」とほぼ同等の性能となっています。VRAMの帯域幅の向上が活きていそうな感じです。「RTX 4070 Ti SUPER」との比較での差は約17.6%にまで広がっています。

VRAM帯域が重要な処理なら15万円程度で「RTX 4080 SUPER」と同じ性能が得られ、ワットパフォーマンスやAI性能も少し向上するということであれば、一定の需要はありそうな感じがします。

また、4Kレベルの負荷ならDLSS 4のマルチフレーム生成も非常に大きな強みとなるので、そこも考慮するならより高い評価となると思います。遅延は気になるところですが、低fpsのまま運用するよりは優れた体験になると思います。

電力関連

消費電力

ゲームプレイ時（高負荷時）の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」、「S.T.A.L.K.E.R. 2」、「Marvel’s Spider-Man 2」の3種類で「3840×2160（4K）」のウルトラ設定でレイトレーシングは無効です。ただし、VRAMサイズによる影響が大きくなりすぎないように、テクスチャ設定は「低」に設定されています。

GPU平均消費電力（ゲーミング）
GPU名称	消費電力
RTX 4060	123
RTX 3050 8GB	126
RTX 4060 Ti 8GB	141
RX 6600 XT	144
Arc B570	154
RTX 4060 Ti 16GB	154
RX 7600	156
Arc B580	165
RTX 3060 12GB	173
RX 7600 XT	191
RTX 4070	193
RTX 3060 Ti	203
Arc A580	209
RTX 4070 SUPER	210
RX 6700 XT	217
RTX 3070	220
RX 7700 XT	222
Arc A770 16GB	226
RX 6800	232
RX 7800 XT	250
RTX 4070 Ti	252
RX 7900 GRE	265
RTX 4070 Ti SUPER	285
RTX 5070 Ti	287
RTX 4080 SUPER	289
RTX 4080	289
RX 6800 XT	295
RTX 5080	296
RX 7900 XT	312
RTX 3080 10GB	334
RX 7900 XTX	354
RTX 3090	358
RTX 4090	391
RTX 5090	520

参考：TechPowerUp

ゲーム時の平均消費電力はTGPよりもやや少なめの287W

ゲーム時の平均消費電力は287Wとなっており、TGPの300Wよりもやや少なめです。「RTX 4070 Ti SUPER」とほぼ同等となっています。

性能は10%以上向上しているので、ワットパフォーマンスも改善していることがわかります。

ワットパフォーマンス

ワットパフォーマンス（電力効率）を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています

環境は消費電力はおよび4Kは「Cyberpunk 2077（Ultra/レイトレ無効）」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。

ワットパフォーマンス（1080p/25ゲーム平均）
GPU名称	1フレームあたりの消費電力
RTX 4070 SUPER	1.42
RTX 4060 Ti 8GB	1.43
RTX 5080	1.45
RTX 4070	1.49
RTX 4080 SUPER	1.52
RTX 4080	1.54
RTX 4060 Ti 16GB	1.54
RTX 5070 Ti	1.56
RTX 4060	1.56
RTX 4070 Ti	1.58
RTX 4070 Ti SUPER	1.71
RTX 4090	1.74
RX 7900 GRE	1.88
RX 7900 XT	1.90
RX 7900 XTX	1.92
RX 7800 XT	1.95
Arc B580	2.00
RX 7700 XT	2.01
RTX 5090	2.07
RX 6600 XT	2.09
Arc B570	2.13
RX 7600	2.16
RX 6800	2.18
RTX 3070	2.18
RTX 3060 Ti	2.30
RX 6800 XT	2.34
RX 7600 XT	2.42
RX 6700 XT	2.45
RTX 3090	2.52
RTX 3060 12GB	2.57
RTX 3050 8GB	2.61
RTX 3080 10GB	2.63
Arc A770 16GB	3.15
Arc A580	3.57

参考：TechPowerUp

ワットパフォーマンス（1440p/25ゲーム平均）
GPU名称	1フレームあたりの消費電力
RTX 5080	1.85
RTX 4070 SUPER	1.94
RTX 4080 SUPER	1.98
RTX 4060 Ti 8GB	2.00
RTX 4080	2.02
RTX 5070 Ti	2.03
RTX 4070	2.05
RTX 4070 Ti	2.14
RTX 4060 Ti 16GB	2.17
RTX 4090	2.18
RTX 4060	2.22
RTX 4070 Ti SUPER	2.27
RTX 5090	2.40
RX 7900 XTX	2.48
RX 7900 XT	2.52
RX 7900 GRE	2.54
RX 7800 XT	2.63
Arc B580	2.69
RX 7700 XT	2.75
Arc B570	2.90
RX 6800	2.92
RTX 3070	2.98
RX 6600 XT	3.02
RX 7600	3.14
RX 6800 XT	3.16
RTX 3060 Ti	3.16
RTX 3090	3.33
RX 6700 XT	3.37
RX 7600 XT	3.43
RTX 3060 12GB	3.46
RTX 3080 10GB	3.50
RTX 3050 8GB	3.64
Arc A770 16GB	4.14
Arc A580	4.82

参考：TechPowerUp

ワットパフォーマンス（4K/25ゲーム平均）
GPU名称	1フレームあたりの消費電力
RTX 5080	3.06
RTX 5070 Ti	3.38
RTX 4080 SUPER	3.38
RTX 4080	3.44
RTX 4070 SUPER	3.45
RTX 5090	3.53
RTX 4090	3.58
RTX 4070	3.66
RTX 4070 Ti	3.80
RTX 4060 Ti 8GB	3.86
RTX 4070 Ti SUPER	3.94
RTX 4060 Ti 16GB	3.99
RTX 4060	4.14
RX 7900 XTX	4.18
RX 7900 XT	4.36
RX 7900 GRE	4.47
Arc B580	4.56
RX 7800 XT	4.59
RX 7700 XT	4.98
Arc B570	5.02
RX 6800	5.09
RTX 3070	5.24
RTX 3090	5.55
RX 6800 XT	5.56
RTX 3060 Ti	5.64
RX 6600 XT	5.83
RTX 3080 10GB	5.97
RX 6700 XT	6.10
RX 7600 XT	6.30
RTX 3060 12GB	6.31
RX 7600	6.32
RTX 3050 8GB	6.74
Arc A770 16GB	7.11
Arc A580	8.50

参考：TechPowerUp

ワットパフォーマンスは非常に良いけど、RTX 4080と同等レベル

ワットパフォーマンスは非常に良いですが、「RTX 4080 / RTX 4080 SUPER」と同等レベルであり、前世代から大きな向上には至っていません。

結果としては残念ですが、ポジティブに考えると、「RTX 4070 Ti SUPER」が前世代の中では若干悪いワットパフォーマンスだったのが少し改善されています。

DLSS 4のマルチフレーム生成など、RTX 50から対応する機能を活かせれば実質的なワットパフォーマンスは更に上がりますし、代替品としては十分な性能かなと思えないこともないです。

レイトレーシング性能

リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。

また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。

レイトレーシングFPS(1080p 平均)
GPU名称	平均FPS
RTX 5090	188.7
RTX 4090	158.4
RTX 5080	140.6
RTX 4080 SUPER	131.5
RTX 4080	129.7
RTX 5070 Ti	122.3
RTX 4070 Ti SUPER	115.3
RTX 4070 Ti	110.0
RX 7900 XTX	108.2
RTX 3090 Ti	105.8
RTX 4070 SUPER	101.2
RTX 3090	96.8
RX 7900 XT	95.2
RTX 4070	89.0
RTX 3080 10GB	86.7
RX 7900 GRE	81.9
RX 7800 XT	74.7
RTX 4060 Ti 16GB	68.1
RTX 4060 Ti 8GB	66.0
RTX 3070	65.8
RX 7700 XT	64.1
RX 6800	59.3
Arc B580	58.0
RTX 3060 Ti	56.6
RTX 4060	51.3
Arc A770 16GB	49.5
RX 6700 XT	48.5
Arc B570	47.2
RTX 3060 12GB	44.9
RX 7600 XT	42.9
Arc A580	38.8
RX 6600 XT	34.4
RX 7600	34.2
RTX 3050 8GB	31.8
RX 6600	29.9

参考：TechPowerUp

レイトレーシングFPS(1440p 平均)
GPU名称	平均FPS
RTX 5090	152.9
RTX 4090	121.1
RTX 5080	105.3
RTX 4080 SUPER	98.8
RTX 4080	97.7
RTX 5070 Ti	93.6
RTX 4070 Ti SUPER	84.8
RX 7900 XTX	80.6
RTX 4070 Ti	80.5
RTX 3090 Ti	79.7
RTX 4070 SUPER	73.6
RTX 3090	72.5
RX 7900 XT	70.3
RTX 4070	64.6
RTX 3080 10GB	64.3
RX 7900 GRE	59.3
RX 7800 XT	53.8
RTX 4060 Ti 16GB	48.5
RX 7700 XT	46.1
Arc B580	43.5
RX 6800	42.7
RTX 3070	41.4
RTX 4060 Ti 8GB	39.2
Arc B570	38.1
Arc A770 16GB	36.8
RTX 3060 Ti	36.1
RX 6700 XT	33.7
RTX 3060 12GB	32.0
RTX 4060	31.1
RX 7600 XT	29.6
Arc A580	29.1
RTX 3050 8GB	20.9
RX 6600 XT	18.6
RX 7600	18.3
RX 6600	16.5

参考：TechPowerUp

レイトレーシングFPS(4K 平均)
GPU名称	平均FPS
RTX 5090	98.4
RTX 4090	75.9
RTX 5080	63.3
RTX 4080 SUPER	58.2
RTX 4080	57.1
RTX 5070 Ti	53.4
RTX 4070 Ti SUPER	49.2
RTX 3090 Ti	47.7
RX 7900 XTX	46.8
RTX 4070 Ti	43.2
RTX 3090	42.8
RTX 4070 SUPER	39.4
RX 7900 XT	39.7
RTX 4070	34.6
RTX 3080 10GB	34.6
RX 7900 GRE	33.3
RX 7800 XT	30.0
RTX 4060 Ti 16GB	26.6
RX 7700 XT	24.6
RX 6800	23.7
Arc B580	23.3
RTX 3070	22.9
Arc A770 16GB	21.0
RTX 4060 Ti 8GB	20.0
RTX 3060 Ti	20.0
RX 6700 XT	18.2
Arc B570	18.1
RTX 3060 12GB	17.0
RTX 4060	16.6
RX 7600 XT	15.9
Arc A580	14.6
RTX 3050 8GB	10.8
RX 6600 XT	9.0
RX 7600	9.0
RX 6600	7.9

参考：TechPowerUp

「RTX 4070 Ti SUPER」を6%～10%上回る性能

レイトレーシング性能を「RTX 4070 Ti SUPER」と比較すると、向上率はフルHDで約6.1%、1440pで約10.4%、4Kで約8.5%といった感じになっています。やはり向上率は控えめで、ラスタライズよりも差が若干小さくなっています。

4Kでは向上率が若干下がることから、VRAMが少しボトルネックになるケースが発生しているのかもしれません。

レイトレーシングではVRAM容量が非常に多く、レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするのがちょっと懸念点です。

4Kレイトレーシングを実用する人はほぼ居ないと思うので、弱点として数えるほどではないかもしれませんが、約15万円～のGPUでもボトルネックが若干気になるというのは残念感はあるかなと思います。

ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、ある程度カバーもでき、最終的な性能としては十分なパフォーマンスが大体得られると思うので、考え方次第ではあります。

DLSS

DLSS有効時のゲーム性能

DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要なGeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。

4Kでレイトレーシング有効＆最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能の平均を見ていきます。

※表の「FG」は「Frame Generation（フレーム生成）」の略称です。

DLSS有効時のゲームfps（4K/RT Ultra）
GPU名称	平均fps
RTX 5070 Ti DLSS Performance / FGx4	195.0
RTX 5070 Ti DLSS Quality / FGx4	160.8
RTX 4090 DLSS Performance / FGx2	135.8
RTX 4080 SUPER DLSS Performance / FGx2	113.8
RTX 5070 Ti FGx4	111.5
RTX 4090 DLSS Quality / FGx2	109.8
RTX 4080 SUPER DLSS Quality / FGx2	91.3
RTX 5070 Ti FGx3	85.8
RTX 4090 FGx2	74.3
RTX 4090 DLSS Quality	64.8
RTX 5070 Ti FGx2	63.8
RTX 4080 SUPER FGx2	61.0
RTX 4080 SUPER DLSS Quality	54.3
RTX 5070 Ti DLSS Quality	52.5
RTX 4090 ネイティブ	42.8
RX 7900 XTX FSR Quality	40.8
RTX 4080 SUPER ネイティブ	34.3
RX 7900 XTX ネイティブ	24.5
RTX 5070 Ti ネイティブ	30.8

マルチフレーム生成を使えば「RTX 4090」をも大きく上回る

「RTX 50シリーズ」で利用できるDLSS 4の「マルチフレーム生成」では、従来では1つのフレームにつき1フレームしか生成できなかった（x2）のが、最大で3フレーム（x4）まで生成できるようになりました。

そのため、仮に基本性能が同じだったとしても、マルチフレーム生成を使えば前世代を圧倒的に上回るフレームレートを実現可能です。

「RTX 5070 Ti」でDLSS 4をフル活用すると、DLSS 3のフル機能を使用した「RTX 4090」すらも約43.6%も上回るフレームレートを出すことができます。圧倒的な性能です。

とはいえ、このレベルの性能のGPUなら従来のフレーム生成（x2）だけでも非常に優れたパフォーマンスを発揮できるので、そもそも追加のフレーム生成機能が必要なのか、という点はあります。

実際、上記の性能は「4Kレイトレーシングの最高設定」というものすごく高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。

実際の環境ではフルHD～1440pが中心であることを考えると、x2のフレーム生成の重量級ゲーム＆レイトレーシングで「RTX 4070 Ti SUPER」を使用したとしても大体の環境では十分快適だと思われ、マルチフレーム生成はオーバースペック感があります。

とはいえ、マルチフレーム生成の効果は絶大で、性能を飛躍的に向上することができる常識を覆すレベルの機能となっていると思います。

コストパフォーマンス

上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。ラスタライズとレイトレーシング時の両方を見ていきます。

元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。

※各GPUの価格については、従来は記事執筆時点でのおおよその市場価格を基にしていますが、今回は生産終了に伴う品薄＆高騰が発生してしまっているので、今回は高騰前の価格で算出しています。

また、「RTX 5070 Ti」の発売時の想定最安値価格は148,800円ですが、実際にはその価格での販売はほぼ無く、162,980円が実質的な市場最安値価格だったので、そちらでも算出して表に含めています。

1フレームあたりの価格（ラスタライズ）

まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。

1fあたりの価格（1440p@RT無し）
GPU名称	1フレームあたりの価格	参考価格
RX 6600	706	¥28,800
Arc A770 16GB	729	¥39,800
RX 7600	744	¥36,980
RTX 4060	756	¥41,980
RX 7700 XT	780	¥62,980
RX 7800 XT	796	¥75,800
RTX 3060 12GB	800	¥39,980
Arc B580	811	¥49,800
RTX 4060 Ti 8GB	821	¥57,800
RTX 3050 8GB	832	¥28,800
Arc B570	842	¥44,980
RTX 3080 10GB	890	¥84,800
RTX 4070 SUPER	921	¥99,800
RTX 4070	923	¥86,800
RX 7900 XT	943	¥116,800
RX 6800 XT	962	¥89,800
RTX 4060 Ti 16GB	976	¥69,280
RTX 5070 Ti	1051	¥148,800
RX 7900 XTX	1083	¥154,800
RTX 4070 Ti SUPER	1140	¥142,800
RTX 5070 Ti（実質初期価格）	1151	¥162,980
RTX 4080 SUPER	1165	¥169,800
RTX 5080	1246	¥198,800
RTX 4090	1808	¥323,800
RTX 5090	1816	¥393,800

参考：TechPowerUp

ラスタライズコスパは悪いけど、15万円弱なら準ハイエンドとしては少し良い部類

高性能GPUは高価になるほど全体的にコスパが悪く、「RTX 5070 Ti」も悪いです。

しかし、148,800円での計算なら「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」よりは若干良いです。AI面の強化やマルチフレーム生成対応などを考えれば、代替品としては悪くはないかなと思います。

とはいえ、やはり差は小さいので、従来の価値観が大きく変わるほどの影響はなさそうです。

また、実質的な発売時の最安値価格と言えそうな162,980円で計算すると、高騰前の「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」とほぼ同等のコスパになります。

希望小売価格を大きく超えても意外と悪くないコスパなのはちょっと意外でした。性能的にも劇的な向上ではないですし、わざわざ高価な発売時に買うほどの価値があるかは微妙なところですが…。

1フレームあたりの価格（レイトレーシング）

次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。

1fあたりの価格（1440p@RT）
GPU名称	1フレームあたりの価格	参考価格
Arc A770 16GB	1082	¥39,800
Arc B580	1145	¥49,800
Arc B570	1181	¥44,980
RTX 3060 12GB	1249	¥39,980
RTX 4070	1344	¥86,800
RTX 4060	1350	¥41,980
RTX 4070 SUPER	1356	¥99,800
RX 7700 XT	1366	¥62,980
RTX 3050 8GB	1378	¥28,800
RX 7800 XT	1409	¥75,800
RTX 4060 Ti 16GB	1428	¥69,280
RTX 4060 Ti 8GB	1474	¥57,800
RTX 5070 Ti	1590	¥148,800
RX 7900 XT	1661	¥116,800
RTX 4070 Ti SUPER	1684	¥142,800
RX 7600 XT	1716	¥50,800
RTX 4080 SUPER	1719	¥169,800
RTX 5070 Ti（実質初期価格）	1741	¥162,980
RTX 5080	1888	¥198,800
RX 7900 XTX	1921	¥154,800
RX 7600	2021	¥36,980
RTX 5090	2576	¥393,800
RTX 4090	2674	¥323,800

参考：TechPowerUp

レイトレーシングコスパは総合的に見れば良い方

レイトレーシングコスパは実用性を考慮すれば良い部類だと思います。

全体の位置としてはあまり良くないようにも見えると思いますが、レイトレーシングを実用的に使うにはそれなりの基本性能とVRAMが必須なので、それをある程度満たす高性能GPUに絞れば、意外と上位です。

現状でVRAMを16GBを搭載するGPUでコスパで負けているのは「RX 7800 XT」および「RTX 4060 Ti 16GB」くらいになりますが、どちらもレイトレーシング性能にはやや不安が残る性能ですから、レイトレーシングを十分実用的に使えるGPUとしては一応トップ層のコスパのGPUとなると思います。

ただし、162,980円では微妙な立ち位置になってしまうので、出来れば15万円を切るくらいで買えるようにまではやはり待ちたいGPUだなと思います。

AI・クリエイティブ用途

比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。

一般的な動画編集等の基準性能としてFP32（単精度浮動小数点演算）の理論演算性能、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度の性能をそれぞれ見ていきたいと思います。

また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー（後述）を参考にしています。CPUには「Ryzen 7 9800X3D」、メモリには「DDR5-6000 CL28 32GB（16GBx2）」が使用されています。他の条件について気になる方は参考リンクをご覧ください。

参考ページ

https://hothardware.com/reviews/asus-geforce-rtx-5070-ti-prime-review?page=2
https://hothardware.com/reviews/nvidia-geforce-rtx-5080-blackwell-review?page=2

理論演算性能（FP32）

FP32（単精度浮動小数点演算）は、理論演算性能を示す一つの指標です。単位はTFLOPS（テラフロップス）を用います。実際のテストから算出するものではなく、シェーダーユニット数（対応の演算器の数）とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。

一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能（データ量が多い処理の場合）によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います（完全に一致する訳ではないので注意）。

FP32（単精度浮動小数点演算）
GPU名称	FP32（TFLOPS）
RTX 5090 32GB 1792GB/s	104.8
RTX 4090 24GB 1008GB/s	82.58
RX 7900 XTX 24GB 960GB/s	61.42
RTX 5080 16GB 960GB/s	56.28
RTX 4080 SUPER 16GB 736.3GB/s	52.22
RX 7900 XT 20GB 800GB/s	51.48
RTX 4080 16GB 716.8GB/s	48.74
RX 7900 GRE 16GB 576GB/s	45.98
RTX 4070 Ti SUPER 16GB 672GB/s	44.10
RTX 5070 Ti 16GB 896GB/s	43.94
RTX 4070 Ti 12GB 504GB/s	40.09
RX 7800 XT 16GB 624GB/s	37.32
RTX 4070 SUPER 12GB 504GB/s	35.48
RX 7700 XT 12GB 432GB/s	35.17
RTX 3080 10GB 760GB/s	29.77
RTX 4070 12GB 504GB/s	29.15
RX 7600 XT 16GB 288GB/s	22.57
RTX 4060 Ti 8GB / 16GB 288GB/s	22.06
RTX 3070 Ti 8GB 608GB/s	21.75
RX 7600 8GB 288GB/s	21.75
RX 6800 XT 16GB 512GB/s	20.74
RTX 3070 8GB 448GB/s	20.31
Arc A770 16GB 16GB 560GB/s	17.20
RTX 3060 Ti 8GB 448GB/s	16.20
RX 6800 16GB 512GB/s	16.17
RTX 4060 8GB 272GB/s	15.11
Arc B580 12GB 456GB/s	13.67
RX 6700 XT 12GB 384GB/s	13.21
RTX 3060 12GB 12GB 360GB/s	12.74
Arc B570 10GB 380GB/s	11.52
RX 6600 XT 8GB 256GB/s	10.61
RTX 3050 8GB 224GB/s	9.10
RX 6600 8GB 224GB/s	8.93

理論性能コスパは良くない

「RTX 5070 Ti」のFP32（単精度浮動小数点演算）の理論性能は約43.94TFLOPSです。非常に優れていますが、「RTX 4070 Ti SUPER」とほぼ同じです。コア数が少し増えたものの、クロックが下がったので、最終的にはほぼ同じ数値に落ち着いています。そして、価格が非常に高価なのでコスパは悪いです。

VRAM容量の16GBも価格を考えると不満が残るレベルだと思うので、色んな方面から見て理論性能コスパ的には「RTX 5070 Ti」は弱めです。ただし、「RTX 5080」よりは少しマシではあると思います。

MLPerf Client（AI性能）

「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。

幅広い環境で使えるONNX（DirectML）をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。

MLPerf Client 総合スコア（幾何平均）
GPU名称	総合スコア（幾何平均）
RTX 5090	244.68
RTX 4090	176.57
RTX 5080	155.06
RTX 5070 Ti	146.90
RTX 4080	134.76
RX 7900 XTX	127.44
RTX 4070 Ti	107.72

参考：HotHardware

AIは汎用のONNX（DirectML）では「RTX 4080」を約9%上回る

汎用のAIテスト（ONNX）では「RTX 4080」を約9%上回る結果となりました。ゲームテストでは若干下回ることが多かったですから、AI面は特に大きく向上していることがわかります。

Procyon Stable Diffusion（AIイラスト生成）

現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。

「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。

ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。

また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT（NVIDIA）、Open VINO（Intel）、ROCm（AMD）といったものがありますが、2024年12月時点ではROCm（AMD）は現状Windowsでのネイティブ動作に対応していません（Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど）。

そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML（ONNX）の3つとなっており、AMD製のGPU（Radeon等）のみ汎用のDirect ML（ONNX）を使わざるを得ず、低めの性能となっている点に注意が必要です。

※しかし、記事執筆時点ではRTX 50（Blackwell）がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。

Procyon Stable Diffusion XL 総合スコア（1024×1024）
GPU名称	スコア
RTX 4090（Tensor RT）	5073
RTX 5090（ONNX）	5073
RTX 4090（ONNX）	3985
RTX 4080（Tensor RT）	3437
RTX 4070 Ti（Tensor RT）	2956
RTX 5080（ONNX）	2920
RTX 4080（ONNX）	2499
RTX 5070 Ti（ONNX）	2203
RTX 4070 Ti（ONNX）	1944
RX 7900 XTX（ONNX）	1458

参考：HotHardware

ONNXの参考記録だけど、AI画像生成では「RTX 4080」に少し劣る

Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。

代わりに汎用のONNX（DirectML）での結果を確認してみると、「RTX 4080」を約18.2%上回る性能でした。「RTX 4070 Ti」との差も小さく、さほど向上していないように見えます。

ただし、TensorRTに対応していないなど、RTX 50シリーズへの最適化がちょっと怪しいので、参考程度に見て置いた方がよいかもしれません。

とはいえ、性能自体は高性能で、現状でも十分実用的に使える性能ではあります。

Blender（GPUレンダリング）

「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。

「Blender 4.3」では、Nvidia Optix、Intel oneAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。

Blender Benchmarks（4.3.0）
GPU名称	総合スコア（幾何平均）
RTX 5090	4769
RTX 4090	3503
RTX 5080	2819
RTX 4080	2653
RTX 5070 Ti	2308
RTX 4070 Ti	1991
RX 7900 XTX	1324

参考：HotHardware

Blenderのレンダリング性能は「RTX 4080」にやや劣る

BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、向上はほとんど見られません。「RTX 4080」を約13%下回る性能です。

とはいえ、性能自体は非常に高性能です。「RTX 4070 Ti SUPER」よりは高負荷時のワットパフォーマンスも良いので、重いレンダリング処理用としても十分に使えます。

Blackmagic RAW（デコード速度）

「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するベンチマークです。GPUを使用する場合にはCUDAかOpenCLを使うことになり、CUDAを使えるGeForceが有利な傾向があります。

また、このテストは圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率（12:1）での8Kおよび4Kのテストでのデコード速度（1秒あたりのフレーム数）を見ていきます。

Blackmagic RAW 4.3.1 デコード速度（8K/12:1）
GPU名称	スコア
RTX 5090	251
RTX 5080	216
RTX 5070 Ti	203
RTX 4090	202
RTX 4080	180
RTX 4070 Ti	172
RX 7900 XTX	108

参考：HotHardware

Blackmagic RAW 4.3.1 デコード速度（4K/12:1）
GPU名称	スコア
RTX 5090	1005
RTX 5080	867
RTX 5070 Ti	814
RTX 4090	810
RTX 4080	721
RTX 4070 Ti	688
RX 7900 XTX	433

参考：HotHardware

「RTX 4090」と同等のRAWデコード速度

RAWのデコード速度テストでは、「RTX 4090」とほぼ同じ性能でした。非常に優れたメディアエンジン性能です。

ちなみに、このテストとは別の話になりますが、「RTX 5070 Ti」はデコーダ（NVDEC）は1基となっており、「RTX 5080」の2基と比べると一つ少ないので、動画目的ならその点は一応注意。エンコーダ（NVENC）については2基で同じなので、逆にエンコードのコスパ的には「RTX 5070 Ti」の方が良いです。

まとめ

GeForce RTX 5070 Ti

良い点

「RTX 4080 SUPER」を若干下回る程度の非常に優れた処理性能（AI関連はやや大きめの性能向上率）
希望小売価格は「RTX 4070 Ti SUPER」よりも50ドル安い（ただし、日本では円安で価格上昇）
非常に優れたワットパフォーマンス（ただし、前世代のトップ層レベルで新世代感は無し）
DLSS 4のマルチフレーム生成対応
レイトレーシングの実用コスパは高め
非常に優れたメディアエンジン

気になる点

非常に高価（想定価格：約15万円～）
価格の割には少ない16GB VRAM
消費電力が多い（TGP：300W）
「RTX 4070 Ti SUPER」からの基本性能向上率は小さめ（10%台前半）だけど、実売価格は上昇
サイズが大型
AIを含まないクリエイティブ性能は「RTX 4070 Ti SUPER」と大して変わらない

RTX 5070 Ti：「RTX 4080 SUPER」に近い性能で749ドル。「RTX 4070 Ti SUPER」代替品としては悪くないか少し良いレベルだけど、実売価格が気になる

「RTX 5070 Ti」は「RTX 4080 SUPER」を若干下回るくらいの性能を発揮する準ハイエンドGPUです。VRAMも16GB搭載しており、重い処理でも十分実用的に運用できる高性能GPUです。

実質的な先代と言える「RTX 4070 Ti SUPER」と比較すると、フルHD～1440pゲームでは10%台前半程度の向上率となっており、新世代の向上率としては物足りないものの、やや向上しています。ワットパフォーマンスも「RTX 4070 Ti SUPER」よりはやや改善しています。

それでいて、米国での希望小売価格は749ドルとなっており、「RTX 4070 Ti SUPER」の799ドルよりも50ドル安いのは嬉しいです。AI性能の強化やDLSS 4のマルチフレーム生成やニューラルレンダリングのことも考えると実質的なコスパはかなり良くなりそうな感じがあります。

特に、マルチフレーム生成の効果はめちゃくちゃ大きくて、フレームレートを最大化する設定なら、DLSS 3をフル活用した「RTX 4090」すらも大きく上回るフレームレートを叩き出すことが出来ます。

ただし、残念なのは、日本では円安が進んでいるため実売価格ではむしろ上昇してしまっており、発売時の最安値は148,800円と非常に高価になっている点です。「RTX 4070 Ti SUPER」の日本での発売時価格よりも約2万円高いです。しかも、それすらもアリバイ価格で、実際には16万円程度からと言われていたりします。

これでは安かった頃の「RTX 4070 Ti SUPER」と比較してしまうと微妙に見えてしまいますが、既に「RTX 4070 Ti SUPER」および「RTX 4080 SUPER」の在庫がほぼ無くなってしまっているため、その価格でも売れそうな気もするのが何とも言えないところです。

とはいえ、16万円台前半でも「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」と基本性能コスパは同等レベルなので、RTX 50からの新機能やAI性能強化を考えれば、実質コスパ的には少し上回ることにはなるとは思います。そのため、「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」の代替品としては悪くないですし、むしろ少し良いと言えるレベルかなと思います。

ただし、やはり少し気になる点もあるので、個人的には出来ればもう少し安くなってから買いたいGPUなのかな思います。

気になる点一つ目はVRAM容量です。16GBは強力ですが、10万円台中盤のGPUとしては物足りなさはあります。希望小売価格よりも大幅に高い価格では魅力を感じない個人的な一番の理由はこれです。

ワットパフォーマンスも「RTX 4070 Ti SUPER」が「RTX 40シリーズ」の中では若干悪めの位置に居たために大きめに改善したように見えるものの、「RTX 4070 SUPER」や「RTX 4080 / 4080 SUPER」と比較すると、明確に良くなってはいないです。

目玉機能の一つの「マルチフレーム生成」も、効果自体は非常に大きいものの、「RTX 5070 Ti」レベルの性能なら従来のフレーム生成でもほとんどの条件で快適な性能を得ることができますので、実用性能的にはプラスと言えるのか、という疑問もあります。

実売価格がちゃんと「RTX 4070 Ti SUPER」よりも安いか、148,800円のモデルの在庫が十分であれば普通に高評価をあげることが出来たと思うのですが…。今後の価格に期待です。

また、これは「RTX 5070 Ti」の評価というより「RTX 50シリーズ」への所感という感じですが、新世代というよりは「RTX 40シリーズ」のリフレッシュ版か、AI性能強化版という感じで捉えた方がしっくりくる感じがしました。

といった感じで、本記事は以上になります。ご覧いただきありがとうございました。