「GeForce RTX 5070 Ti」ざっくり評価【性能比較】

「GeForce RTX 5070 Ti」のざっくり性能比較・評価です。海外レビューを参考に性能をざっくりと確認していきます。

注意

本記事の情報は記事執筆時点(2025年2月21日)のものです。ご覧になっている際には異なる可能性があるため注意してください。

仕様

まずは主要な仕様を表にまとめて載せています。

簡易比較表

※価格は2025年2月21日時点での米での希望小売価格です(判明しているもののみ)。
※GPU名のリンクはAmazonのものです。

GPUシェーダー
ユニット数
メモリタイプVRAM速度
VRAM帯域幅
レイトレ用
ユニット数
ダイサイズ
(おおよそ)
消費電力
(TGP等)
希望小売

RTX 509021760GDDR7
32GB 512bit
28.0Gbps
1792GB/s
170750㎟575W1,999ドル
RTX 409016384GDDR6X
24GB 384bit
21.0Gbps
1008GB/s
128608㎟450W1,599ドル
RTX 508010752GDDR7
16GB 256bit
30.0Gbps
960GB/s
84378㎟360W999ドル
RTX 4080 SUPER10240GDDR6X
16GB 256bit
23.0Gbps
736.3GB/s
80380㎟320W999ドル
RTX 40809728GDDR6X
16GB 256bit
22.4Gbps
716.8GB/s
76380㎟320W1,199ドル
→市場廃止
RTX 5070 Ti8960GDDR7
16GB 256bit
28.0Gbps
896GB/s
70378㎟300W749ドル
RX 7900 XTX6144GDDR6
24GB 384bit
20Gbps
960GB/s
9636.6㎟*6 +
300㎟
355W969ドル
RX 7900 XT5376GDDR6
20GB 320bit
20Gbps
800GB/s
8436.6㎟*6 +
300㎟
315W799ドル
→749ドル?
RTX 4070 Ti SUPER8448GDDR6X
16GB 256bit
21.0Gbps
672GB/s
66295㎟285W799ドル
RTX 4070 Ti7680GDDR6X
12GB 192bit
21.0Gbps
504GB/s
60295㎟285W799ドル
→市場廃止
RTX 50706144GDDR7
12GB 192bit
28?Gbps
672GB/s
48??㎟250W549ドル
RTX 3090 Ti10752GDDR6X
24GB 384bit
21.0Gbps
1008GB/s
84628.4㎟450W1,499ドル
RTX 309010496GDDR6X
24GB 384bit
19.5Gbps
936GB/s
82628.4㎟350W1,299ドル
RX 7900 GRE5120GDDR6
16GB 256bit
18Gbps
576GB/s
8036.6㎟*6 +
300㎟
260W549ドル
RX 6950 XT5120GDDR6
16GB 256bit
18Gbps
576GB/s
80519㎟335W949ドル
RX 6900 XT5120GDDR6
16GB 256bit
16Gbps
512GB/s
80519㎟300W699ドル
RTX 3080 Ti10240GDDR6X
12GB 384bit
19Gbps
912GB/s
80628.4㎟350W1,099ドル
RTX 3080 10GB8704GDDR6X
10GB 320bit
19Gbps
760GB/s
68628.4㎟320W699ドル
RTX 4070 SUPER7168GDDR6X
12GB 192bit
21.0Gbps
504GB/s
56295㎟220W599ドル
RTX 40705888GDDR6X
12GB 192bit
21.0Gbps
504GB/s
46295㎟200W549ドル
前:599ドル
RX 7800 XT3840GDDR6
16GB 256bit
19.5Gbps
624GB/s
6037.5㎟*4 +
200㎟
263W499ドル
RX 6800 XT4608GDDR6
16GB 256bit
16Gbps
512GB/s
72519㎟300W599ドル
RTX 3070 Ti6144GDDR6X
8GB 256bit
19Gbps
608GB/s
48392㎟290W599ドル
RX 68003840GDDR6
16GB 256bit
16Gbps
512GB/s
60519㎟250W549ドル
RX 7700 XT3456GDDR6
12GB 192bit
18Gbps
432GB/s
5437.5㎟*4 +
200㎟
245W419ドル
前:449ドル
RTX 4060 Ti 8GB4352GDDR6
8GB 128bit
18Gbps
288GB/s
34190㎟160W399ドル
RTX 30705888GDDR6
8GB 256bit
14Gbps
448GB/s
46392㎟220W499ドル
RX 6750 XT2560GDDR6
12GB 192bit
18Gbps
432GB/s
40336㎟250W419ドル
RTX 3060 Ti4864GDDR6
8GB 192bit
14Gbps
448GB/s
38392㎟200W399ドル
RX 6700 XT2560GDDR6
12GB 192bit
16Gbps
384GB/s
40336㎟230W379ドル
Arc A770 16GB4096GDDR6
16GB 256bit
17.5Gbps
560GB/s
32406㎟225W349ドル
Arc A770 8GB4096GDDR6
8GB 256bit
16Gbps
512GB/s
32406㎟225W329ドル
Arc B5802560GDDR6
12GB 192bit
19Gbps
456GB/s
20272㎟190W249ドル
RX 7600 XT2048GDDR6
16GB 128bit
18Gbps
288GB/s
32204㎟190W329ドル
RTX 40603072GDDR6
8GB 128bit
17Gbps
272GB/s
24156㎟115W299ドル
Arc B5702304GDDR6
10GB 160bit
19Gbps
380GB/s
18272㎟150W219ドル
RX 6650 XT2048GDDR6
8GB 128bit
17.5Gbps
288GB/s
32237㎟180W299ドル
RX 76002048GDDR6
8GB 128bit
18Gbps
288GB/s
32204㎟165W269ドル
RX 6600 XT2048GDDR6
8GB 128bit
16Gbps
256GB/s
32237㎟160W
Arc A7503584GDDR6
16GB 256bit
16Gbps
512GB/s
28406㎟225W289ドル
RX 66001792GDDR6
8GB 128bit
14Gbps
224GB/s
28237㎟132W239ドル
RTX 3060 12GB3584GDDR6
12GB 192bit
15Gbps
360GB/s
28276㎟170W329ドル
RTX 30502560GDDR6
8GB 128bit
15Gbps
224GB/s
20276㎟130W249ドル

前世代との比較

「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。

RTX 50シリーズでは前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われますが、元々コア性能が上がっても向上を感じられないコア数表記は問題がある部分だったので、表記を切り替える良い機会になったのかなと思います。

GPU希望
小売価格
GPUVRAMTGP
CUDAコアTensorコア
(AI TOPS)
RTコア
(TFLOPS)
クロック
最大(GHz)
容量/タイプバス幅帯域幅(GB/s)
RTX 50901999ドル2176033523182.4132GB GDDR7512bit1792575W
RTX 40901599ドル1638413211912.5224GB GDDR6X384bit1008450W
RTX 5080999ドル1075218011712.6216GB GDDR7256bit960360W
RTX 4080 SUPER999ドル102408361212.5516GB GDDR6X256bit736320W
RTX 5070 Ti749ドル896014061332.4516GB GDDR7256bit896300W
RTX 4070 Ti SUPER799ドル84487801022.6116GB GDDR6X256bit672285W
RTX 4070 SUPER599ドル7168568932.4812GB GDDR6X192bit504220W
RTX 5070549ドル6144988942.5112GB GDDR7192bit672250W
RTX 4070549ドル5888466672.4812GB GDDR6X
12GB GDDR6
192bit504200W

今回見ていくのはNVIDIA「GeForce RTX 5070 Ti」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」の準ハイエンドモデルです。

VRAM容量が「RTX 5080」と同じ16GBながら価格は大幅に安価ということで、非常に注目が集まるモデルとなっていると思います。

メーカー希望小売価格は749ドルで、国内想定価格は148,800円~となっています。「RTX 4070 Ti SUPER」の799ドルよりも50ドル安い設定となっていますが、以前よりも円安になっている他、AI需要が以前よりも高まっていることもあり、国内想定価格は「RTX 4070 Ti SUPER」の登場時(127,380円~)よりも約2万円ほど高い設定となっています。

また、148,800円~という価格は「アリバイ価格」などと呼ばれるごく少数の在庫しかないと言われていることもあり、価格は発売後どうなるか動向を見守りたいところです。

ダイには「RTX 5080」と同じGB203が使用されており、RTX 5080では84個の利用可能なストリーミングプロセッサ全てが有効となっていますが、「RTX 5070 Ti」では84個の内の70個が有効化されています。CUDAコア数は8,960となっており、「RTX 4070 Ti SUPER」と比較すると約6%のわずかな増量で、最大クロックはわずかに低下しています。

ここで触れておきたいのは、既に登場している「RTX 5080」を見る限り、RTX 40からのアーキテクチャ更新による基本性能の向上はわずかと考えられる点です。

考えられている主な理由は、製造プロセスがほぼ変わらないと噂されていることが挙げられます。前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも4Nと同じ「5nm EUV」で製造されていると言われています。

そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」なので、プロセスルールの微細化はされていない可能性が高そうという感じです。そのため、主に基本性能や電力効率(ワットパフォーマンス)面では大きな改善が見られないかもしれないのが懸念点です。

製造プロセスでの進化があまり見込めない上、コア数の上昇もわずかでクロックも下がっているので、性能向上率は小さいのではないかと発売前から不安視されていました。詳しいところはこの後見ていきます。

ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。

特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5070 Ti」のAIの理論上のピーク性能(INT8)は 1406 TOPSとなっており、これは「RTX 4070 Ti SUPER」の約1.8倍という大きな向上率です。AIについては特に設計の面で相当な改良が加えられていることがわかります。

そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成ニューラルレンダリングなど、AIをフル活用する技術も追加されました。

AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。

そのAIでも重要なVRAMですが、「RTX 5070 Ti」では GDDR7 16GB、帯域幅は896 GB/sとなっています。「RTX 4070 Ti SUPER」と容量は同じで、帯域幅が向上しています。

強力なVRAMだとは思いますが、約15万円~のGPUとしては正直物足りなさもある仕様です。AMDの「RX 7800 XT」は16GB VRAMを搭載しつつ、安い時期では7万円台中盤で販売されていました。

しかし、少し後に登場する「RTX 5070」が12GBなので、ハイエンド用途でも十分な性能を維持したいなら「RTX 5070 Ti」を選びたいところなので、難しいところです。

「RTX 5070」より下位のGPUの展開は現状はまだ不明ですが、「RTX 4060 Ti 16GB」のように「RTX 5060 Ti 16GB」が投入され、前世代よりも10%以上の性能向上があるのなら、そちらへ人気が集中する可能性もあるかもしれません。

しかし、ここまでの向上率を見る限り、5060 Tiの性能は従来のアッパーミドルクラスの域を超えなさそうなので、高性能な16GB GPUが欲しかった人は、「RTX 4070 Ti SUPER」を安い時期に導入しておけば良かったと思っている人は結構多いかもしれません。

最後に消費電力ですが、「RTX 5070 Ti」のTGPは300Wとなっています。「RTX 4070 Ti SUPER」の285Wからわずかに上昇しています。

性能向上率もわずかな感じがすることも併せて考えると、ワットパフォーマンスも大して向上していない感じがカタログスペックの時点でも出ている気がします。

DLSS 4、ニューラルレンダリング

「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。ご存じの方は飛ばして貰って構いません。

まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。

DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。

また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。

マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。

次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。

従来はグラフィックスAPI内でTensorコア(AI)を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。

これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。

DLSSやFSRといった別機能ではなく、グラフィックスAPI(DirectX)の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR(レイトレーシング)単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。

といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。

ゲーミング性能(ラスタライズ)

ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。

まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能(ラスター性能)を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。

使用されたグラフィックボードは「MSI GeForce RTX 5070 Ti Ventus 3X OC」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。


フルHD(1920×1080)

フルHD(1920×1080)です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。

平均FPS(1080p 最高設定)
GPU名称平均FPS
RTX 5090
251.1
RTX 4090
225.0
RTX 5080
203.5
RTX 4080 SUPER
190.3
RTX 4080
187.8
RTX 5070 Ti
184.2
RX 7900 XTX
184.1
RTX 4070 Ti SUPER
166.8
RX 7900 XT
164.3
RTX 4070 Ti
160.0
RTX 4070 SUPER
148.0
RTX 3090
141.9
RX 7900 GRE
141.3
RTX 4070
129.8
RX 7800 XT
128.3
RTX 3080 10GB
127.2
RX 6800 XT
125.8
RX 7700 XT
110.6
RTX 3070
100.8
RTX 4060 Ti 16GB
99.9
RTX 4060 Ti 8GB
98.7
RX 6700 XT
88.7
RTX 3060 Ti
88.2
Arc B580
82.6
RX 7600 XT
78.9
RTX 4060
78.6
Arc B570
72.9
RX 7600
72.1
Arc A770 16GB
71.8
RX 6600 XT
68.8
RTX 3060 12GB
67.4
RX 6600
59.0
Arc A580
58.5
RTX 3050 8GB
48.3
参考:TechPowerUp

フルHDは「RTX 4070 Ti SUPER」を約10.4%上回る性能

フルHDのラスタライズ性能は「RTX 4070 Ti SUPER」を約10.4%上回る性能となっています。事前の予測通り、新世代の向上率としてはやや控えめです。「RTX 4080 SUPER」と比較すると約3.2%下回る性能となっており、近い性能です。

米国(ドル)の希望小売価格は「RTX 4070 Ti SUPER」から50ドル安くなったものの、円安の影響もあって、初期の実売価格としては大幅に高くなってしまっているので、コスパは劇的には良くなっていなさそうです

また、「RTX 50シリーズ」目玉機能にはDLSS 4のマルチフレーム生成がありますが、「RTX 5070 Ti」レベルの性能であればフルHDならマルチフレーム生成が無くても十分なパフォーマンスが得られるので、フルHDにおいてはRTX 50だから有利という感じはあまり無いと思います。


1440p(2560×1440)

WQHD(2560×1440)です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。

平均FPS(1440p 最高設定)
GPU名称平均FPS
RTX 5090
216.8
RTX 4090
179.1
RTX 5080
159.6
RTX 4080 SUPER
145.8
RTX 4080
143.4
RX 7900 XTX
142.9
RTX 5070 Ti
141.6
RTX 4070 Ti SUPER
125.3
RX 7900 XT
123.8
RTX 4070 Ti
117.7
RTX 4070 SUPER
108.4
RTX 3090
107.6
RX 7900 GRE
104.5
RX 7800 XT
95.2
RTX 3080 10GB
95.3
RX 6800 XT
93.3
RTX 4070
94.0
RX 7700 XT
80.7
RTX 3070
73.8
RTX 4060 Ti 16GB
71.0
RTX 4060 Ti 8GB
70.4
RX 6700 XT
64.3
RTX 3060 Ti
64.3
Arc B580
61.4
RX 7600 XT
55.7
RTX 4060
55.5
Arc A770 16GB
54.6
Arc B570
53.4
RX 7600
49.7
RTX 3060 12GB
48.6
RX 6600 XT
47.7
Arc A580
43.4
RX 6600
40.8
RTX 3050 8GB
34.6
参考:TechPowerUp

1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能

1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能となっています。帯域幅の向上が活きはじめたのか、フルHDよりも差が若干広がっています。

「RTX 4080 SUPER」との差は約2.9%とほぼ変わらず、近い性能となっています。

フルHDよりは負荷が高いためマルチフレーム生成が活きる場面はありそうなものの、ほとんどのゲームでは従来のフレーム生成でも十分なパフォーマンスが得られるとは思うので、やはり強みとしては小さめかなと思います。


4K(3840×2160)

「超高解像度の代名詞」という感じの解像度の4K(3840×2160)です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。

平均FPS(4K 最高設定)
GPU名称平均FPS
RTX 5090
147.1
RTX 4090
109.2
RTX 5080
96.7
RTX 4080 SUPER
85.5
RTX 5070 Ti
85.0
RX 7900 XTX
84.7
RTX 4080
84.1
RTX 4070 Ti SUPER
72.3
RX 7900 XT
71.5
RTX 4070 Ti
66.3
RTX 3090
64.5
RTX 4070 SUPER
60.9
RX 7900 GRE
59.3
RTX 3080 10GB
55.9
RX 7800 XT
54.5
RTX 4070
52.7
RX 6800 XT
53.1
RX 7700 XT
44.6
RTX 3070
42.0
RTX 4060 Ti 16GB
38.6
RTX 4060 Ti 8GB
38.5
Arc B580
36.2
RTX 3060 Ti
36.0
RX 6700 XT
35.6
Arc A770 16GB
31.8
Arc B570
30.9
RX 7600 XT
30.3
RTX 4060
29.7
RTX 3060 12GB
27.4
RX 7600
24.7
RX 6600 XT
24.7
Arc A580
24.6
RX 6600
20.7
RTX 3050 8GB
18.7
参考:TechPowerUp

4Kでは「RTX 4080 SUPER」とほぼ同等の性能

4Kでは「RTX 4080 SUPER」とほぼ同等の性能となっています。VRAMの帯域幅の向上が活きていそうな感じです。「RTX 4070 Ti SUPER」との比較での差は約17.6%にまで広がっています。

VRAM帯域が重要な処理なら15万円程度で「RTX 4080 SUPER」と同じ性能が得られ、ワットパフォーマンスやAI性能も少し向上するということであれば、一定の需要はありそうな感じがします。

また、4Kレベルの負荷ならDLSS 4のマルチフレーム生成も非常に大きな強みとなるので、そこも考慮するならより高い評価となると思います。遅延は気になるところですが、低fpsのまま運用するよりは優れた体験になると思います。

電力関連

消費電力

ゲームプレイ時(高負荷時)の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」、「S.T.A.L.K.E.R. 2」、「Marvel’s Spider-Man 2」の3種類で「3840×2160(4K)」のウルトラ設定でレイトレーシングは無効です。ただし、VRAMサイズによる影響が大きくなりすぎないように、テクスチャ設定は「低」に設定されています。

GPU平均消費電力(ゲーミング)
GPU名称消費電力
RTX 4060
123
RTX 3050 8GB
126
RTX 4060 Ti 8GB
141
RX 6600 XT
144
Arc B570
154
RTX 4060 Ti 16GB
154
RX 7600
156
Arc B580
165
RTX 3060 12GB
173
RX 7600 XT
191
RTX 4070
193
RTX 3060 Ti
203
Arc A580
209
RTX 4070 SUPER
210
RX 6700 XT
217
RTX 3070
220
RX 7700 XT
222
Arc A770 16GB
226
RX 6800
232
RX 7800 XT
250
RTX 4070 Ti
252
RX 7900 GRE
265
RTX 4070 Ti SUPER
285
RTX 5070 Ti
287
RTX 4080 SUPER
289
RTX 4080
289
RX 6800 XT
295
RTX 5080
296
RX 7900 XT
312
RTX 3080 10GB
334
RX 7900 XTX
354
RTX 3090
358
RTX 4090
391
RTX 5090
520
参考:TechPowerUp

ゲーム時の平均消費電力はTGPよりもやや少なめの287W

ゲーム時の平均消費電力は287Wとなっており、TGPの300Wよりもやや少なめです。「RTX 4070 Ti SUPER」とほぼ同等となっています。

性能は10%以上向上しているので、ワットパフォーマンスも改善していることがわかります。

ワットパフォーマンス

ワットパフォーマンス(電力効率)を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています

環境は消費電力はおよび4Kは「Cyberpunk 2077(Ultra/レイトレ無効)」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。

ワットパフォーマンス(1080p/25ゲーム平均)
GPU名称1フレームあたりの消費電力
RTX 4070 SUPER
1.42
RTX 4060 Ti 8GB
1.43
RTX 5080
1.45
RTX 4070
1.49
RTX 4080 SUPER
1.52
RTX 4080
1.54
RTX 4060 Ti 16GB
1.54
RTX 5070 Ti
1.56
RTX 4060
1.56
RTX 4070 Ti
1.58
RTX 4070 Ti SUPER
1.71
RTX 4090
1.74
RX 7900 GRE
1.88
RX 7900 XT
1.90
RX 7900 XTX
1.92
RX 7800 XT
1.95
Arc B580
2.00
RX 7700 XT
2.01
RTX 5090
2.07
RX 6600 XT
2.09
Arc B570
2.13
RX 7600
2.16
RX 6800
2.18
RTX 3070
2.18
RTX 3060 Ti
2.30
RX 6800 XT
2.34
RX 7600 XT
2.42
RX 6700 XT
2.45
RTX 3090
2.52
RTX 3060 12GB
2.57
RTX 3050 8GB
2.61
RTX 3080 10GB
2.63
Arc A770 16GB
3.15
Arc A580
3.57
参考:TechPowerUp
ワットパフォーマンス(1440p/25ゲーム平均)
GPU名称1フレームあたりの消費電力
RTX 5080
1.85
RTX 4070 SUPER
1.94
RTX 4080 SUPER
1.98
RTX 4060 Ti 8GB
2.00
RTX 4080
2.02
RTX 5070 Ti
2.03
RTX 4070
2.05
RTX 4070 Ti
2.14
RTX 4060 Ti 16GB
2.17
RTX 4090
2.18
RTX 4060
2.22
RTX 4070 Ti SUPER
2.27
RTX 5090
2.40
RX 7900 XTX
2.48
RX 7900 XT
2.52
RX 7900 GRE
2.54
RX 7800 XT
2.63
Arc B580
2.69
RX 7700 XT
2.75
Arc B570
2.90
RX 6800
2.92
RTX 3070
2.98
RX 6600 XT
3.02
RX 7600
3.14
RX 6800 XT
3.16
RTX 3060 Ti
3.16
RTX 3090
3.33
RX 6700 XT
3.37
RX 7600 XT
3.43
RTX 3060 12GB
3.46
RTX 3080 10GB
3.50
RTX 3050 8GB
3.64
Arc A770 16GB
4.14
Arc A580
4.82
参考:TechPowerUp
ワットパフォーマンス(4K/25ゲーム平均)
GPU名称1フレームあたりの消費電力
RTX 5080
3.06
RTX 5070 Ti
3.38
RTX 4080 SUPER
3.38
RTX 4080
3.44
RTX 4070 SUPER
3.45
RTX 5090
3.53
RTX 4090
3.58
RTX 4070
3.66
RTX 4070 Ti
3.80
RTX 4060 Ti 8GB
3.86
RTX 4070 Ti SUPER
3.94
RTX 4060 Ti 16GB
3.99
RTX 4060
4.14
RX 7900 XTX
4.18
RX 7900 XT
4.36
RX 7900 GRE
4.47
Arc B580
4.56
RX 7800 XT
4.59
RX 7700 XT
4.98
Arc B570
5.02
RX 6800
5.09
RTX 3070
5.24
RTX 3090
5.55
RX 6800 XT
5.56
RTX 3060 Ti
5.64
RX 6600 XT
5.83
RTX 3080 10GB
5.97
RX 6700 XT
6.10
RX 7600 XT
6.30
RTX 3060 12GB
6.31
RX 7600
6.32
RTX 3050 8GB
6.74
Arc A770 16GB
7.11
Arc A580
8.50
参考:TechPowerUp

ワットパフォーマンスは非常に良いけど、RTX 4080と同等レベル

ワットパフォーマンスは非常に良いですが、「RTX 4080 / RTX 4080 SUPER」と同等レベルであり、前世代から大きな向上には至っていません。

結果としては残念ですが、ポジティブに考えると、「RTX 4070 Ti SUPER」が前世代の中では若干悪いワットパフォーマンスだったのが少し改善されています。

DLSS 4のマルチフレーム生成など、RTX 50から対応する機能を活かせれば実質的なワットパフォーマンスは更に上がりますし、代替品としては十分な性能かなと思えないこともないです。

レイトレーシング性能

レイトレーシング性能

リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。

また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。

レイトレーシングFPS(1080p 平均)
GPU名称平均FPS
RTX 5090
188.7
RTX 4090
158.4
RTX 5080
140.6
RTX 4080 SUPER
131.5
RTX 4080
129.7
RTX 5070 Ti
122.3
RTX 4070 Ti SUPER
115.3
RTX 4070 Ti
110.0
RX 7900 XTX
108.2
RTX 3090 Ti
105.8
RTX 4070 SUPER
101.2
RTX 3090
96.8
RX 7900 XT
95.2
RTX 4070
89.0
RTX 3080 10GB
86.7
RX 7900 GRE
81.9
RX 7800 XT
74.7
RTX 4060 Ti 16GB
68.1
RTX 4060 Ti 8GB
66.0
RTX 3070
65.8
RX 7700 XT
64.1
RX 6800
59.3
Arc B580
58.0
RTX 3060 Ti
56.6
RTX 4060
51.3
Arc A770 16GB
49.5
RX 6700 XT
48.5
Arc B570
47.2
RTX 3060 12GB
44.9
RX 7600 XT
42.9
Arc A580
38.8
RX 6600 XT
34.4
RX 7600
34.2
RTX 3050 8GB
31.8
RX 6600
29.9
参考:TechPowerUp
レイトレーシングFPS(1440p 平均)
GPU名称平均FPS
RTX 5090
152.9
RTX 4090
121.1
RTX 5080
105.3
RTX 4080 SUPER
98.8
RTX 4080
97.7
RTX 5070 Ti
93.6
RTX 4070 Ti SUPER
84.8
RX 7900 XTX
80.6
RTX 4070 Ti
80.5
RTX 3090 Ti
79.7
RTX 4070 SUPER
73.6
RTX 3090
72.5
RX 7900 XT
70.3
RTX 4070
64.6
RTX 3080 10GB
64.3
RX 7900 GRE
59.3
RX 7800 XT
53.8
RTX 4060 Ti 16GB
48.5
RX 7700 XT
46.1
Arc B580
43.5
RX 6800
42.7
RTX 3070
41.4
RTX 4060 Ti 8GB
39.2
Arc B570
38.1
Arc A770 16GB
36.8
RTX 3060 Ti
36.1
RX 6700 XT
33.7
RTX 3060 12GB
32.0
RTX 4060
31.1
RX 7600 XT
29.6
Arc A580
29.1
RTX 3050 8GB
20.9
RX 6600 XT
18.6
RX 7600
18.3
RX 6600
16.5
参考:TechPowerUp
レイトレーシングFPS(4K 平均)
GPU名称平均FPS
RTX 5090
98.4
RTX 4090
75.9
RTX 5080
63.3
RTX 4080 SUPER
58.2
RTX 4080
57.1
RTX 5070 Ti
53.4
RTX 4070 Ti SUPER
49.2
RTX 3090 Ti
47.7
RX 7900 XTX
46.8
RTX 4070 Ti
43.2
RTX 3090
42.8
RTX 4070 SUPER
39.4
RX 7900 XT
39.7
RTX 4070
34.6
RTX 3080 10GB
34.6
RX 7900 GRE
33.3
RX 7800 XT
30.0
RTX 4060 Ti 16GB
26.6
RX 7700 XT
24.6
RX 6800
23.7
Arc B580
23.3
RTX 3070
22.9
Arc A770 16GB
21.0
RTX 4060 Ti 8GB
20.0
RTX 3060 Ti
20.0
RX 6700 XT
18.2
Arc B570
18.1
RTX 3060 12GB
17.0
RTX 4060
16.6
RX 7600 XT
15.9
Arc A580
14.6
RTX 3050 8GB
10.8
RX 6600 XT
9.0
RX 7600
9.0
RX 6600
7.9
参考:TechPowerUp

「RTX 4070 Ti SUPER」を6%~10%上回る性能

レイトレーシング性能を「RTX 4070 Ti SUPER」と比較すると、向上率はフルHDで約6.1%、1440pで約10.4%、4Kで約8.5%といった感じになっています。やはり向上率は控えめで、ラスタライズよりも差が若干小さくなっています。

4Kでは向上率が若干下がることから、VRAMが少しボトルネックになるケースが発生しているのかもしれません。

レイトレーシングではVRAM容量が非常に多く、レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするのがちょっと懸念点です。

4Kレイトレーシングを実用する人はほぼ居ないと思うので、弱点として数えるほどではないかもしれませんが、約15万円~のGPUでもボトルネックが若干気になるというのは残念感はあるかなと思います。

ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、ある程度カバーもでき、最終的な性能としては十分なパフォーマンスが大体得られると思うので、考え方次第ではあります。

DLSS

DLSS有効時のゲーム性能

DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要なGeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。

4Kでレイトレーシング有効&最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能の平均を見ていきます。

※表の「FG」は「Frame Generation(フレーム生成)」の略称です。

DLSS有効時のゲームfps(4K/RT Ultra)
GPU名称平均fps
RTX 5070 Ti
DLSS Performance / FGx4
195.0
RTX 5070 Ti
DLSS Quality / FGx4
160.8
RTX 4090
DLSS Performance / FGx2
135.8
RTX 4080 SUPER
DLSS Performance / FGx2
113.8
RTX 5070 Ti
FGx4
111.5
RTX 4090
DLSS Quality / FGx2
109.8
RTX 4080 SUPER
DLSS Quality / FGx2
91.3
RTX 5070 Ti
FGx3
85.8
RTX 4090
FGx2
74.3
RTX 4090
DLSS Quality
64.8
RTX 5070 Ti
FGx2
63.8
RTX 4080 SUPER
FGx2
61.0
RTX 4080 SUPER
DLSS Quality
54.3
RTX 5070 Ti
DLSS Quality
52.5
RTX 4090
ネイティブ
42.8
RX 7900 XTX
FSR Quality
40.8
RTX 4080 SUPER
ネイティブ
34.3
RX 7900 XTX
ネイティブ
24.5
RTX 5070 Ti
ネイティブ
30.8

マルチフレーム生成を使えば「RTX 4090」をも大きく上回る

「RTX 50シリーズ」で利用できるDLSS 4の「マルチフレーム生成」では、従来では1つのフレームにつき1フレームしか生成できなかった(x2)のが、最大で3フレーム(x4)まで生成できるようになりました。

そのため、仮に基本性能が同じだったとしても、マルチフレーム生成を使えば前世代を圧倒的に上回るフレームレートを実現可能です。

「RTX 5070 Ti」でDLSS 4をフル活用すると、DLSS 3のフル機能を使用した「RTX 4090」すらも約43.6%も上回るフレームレートを出すことができます。圧倒的な性能です。

とはいえ、このレベルの性能のGPUなら従来のフレーム生成(x2)だけでも非常に優れたパフォーマンスを発揮できるので、そもそも追加のフレーム生成機能が必要なのか、という点はあります。

実際、上記の性能は「4Kレイトレーシングの最高設定」というものすごく高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。

実際の環境ではフルHD~1440pが中心であることを考えると、x2のフレーム生成の重量級ゲーム&レイトレーシングで「RTX 4070 Ti SUPER」を使用したとしても大体の環境では十分快適だと思われ、マルチフレーム生成はオーバースペック感があります。

とはいえ、マルチフレーム生成の効果は絶大で、性能を飛躍的に向上することができる常識を覆すレベルの機能となっていると思います。


コストパフォーマンス

上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。ラスタライズとレイトレーシング時の両方を見ていきます。

元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。

※各GPUの価格については、従来は記事執筆時点でのおおよその市場価格を基にしていますが、今回は生産終了に伴う品薄&高騰が発生してしまっているので、今回は高騰前の価格で算出しています。

また、「RTX 5070 Ti」の発売時の想定最安値価格は148,800円ですが、実際にはその価格での販売はほぼ無く、162,980円が実質的な市場最安値価格だったので、そちらでも算出して表に含めています。


1フレームあたりの価格(ラスタライズ)

まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。

1fあたりの価格(1440p@RT無し)
GPU名称1フレームあたりの価格参考価格
RX 6600
706
¥28,800
Arc A770 16GB
729
¥39,800
RX 7600
744
¥36,980
RTX 4060
756
¥41,980
RX 7700 XT
780
¥62,980
RX 7800 XT
796
¥75,800
RTX 3060 12GB
800
¥39,980
Arc B580
811
¥49,800
RTX 4060 Ti 8GB
821
¥57,800
RTX 3050 8GB
832
¥28,800
Arc B570
842
¥44,980
RTX 3080 10GB
890
¥84,800
RTX 4070 SUPER
921
¥99,800
RTX 4070
923
¥86,800
RX 7900 XT
943
¥116,800
RX 6800 XT
962
¥89,800
RTX 4060 Ti 16GB
976
¥69,280
RTX 5070 Ti
1051
¥148,800
RX 7900 XTX
1083
¥154,800
RTX 4070 Ti SUPER
1140
¥142,800
RTX 5070 Ti(実質初期価格)
1151
¥162,980
RTX 4080 SUPER
1165
¥169,800
RTX 5080
1246
¥198,800
RTX 4090
1808
¥323,800
RTX 5090
1816
¥393,800
参考:TechPowerUp

ラスタライズコスパは悪いけど、15万円弱なら準ハイエンドとしては少し良い部類

高性能GPUは高価になるほど全体的にコスパが悪く、「RTX 5070 Ti」も悪いです。

しかし、148,800円での計算なら「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」よりは若干良いです。AI面の強化やマルチフレーム生成対応などを考えれば、代替品としては悪くはないかなと思います。

とはいえ、やはり差は小さいので、従来の価値観が大きく変わるほどの影響はなさそうです。

また、実質的な発売時の最安値価格と言えそうな162,980円で計算すると、高騰前の「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」とほぼ同等のコスパになります。

希望小売価格を大きく超えても意外と悪くないコスパなのはちょっと意外でした。性能的にも劇的な向上ではないですし、わざわざ高価な発売時に買うほどの価値があるかは微妙なところですが…。


1フレームあたりの価格(レイトレーシング)

次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。

1fあたりの価格(1440p@RT)
GPU名称1フレームあたりの価格参考価格
Arc A770 16GB
1082
¥39,800
Arc B580
1145
¥49,800
Arc B570
1181
¥44,980
RTX 3060 12GB
1249
¥39,980
RTX 4070
1344
¥86,800
RTX 4060
1350
¥41,980
RTX 4070 SUPER
1356
¥99,800
RX 7700 XT
1366
¥62,980
RTX 3050 8GB
1378
¥28,800
RX 7800 XT
1409
¥75,800
RTX 4060 Ti 16GB
1428
¥69,280
RTX 4060 Ti 8GB
1474
¥57,800
RTX 5070 Ti
1590
¥148,800
RX 7900 XT
1661
¥116,800
RTX 4070 Ti SUPER
1684
¥142,800
RX 7600 XT
1716
¥50,800
RTX 4080 SUPER
1719
¥169,800
RTX 5070 Ti(実質初期価格)
1741
¥162,980
RTX 5080
1888
¥198,800
RX 7900 XTX
1921
¥154,800
RX 7600
2021
¥36,980
RTX 5090
2576
¥393,800
RTX 4090
2674
¥323,800
参考:TechPowerUp

レイトレーシングコスパは総合的に見れば良い方

レイトレーシングコスパは実用性を考慮すれば良い部類だと思います。

全体の位置としてはあまり良くないようにも見えると思いますが、レイトレーシングを実用的に使うにはそれなりの基本性能とVRAMが必須なので、それをある程度満たす高性能GPUに絞れば、意外と上位です。

現状でVRAMを16GBを搭載するGPUでコスパで負けているのは「RX 7800 XT」および「RTX 4060 Ti 16GB」くらいになりますが、どちらもレイトレーシング性能にはやや不安が残る性能ですから、レイトレーシングを十分実用的に使えるGPUとしては一応トップ層のコスパのGPUとなると思います。

ただし、162,980円では微妙な立ち位置になってしまうので、出来れば15万円を切るくらいで買えるようにまではやはり待ちたいGPUだなと思います。

AI・クリエイティブ用途

比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。

一般的な動画編集等の基準性能としてFP32(単精度浮動小数点演算)の理論演算性能、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度の性能をそれぞれ見ていきたいと思います。

また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー(後述)を参考にしています。CPUには「Ryzen 7 9800X3D」、メモリには「DDR5-6000 CL28 32GB(16GBx2)」が使用されています。他の条件について気になる方は参考リンクをご覧ください。

理論演算性能(FP32)

FP32(単精度浮動小数点演算)は、理論演算性能を示す一つの指標です。単位はTFLOPS(テラフロップス)を用います。実際のテストから算出するものではなく、シェーダーユニット数(対応の演算器の数)とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。

一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能(データ量が多い処理の場合)によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います(完全に一致する訳ではないので注意)。

FP32(単精度浮動小数点演算)
GPU名称FP32(TFLOPS)
RTX 5090
32GB 1792GB/s
104.8
RTX 4090
24GB 1008GB/s
82.58
RX 7900 XTX
24GB 960GB/s
61.42
RTX 5080
16GB 960GB/s
56.28
RTX 4080 SUPER
16GB 736.3GB/s
52.22
RX 7900 XT
20GB 800GB/s
51.48
RTX 4080
16GB 716.8GB/s
48.74
RX 7900 GRE
16GB 576GB/s
45.98
RTX 4070 Ti SUPER
16GB 672GB/s
44.10
RTX 5070 Ti
16GB 896GB/s
43.94
RTX 4070 Ti
12GB 504GB/s
40.09
RX 7800 XT
16GB 624GB/s
37.32
RTX 4070 SUPER
12GB 504GB/s
35.48
RX 7700 XT
12GB 432GB/s
35.17
RTX 3080
10GB 760GB/s
29.77
RTX 4070
12GB 504GB/s
29.15
RX 7600 XT
16GB 288GB/s
22.57
RTX 4060 Ti
8GB / 16GB  288GB/s
22.06
RTX 3070 Ti
8GB 608GB/s
21.75
RX 7600
8GB 288GB/s
21.75
RX 6800 XT
16GB 512GB/s
20.74
RTX 3070
8GB 448GB/s
20.31
Arc A770 16GB
16GB 560GB/s
17.20
RTX 3060 Ti
8GB 448GB/s
16.20
RX 6800
16GB 512GB/s
16.17
RTX 4060
8GB 272GB/s
15.11
Arc B580
12GB 456GB/s
13.67
RX 6700 XT
12GB 384GB/s
13.21
RTX 3060 12GB
12GB 360GB/s
12.74
Arc B570
10GB 380GB/s
11.52
RX 6600 XT
8GB 256GB/s
10.61
RTX 3050
8GB 224GB/s
9.10
RX 6600
8GB 224GB/s
8.93

理論性能コスパは良くない

「RTX 5070 Ti」のFP32(単精度浮動小数点演算)の理論性能は約43.94TFLOPSです。非常に優れていますが、「RTX 4070 Ti SUPER」とほぼ同じです。コア数が少し増えたものの、クロックが下がったので、最終的にはほぼ同じ数値に落ち着いています。そして、価格が非常に高価なのでコスパは悪いです。

VRAM容量の16GBも価格を考えると不満が残るレベルだと思うので、色んな方面から見て理論性能コスパ的には「RTX 5070 Ti」は弱めです。ただし、「RTX 5080」よりは少しマシではあると思います。


MLPerf Client(AI性能)

「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。

幅広い環境で使えるONNX(DirectML)をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。

MLPerf Client 総合スコア(幾何平均)
GPU名称総合スコア(幾何平均)
RTX 5090
244.68
RTX 4090
176.57
RTX 5080
155.06
RTX 5070 Ti
146.90
RTX 4080
134.76
RX 7900 XTX
127.44
RTX 4070 Ti
107.72
参考:HotHardware

AIは汎用のONNX(DirectML)では「RTX 4080」を約9%上回る

汎用のAIテスト(ONNX)では「RTX 4080」を約9%上回る結果となりました。ゲームテストでは若干下回ることが多かったですから、AI面は特に大きく向上していることがわかります。


Procyon Stable Diffusion(AIイラスト生成)

現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。

「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。

ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。

また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT(NVIDIA)、Open VINO(Intel)、ROCm(AMD)といったものがありますが、2024年12月時点ではROCm(AMD)は現状Windowsでのネイティブ動作に対応していません(Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど)。

そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML(ONNX)の3つとなっており、AMD製のGPU(Radeon等)のみ汎用のDirect ML(ONNX)を使わざるを得ず、低めの性能となっている点に注意が必要です。

※しかし、記事執筆時点ではRTX 50(Blackwell)がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。

Procyon Stable Diffusion XL 総合スコア(1024×1024)
GPU名称スコア
RTX 4090(Tensor RT)
5073
RTX 5090(ONNX)
5073
RTX 4090(ONNX)
3985
RTX 4080(Tensor RT)
3437
RTX 4070 Ti(Tensor RT)
2956
RTX 5080(ONNX)
2920
RTX 4080(ONNX)
2499
RTX 5070 Ti(ONNX)
2203
RTX 4070 Ti(ONNX)
1944
RX 7900 XTX(ONNX)
1458
参考:HotHardware

ONNXの参考記録だけど、AI画像生成では「RTX 4080」に少し劣る

Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。

代わりに汎用のONNX(DirectML)での結果を確認してみると、「RTX 4080」を約18.2%上回る性能でした。「RTX 4070 Ti」との差も小さく、さほど向上していないように見えます。

ただし、TensorRTに対応していないなど、RTX 50シリーズへの最適化がちょっと怪しいので、参考程度に見て置いた方がよいかもしれません。

とはいえ、性能自体は高性能で、現状でも十分実用的に使える性能ではあります。

Blender(GPUレンダリング)

「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。

「Blender 4.3」では、Nvidia Optix、Intel OpenAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。

Blender Benchmarks(4.3.0)
GPU名称総合スコア(幾何平均)
RTX 5090
4769
RTX 4090
3503
RTX 5080
2819
RTX 4080
2653
RTX 5070 Ti
2308
RTX 4070 Ti
1991
RX 7900 XTX
1324
参考:HotHardware

Blenderのレンダリング性能は「RTX 4080」にやや劣る

BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、向上はほとんど見られません。「RTX 4080」を約13%下回る性能です。

とはいえ、性能自体は非常に高性能です。「RTX 4070 Ti SUPER」よりは高負荷時のワットパフォーマンスも良いので、重いレンダリング処理用としても十分に使えます。


Blackmagic RAW(デコード速度)

「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するベンチマークです。GPUを使用する場合にはCUDAかOpenCLを使うことになり、CUDAを使えるGeForceが有利な傾向があります。

また、このテストは圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率(12:1)での8Kおよび4Kのテストでのデコード速度(1秒あたりのフレーム数)を見ていきます。

Blackmagic RAW 4.3.1 デコード速度(8K/12:1)
GPU名称スコア
RTX 5090
251
RTX 5080
216
RTX 5070 Ti
203
RTX 4090
202
RTX 4080
180
RTX 4070 Ti
172
RX 7900 XTX
108
参考:HotHardware
Blackmagic RAW 4.3.1 デコード速度(4K/12:1)
GPU名称スコア
RTX 5090
1005
RTX 5080
867
RTX 5070 Ti
814
RTX 4090
810
RTX 4080
721
RTX 4070 Ti
688
RX 7900 XTX
433
参考:HotHardware

「RTX 4090」と同等のRAWデコード速度

RAWのデコード速度テストでは、「RTX 4090」とほぼ同じ性能でした。非常に優れたメディアエンジン性能です。

ちなみに、このテストとは別の話になりますが、「RTX 5070 Ti」はデコーダ(NVDEC)は1基となっており、「RTX 5080」の2基と比べると一つ少ないので、動画目的ならその点は一応注意。エンコーダ(NVENC)については2基で同じなので、逆にエンコードのコスパ的には「RTX 5070 Ti」の方が良いです。


まとめ

GeForce RTX 5070 Ti

良い点
  • 「RTX 4080 SUPER」を若干下回る程度の非常に優れた処理性能(AI関連はやや大きめの性能向上率)
  • 希望小売価格は「RTX 4070 Ti SUPER」よりも50ドル安い(ただし、日本では円安で価格上昇)
  • 非常に優れたワットパフォーマンス(ただし、前世代のトップ層レベルで新世代感は無し)
  • DLSS 4のマルチフレーム生成対応
  • レイトレーシングの実用コスパは高め
  • 非常に優れたメディアエンジン

気になる点
  • 非常に高価(想定価格:約15万円~)
  • 価格の割には少ない16GB VRAM
  • 消費電力が多い(TGP:300W)
  • 「RTX 4070 Ti SUPER」からの基本性能向上率は小さめ(10%台前半)だけど、実売価格は上昇
  • サイズが大型
  • AIを含まないクリエイティブ性能は「RTX 4070 Ti SUPER」と大して変わらない

RTX 5070 Ti:「RTX 4080 SUPER」に近い性能で749ドル。「RTX 4070 Ti SUPER」代替品としては悪くないか少し良いレベルだけど、実売価格が気になる

「RTX 5070 Ti」は「RTX 4080 SUPER」を若干下回るくらいの性能を発揮する準ハイエンドGPUです。VRAMも16GB搭載しており、重い処理でも十分実用的に運用できる高性能GPUです。

実質的な先代と言える「RTX 4070 Ti SUPER」と比較すると、フルHD~1440pゲームでは10%台前半程度の向上率となっており、新世代の向上率としては物足りないものの、やや向上しています。ワットパフォーマンスも「RTX 4070 Ti SUPER」よりはやや改善しています。

それでいて、米国での希望小売価格は749ドルとなっており、「RTX 4070 Ti SUPER」の799ドルよりも50ドル安いのは嬉しいです。AI性能の強化やDLSS 4のマルチフレーム生成やニューラルレンダリングのことも考えると実質的なコスパはかなり良くなりそうな感じがあります。

特に、マルチフレーム生成の効果はめちゃくちゃ大きくて、フレームレートを最大化する設定なら、DLSS 3をフル活用した「RTX 4090」すらも大きく上回るフレームレートを叩き出すことが出来ます。

ただし、残念なのは、日本では円安が進んでいるため実売価格ではむしろ上昇してしまっており、発売時の最安値は148,800円と非常に高価になっている点です。「RTX 4070 Ti SUPER」の日本での発売時価格よりも約2万円高いです。しかも、それすらもアリバイ価格で、実際には16万円程度からと言われていたりします。

これでは安かった頃の「RTX 4070 Ti SUPER」と比較してしまうと微妙に見えてしまいますが、既に「RTX 4070 Ti SUPER」および「RTX 4080 SUPER」の在庫がほぼ無くなってしまっているため、その価格でも売れそうな気もするのが何とも言えないところです。

とはいえ、16万円台前半でも「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」と基本性能コスパは同等レベルなので、RTX 50からの新機能やAI性能強化を考えれば、実質コスパ的には少し上回ることにはなるとは思います。そのため、「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」の代替品としては悪くないですし、むしろ少し良いと言えるレベルかなと思います。

ただし、やはり少し気になる点もあるので、個人的には出来ればもう少し安くなってから買いたいGPUなのかな思います。

気になる点一つ目はVRAM容量です。16GBは強力ですが、10万円台中盤のGPUとしては物足りなさはあります。希望小売価格よりも大幅に高い価格では魅力を感じない個人的な一番の理由はこれです。

ワットパフォーマンスも「RTX 4070 Ti SUPER」が「RTX 40シリーズ」の中では若干悪めの位置に居たために大きめに改善したように見えるものの、「RTX 4070 SUPER」や「RTX 4080 / 4080 SUPER」と比較すると、明確に良くなってはいないです。

目玉機能の一つの「マルチフレーム生成」も、効果自体は非常に大きいものの、「RTX 5070 Ti」レベルの性能なら従来のフレーム生成でもほとんどの条件で快適な性能を得ることができますので、実用性能的にはプラスと言えるのか、という疑問もあります。

実売価格がちゃんと「RTX 4070 Ti SUPER」よりも安いか、148,800円のモデルの在庫が十分であれば普通に高評価をあげることが出来たと思うのですが…。今後の価格に期待です。

また、これは「RTX 5070 Ti」の評価というより「RTX 50シリーズ」への所感という感じですが、新世代というよりは「RTX 40シリーズ」のリフレッシュ版か、AI性能強化版という感じで捉えた方がしっくりくる感じがしました。

といった感じで、本記事は以上になります。ご覧いただきありがとうございました。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です