「GeForce RTX 5070 Ti」のざっくり性能比較・評価です。海外レビューを参考に性能をざっくりと確認していきます。
本記事の情報は記事執筆時点(2025年2月21日)のものです。ご覧になっている際には異なる可能性があるため注意してください。
仕様
まずは主要な仕様を表にまとめて載せています。
※価格は2025年2月21日時点での米での希望小売価格です(判明しているもののみ)。
※GPU名のリンクはAmazonのものです。
GPU | シェーダー ユニット数 | メモリタイプ | VRAM速度 VRAM帯域幅 | レイトレ用 ユニット数 | ダイサイズ (おおよそ) | 消費電力 (TGP等) | 希望小売 価格 |
---|---|---|---|---|---|---|---|
RTX 5090 | 21760 | GDDR7 32GB 512bit | 28.0Gbps 1792GB/s | 170 | 750㎟ | 575W | 1,999ドル |
RTX 4090 | 16384 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 128 | 608㎟ | 450W | 1,599ドル |
RTX 5080 | 10752 | GDDR7 16GB 256bit | 30.0Gbps 960GB/s | 84 | 378㎟ | 360W | 999ドル |
RTX 4080 SUPER | 10240 | GDDR6X 16GB 256bit | 23.0Gbps 736.3GB/s | 80 | 380㎟ | 320W | 999ドル |
RTX 4080 | 9728 | GDDR6X 16GB 256bit | 22.4Gbps 716.8GB/s | 76 | 380㎟ | 320W | 1,199ドル →市場廃止 |
RTX 5070 Ti | 8960 | GDDR7 16GB 256bit | 28.0Gbps 896GB/s | 70 | 378㎟ | 300W | 749ドル |
RX 7900 XTX | 6144 | GDDR6 24GB 384bit | 20Gbps 960GB/s | 96 | 36.6㎟*6 + 300㎟ | 355W | 969ドル |
RX 7900 XT | 5376 | GDDR6 20GB 320bit | 20Gbps 800GB/s | 84 | 36.6㎟*6 + 300㎟ | 315W | 799ドル →749ドル? |
RTX 4070 Ti SUPER | 8448 | GDDR6X 16GB 256bit | 21.0Gbps 672GB/s | 66 | 295㎟ | 285W | 799ドル |
RTX 4070 Ti | 7680 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 60 | 295㎟ | 285W | 799ドル →市場廃止 |
RTX 5070 | 6144 | GDDR7 12GB 192bit | 28?Gbps 672GB/s | 48? | ?㎟ | 250W | 549ドル |
RTX 3090 Ti | 10752 | GDDR6X 24GB 384bit | 21.0Gbps 1008GB/s | 84 | 628.4㎟ | 450W | 1,499ドル |
RTX 3090 | 10496 | GDDR6X 24GB 384bit | 19.5Gbps 936GB/s | 82 | 628.4㎟ | 350W | 1,299ドル |
RX 7900 GRE | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 36.6㎟*6 + 300㎟ | 260W | 549ドル |
RX 6950 XT | 5120 | GDDR6 16GB 256bit | 18Gbps 576GB/s | 80 | 519㎟ | 335W | 949ドル |
RX 6900 XT | 5120 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 80 | 519㎟ | 300W | 699ドル |
RTX 3080 Ti | 10240 | GDDR6X 12GB 384bit | 19Gbps 912GB/s | 80 | 628.4㎟ | 350W | 1,099ドル |
RTX 3080 10GB | 8704 | GDDR6X 10GB 320bit | 19Gbps 760GB/s | 68 | 628.4㎟ | 320W | 699ドル |
RTX 4070 SUPER | 7168 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 56 | 295㎟ | 220W | 599ドル |
RTX 4070 | 5888 | GDDR6X 12GB 192bit | 21.0Gbps 504GB/s | 46 | 295㎟ | 200W | 549ドル 前:599ドル |
RX 7800 XT | 3840 | GDDR6 16GB 256bit | 19.5Gbps 624GB/s | 60 | 37.5㎟*4 + 200㎟ | 263W | 499ドル |
RX 6800 XT | 4608 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 72 | 519㎟ | 300W | 599ドル |
RTX 3070 Ti | 6144 | GDDR6X 8GB 256bit | 19Gbps 608GB/s | 48 | 392㎟ | 290W | 599ドル |
RX 6800 | 3840 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 60 | 519㎟ | 250W | 549ドル |
RX 7700 XT | 3456 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 54 | 37.5㎟*4 + 200㎟ | 245W | 419ドル 前:449ドル |
RTX 4060 Ti 8GB | 4352 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 34 | 190㎟ | 160W | 399ドル |
RTX 3070 | 5888 | GDDR6 8GB 256bit | 14Gbps 448GB/s | 46 | 392㎟ | 220W | 499ドル |
RX 6750 XT | 2560 | GDDR6 12GB 192bit | 18Gbps 432GB/s | 40 | 336㎟ | 250W | 419ドル |
RTX 3060 Ti | 4864 | GDDR6 8GB 192bit | 14Gbps 448GB/s | 38 | 392㎟ | 200W | 399ドル |
RX 6700 XT | 2560 | GDDR6 12GB 192bit | 16Gbps 384GB/s | 40 | 336㎟ | 230W | 379ドル |
Arc A770 16GB | 4096 | GDDR6 16GB 256bit | 17.5Gbps 560GB/s | 32 | 406㎟ | 225W | 349ドル |
Arc A770 8GB | 4096 | GDDR6 8GB 256bit | 16Gbps 512GB/s | 32 | 406㎟ | 225W | 329ドル |
Arc B580 | 2560 | GDDR6 12GB 192bit | 19Gbps 456GB/s | 20 | 272㎟ | 190W | 249ドル |
RX 7600 XT | 2048 | GDDR6 16GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 190W | 329ドル |
RTX 4060 | 3072 | GDDR6 8GB 128bit | 17Gbps 272GB/s | 24 | 156㎟ | 115W | 299ドル |
Arc B570 | 2304 | GDDR6 10GB 160bit | 19Gbps 380GB/s | 18 | 272㎟ | 150W | 219ドル |
RX 6650 XT | 2048 | GDDR6 8GB 128bit | 17.5Gbps 288GB/s | 32 | 237㎟ | 180W | 299ドル |
RX 7600 | 2048 | GDDR6 8GB 128bit | 18Gbps 288GB/s | 32 | 204㎟ | 165W | 269ドル |
RX 6600 XT | 2048 | GDDR6 8GB 128bit | 16Gbps 256GB/s | 32 | 237㎟ | 160W | – |
Arc A750 | 3584 | GDDR6 16GB 256bit | 16Gbps 512GB/s | 28 | 406㎟ | 225W | 289ドル |
RX 6600 | 1792 | GDDR6 8GB 128bit | 14Gbps 224GB/s | 28 | 237㎟ | 132W | 239ドル |
RTX 3060 12GB | 3584 | GDDR6 12GB 192bit | 15Gbps 360GB/s | 28 | 276㎟ | 170W | 329ドル |
RTX 3050 | 2560 | GDDR6 8GB 128bit | 15Gbps 224GB/s | 20 | 276㎟ | 130W | 249ドル |
「RTX 50シリーズ」と前世代「RTX 40シリーズ」の簡易比較表です。NVIDIA公式サイトにおけるTensorコアとRTコアについての記載が、従来はコア数だったものが理論性能で表記するようになりました。
RTX 50シリーズでは前世代よりもAI性能が飛躍的に向上しているため、その差をより強調したいための変更だと思われますが、元々コア性能が上がっても向上を感じられないコア数表記は問題がある部分だったので、表記を切り替える良い機会になったのかなと思います。
GPU | 希望 小売価格 | GPU | VRAM | TGP | |||||
---|---|---|---|---|---|---|---|---|---|
CUDAコア | Tensorコア (AI TOPS) | RTコア (TFLOPS) | クロック 最大(GHz) | 容量/タイプ | バス幅 | 帯域幅(GB/s) | |||
RTX 5090 | 1999ドル | 21760 | 3352 | 318 | 2.41 | 32GB GDDR7 | 512bit | 1792 | 575W |
RTX 4090 | 1599ドル | 16384 | 1321 | 191 | 2.52 | 24GB GDDR6X | 384bit | 1008 | 450W |
RTX 5080 | 999ドル | 10752 | 1801 | 171 | 2.62 | 16GB GDDR7 | 256bit | 960 | 360W |
RTX 4080 SUPER | 999ドル | 10240 | 836 | 121 | 2.55 | 16GB GDDR6X | 256bit | 736 | 320W |
RTX 5070 Ti | 749ドル | 8960 | 1406 | 133 | 2.45 | 16GB GDDR7 | 256bit | 896 | 300W |
RTX 4070 Ti SUPER | 799ドル | 8448 | 780 | 102 | 2.61 | 16GB GDDR6X | 256bit | 672 | 285W |
RTX 4070 SUPER | 599ドル | 7168 | 568 | 93 | 2.48 | 12GB GDDR6X | 192bit | 504 | 220W |
RTX 5070 | 549ドル | 6144 | 988 | 94 | 2.51 | 12GB GDDR7 | 192bit | 672 | 250W |
RTX 4070 | 549ドル | 5888 | 466 | 67 | 2.48 | 12GB GDDR6X 12GB GDDR6 | 192bit | 504 | 200W |
今回見ていくのはNVIDIA「GeForce RTX 5070 Ti」です。新アーキテクチャ「Blackwell」を採用した新世代GPU「GeForce RTX 50 シリーズ」の準ハイエンドモデルです。
VRAM容量が「RTX 5080」と同じ16GBながら価格は大幅に安価ということで、非常に注目が集まるモデルとなっていると思います。
メーカー希望小売価格は749ドルで、国内想定価格は148,800円~となっています。「RTX 4070 Ti SUPER」の799ドルよりも50ドル安い設定となっていますが、以前よりも円安になっている他、AI需要が以前よりも高まっていることもあり、国内想定価格は「RTX 4070 Ti SUPER」の登場時(127,380円~)よりも約2万円ほど高い設定となっています。
また、148,800円~という価格は「アリバイ価格」などと呼ばれるごく少数の在庫しかないと言われていることもあり、価格は発売後どうなるか動向を見守りたいところです。
ダイには「RTX 5080」と同じGB203が使用されており、RTX 5080では84個の利用可能なストリーミングプロセッサ全てが有効となっていますが、「RTX 5070 Ti」では84個の内の70個が有効化されています。CUDAコア数は8,960となっており、「RTX 4070 Ti SUPER」と比較すると約6%のわずかな増量で、最大クロックはわずかに低下しています。
ここで触れておきたいのは、既に登場している「RTX 5080」を見る限り、RTX 40からのアーキテクチャ更新による基本性能の向上はわずかと考えられる点です。
考えられている主な理由は、製造プロセスがほぼ変わらないと噂されていることが挙げられます。前世代で「TSMC 4N」だったものが「TSMC 4NP」になると言われていますが、これはどちらもNVIDIAと共同開発したもので、どうやら4NPも4Nと同じ「5nm EUV」で製造されていると言われています。
そのため、名前こそ進化したように見えるものの、ほぼ同じ「TSMC 5nm」なので、プロセスルールの微細化はされていない可能性が高そうという感じです。そのため、主に基本性能や電力効率(ワットパフォーマンス)面では大きな改善が見られないかもしれないのが懸念点です。
製造プロセスでの進化があまり見込めない上、コア数の上昇もわずかでクロックも下がっているので、性能向上率は小さいのではないかと発売前から不安視されていました。詳しいところはこの後見ていきます。
ただし、「RTX 50シリーズ」ではコア・ユニット数の増加だけでなく、各コンポーネントが新しくなっています。CUDAコアはニューラルシェーダーを高速化できるように再設計されているらしい他、RTコアは第4世代、Tensorコアは第5世代へと更新されています。
特にTensorコアのAI性能が格段に向上している点は注目です。NVIDIA公表の「RTX 5070 Ti」のAIの理論上のピーク性能(INT8)は 1406 TOPSとなっており、これは「RTX 4070 Ti SUPER」の約1.8倍という大きな向上率です。AIについては特に設計の面で相当な改良が加えられていることがわかります。
そのAI性能の飛躍的向上に併せて、DLSS 4のマルチフレーム生成やニューラルレンダリングなど、AIをフル活用する技術も追加されました。
AIをとにかく重視するという姿勢が表れており、そのAI性能と技術にどれだけ価値を感じられるかというのが「RTX 50シリーズ」の大きな焦点にもなっていると思います。
そのAIでも重要なVRAMですが、「RTX 5070 Ti」では GDDR7 16GB、帯域幅は896 GB/sとなっています。「RTX 4070 Ti SUPER」と容量は同じで、帯域幅が向上しています。
強力なVRAMだとは思いますが、約15万円~のGPUとしては正直物足りなさもある仕様です。AMDの「RX 7800 XT」は16GB VRAMを搭載しつつ、安い時期では7万円台中盤で販売されていました。
しかし、少し後に登場する「RTX 5070」が12GBなので、ハイエンド用途でも十分な性能を維持したいなら「RTX 5070 Ti」を選びたいところなので、難しいところです。
「RTX 5070」より下位のGPUの展開は現状はまだ不明ですが、「RTX 4060 Ti 16GB」のように「RTX 5060 Ti 16GB」が投入され、前世代よりも10%以上の性能向上があるのなら、そちらへ人気が集中する可能性もあるかもしれません。
しかし、ここまでの向上率を見る限り、5060 Tiの性能は従来のアッパーミドルクラスの域を超えなさそうなので、高性能な16GB GPUが欲しかった人は、「RTX 4070 Ti SUPER」を安い時期に導入しておけば良かったと思っている人は結構多いかもしれません。
最後に消費電力ですが、「RTX 5070 Ti」のTGPは300Wとなっています。「RTX 4070 Ti SUPER」の285Wからわずかに上昇しています。
性能向上率もわずかな感じがすることも併せて考えると、ワットパフォーマンスも大して向上していない感じがカタログスペックの時点でも出ている気がします。
DLSS 4、ニューラルレンダリング
「RTX 50 シリーズ」はGPUだけでなく、AI関連技術の追加対応も目玉なので、個別で触れておきます。ご存じの方は飛ばして貰って構いません。
まずは「DLSS 4」です。DLSSはNVIDIAが提供するTensorコアを活用したアップスケーリングで、DLSSの新しい「DLSS 4」において「マルチフレーム生成」機能が追加されます。
DLSS 3から対応した「フレーム生成」では中間フレーム1つのフレームに対して最大1つしか生成できなかったのに対し、DLSS 4のマルチフレーム生成では最大3つの追加フレームを生成することが可能になります。凄まじいフレームレートの向上が期待できます。
また、DLSS 4ではマルチフレーム生成機能の導入だけでなく、基本性能もアップしているようです。新しいフレーム生成モデルへと更新され、画質向上に加えて、40%の高速化や30%のVRAM使用量の削減が主張されています。
マルチフレーム生成の利用には「RTX 50シリーズ」が必要になるとされていますが、新機能が利用できなくてもアップデートの恩恵が受けられるのは良いですね。
次に、ニューラルレンダリングです。現代のグラフィックスに大きな革新をもたらすことが期待されている、AIを活用したレンダリングです。
従来はグラフィックスAPI内でTensorコア(AI)を利用することができなかったため、DLSSなどアップスケーリングなどの形で別の場所でAIを利用することが必要でしたが、Microsoftの更新によってグラフィックスAPI内で直接Tensorコアにアクセスできるようになることで実現した技術です。ワークフロー内で直接ニューラル技術を統合してパイプラインの一部に置き換えることが可能になっています。要するに、元の画像を生成する時点でAIによって高速化することが可能となります。
これにより、従来は膨大な計算が必要だった高度なグラフィックス効果を大きく高速化しつつ、従来のアップスケーリングよりも不自然な描写を避けて、画質の向上にも繋がるということです。圧縮率は最大で7:1とも言われています。
DLSSやFSRといった別機能ではなく、グラフィックスAPI(DirectX)の標準機能となるようなので、メーカー側も導入を妨げる理由はありません。また、DXR(レイトレーシング)単体と違ってフレームレートの低下を招くものでもないため、ユーザー側も避ける理由が無く、思ったより利用が進まなかったDXRと違って、利用できる場合にはした方が良いといった技術になりそうな感じがあります。
といった感じで、カタログスペックについてはここまでとして、下記から実際の各性能について見ていきたいと思います。
ゲーミング性能(ラスタライズ)
ゲーミング性能は、言葉の通りゲームをする際のパフォーマンスの性能です。実際にゲームを動作させた際の平均FPS数を見ていきます。
まずは、レイトレーシングやアップスケリーング等は無効の状態での性能、いわゆるラスタライズ性能(ラスター性能)を見ていきます。今回は25種類のゲームでのデータを基に見ていきます。設定は基本的に最高品質です。
使用されたグラフィックボードは「MSI GeForce RTX 5070 Ti Ventus 3X OC」、CPUは「Ryzen 7 9800X3D」で、OSはWindows 11が使用されています。その他のスペックなどの詳細は、お手数ですが記事上部の参考リンクを参照お願いします。
フルHD(1920×1080)
フルHD(1920×1080)です。最低限の解像度という印象ですが、2025年現在ではまだ主流な解像度です。ハイエンドGPUを使用していても、競技性の高いゲームでは出来るだけ高いFPSを維持するためにこの設定にすることは珍しくないと思います。ただし、新しい世代のハイエンドGPUでは低負荷感も強くなっているので、より高い解像度への移行も近そうな印象です。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 5070 Ti | |
RX 7900 XTX | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RTX 4070 | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc B570 | |
RX 7600 | |
Arc A770 16GB | |
RX 6600 XT | |
RTX 3060 12GB | |
RX 6600 | |
Arc A580 | |
RTX 3050 8GB |
フルHDは「RTX 4070 Ti SUPER」を約10.4%上回る性能
フルHDのラスタライズ性能は「RTX 4070 Ti SUPER」を約10.4%上回る性能となっています。事前の予測通り、新世代の向上率としてはやや控えめです。「RTX 4080 SUPER」と比較すると約3.2%下回る性能となっており、近い性能です。
米国(ドル)の希望小売価格は「RTX 4070 Ti SUPER」から50ドル安くなったものの、円安の影響もあって、初期の実売価格としては大幅に高くなってしまっているので、コスパは劇的には良くなっていなさそうです
また、「RTX 50シリーズ」目玉機能にはDLSS 4のマルチフレーム生成がありますが、「RTX 5070 Ti」レベルの性能であればフルHDならマルチフレーム生成が無くても十分なパフォーマンスが得られるので、フルHDにおいてはRTX 50だから有利という感じはあまり無いと思います。
1440p(2560×1440)
WQHD(2560×1440)です。1080pよりはキレイな映像で楽しみたいという場合や、GPUが高性能なために1080pでは少し性能を持て余してしまう場合に利用する解像度です。現在の主流解像度はフルHDだと思いますが、GPU性能が全体的に大幅に向上してきているため、少なくともデスクトップでは徐々にこの1440pが主流解像度に切り替わっていく気がします。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 7900 XTX | |
RTX 5070 Ti | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 3080 10GB | |
RX 6800 XT | |
RTX 4070 | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RX 6700 XT | |
RTX 3060 Ti | |
Arc B580 | |
RX 7600 XT | |
RTX 4060 | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 | |
RTX 3060 12GB | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能
1440pでは「RTX 4070 Ti SUPER」を約13%上回る性能となっています。帯域幅の向上が活きはじめたのか、フルHDよりも差が若干広がっています。
「RTX 4080 SUPER」との差は約2.9%とほぼ変わらず、近い性能となっています。
フルHDよりは負荷が高いためマルチフレーム生成が活きる場面はありそうなものの、ほとんどのゲームでは従来のフレーム生成でも十分なパフォーマンスが得られるとは思うので、やはり強みとしては小さめかなと思います。
4K(3840×2160)
「超高解像度の代名詞」という感じの解像度の4K(3840×2160)です。非常に繊細で綺麗な映像になりますが、負荷が非常に大きいです。画素数はフルHDの約4倍です。その負荷の大きさから高いフレームレートを出す事が難しいため、TPSやFPSなどの対人競技ゲームで利用されることはほとんどないです。フレームレートよりもグラフィックのキレイさや臨場感が重要なゲームを中心に需要のある解像度です。また、高リフレッシュレートの4Kモニターが高価という問題もあるため、一般層への普及にはややハードルが高いです。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 5070 Ti | |
RX 7900 XTX | |
RTX 4080 | |
RTX 4070 Ti SUPER | |
RX 7900 XT | |
RTX 4070 Ti | |
RTX 3090 | |
RTX 4070 SUPER | |
RX 7900 GRE | |
RTX 3080 10GB | |
RX 7800 XT | |
RTX 4070 | |
RX 6800 XT | |
RX 7700 XT | |
RTX 3070 | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
Arc B580 | |
RTX 3060 Ti | |
RX 6700 XT | |
Arc A770 16GB | |
Arc B570 | |
RX 7600 XT | |
RTX 4060 | |
RTX 3060 12GB | |
RX 7600 | |
RX 6600 XT | |
Arc A580 | |
RX 6600 | |
RTX 3050 8GB |
4Kでは「RTX 4080 SUPER」とほぼ同等の性能
4Kでは「RTX 4080 SUPER」とほぼ同等の性能となっています。VRAMの帯域幅の向上が活きていそうな感じです。「RTX 4070 Ti SUPER」との比較での差は約17.6%にまで広がっています。
VRAM帯域が重要な処理なら15万円程度で「RTX 4080 SUPER」と同じ性能が得られ、ワットパフォーマンスやAI性能も少し向上するということであれば、一定の需要はありそうな感じがします。
また、4Kレベルの負荷ならDLSS 4のマルチフレーム生成も非常に大きな強みとなるので、そこも考慮するならより高い評価となると思います。遅延は気になるところですが、低fpsのまま運用するよりは優れた体験になると思います。
電力関連
消費電力
ゲームプレイ時(高負荷時)の平均消費電力を見ていきます。低い方が良い数値となります。測定に使用されたゲームは「Cyverpunk 2077」、「S.T.A.L.K.E.R. 2」、「Marvel’s Spider-Man 2」の3種類で「3840×2160(4K)」のウルトラ設定でレイトレーシングは無効です。ただし、VRAMサイズによる影響が大きくなりすぎないように、テクスチャ設定は「低」に設定されています。
GPU名称 | 消費電力 |
---|---|
RTX 4060 | |
RTX 3050 8GB | |
RTX 4060 Ti 8GB | |
RX 6600 XT | |
Arc B570 | |
RTX 4060 Ti 16GB | |
RX 7600 | |
Arc B580 | |
RTX 3060 12GB | |
RX 7600 XT | |
RTX 4070 | |
RTX 3060 Ti | |
Arc A580 | |
RTX 4070 SUPER | |
RX 6700 XT | |
RTX 3070 | |
RX 7700 XT | |
Arc A770 16GB | |
RX 6800 | |
RX 7800 XT | |
RTX 4070 Ti | |
RX 7900 GRE | |
RTX 4070 Ti SUPER | |
RTX 5070 Ti | |
RTX 4080 SUPER | |
RTX 4080 | |
RX 6800 XT | |
RTX 5080 | |
RX 7900 XT | |
RTX 3080 10GB | |
RX 7900 XTX | |
RTX 3090 | |
RTX 4090 | |
RTX 5090 |
ゲーム時の平均消費電力はTGPよりもやや少なめの287W
ゲーム時の平均消費電力は287Wとなっており、TGPの300Wよりもやや少なめです。「RTX 4070 Ti SUPER」とほぼ同等となっています。
性能は10%以上向上しているので、ワットパフォーマンスも改善していることがわかります。
ワットパフォーマンス
ワットパフォーマンス(電力効率)を見ていきます。ゲーミング時の1フレームあたりの消費電力を算出して比較しています
環境は消費電力はおよび4Kは「Cyberpunk 2077(Ultra/レイトレ無効)」時のもので、1080pは上記で示した25ゲーム平均fpsを使用したものです。一応、1080p時のものは各ゲームでの効率を求めたものではなく消費電力は同じもので算出しており、正確な値ではなく参考値となっているため注意してください。
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 4070 SUPER | |
RTX 4060 Ti 8GB | |
RTX 5080 | |
RTX 4070 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4060 Ti 16GB | |
RTX 5070 Ti | |
RTX 4060 | |
RTX 4070 Ti | |
RTX 4070 Ti SUPER | |
RTX 4090 | |
RX 7900 GRE | |
RX 7900 XT | |
RX 7900 XTX | |
RX 7800 XT | |
Arc B580 | |
RX 7700 XT | |
RTX 5090 | |
RX 6600 XT | |
Arc B570 | |
RX 7600 | |
RX 6800 | |
RTX 3070 | |
RTX 3060 Ti | |
RX 6800 XT | |
RX 7600 XT | |
RX 6700 XT | |
RTX 3090 | |
RTX 3060 12GB | |
RTX 3050 8GB | |
RTX 3080 10GB | |
Arc A770 16GB | |
Arc A580 |
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 5080 | |
RTX 4070 SUPER | |
RTX 4080 SUPER | |
RTX 4060 Ti 8GB | |
RTX 4080 | |
RTX 5070 Ti | |
RTX 4070 | |
RTX 4070 Ti | |
RTX 4060 Ti 16GB | |
RTX 4090 | |
RTX 4060 | |
RTX 4070 Ti SUPER | |
RTX 5090 | |
RX 7900 XTX | |
RX 7900 XT | |
RX 7900 GRE | |
RX 7800 XT | |
Arc B580 | |
RX 7700 XT | |
Arc B570 | |
RX 6800 | |
RTX 3070 | |
RX 6600 XT | |
RX 7600 | |
RX 6800 XT | |
RTX 3060 Ti | |
RTX 3090 | |
RX 6700 XT | |
RX 7600 XT | |
RTX 3060 12GB | |
RTX 3080 10GB | |
RTX 3050 8GB | |
Arc A770 16GB | |
Arc A580 |
GPU名称 | 1フレームあたりの消費電力 |
---|---|
RTX 5080 | |
RTX 5070 Ti | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 4070 SUPER | |
RTX 5090 | |
RTX 4090 | |
RTX 4070 | |
RTX 4070 Ti | |
RTX 4060 Ti 8GB | |
RTX 4070 Ti SUPER | |
RTX 4060 Ti 16GB | |
RTX 4060 | |
RX 7900 XTX | |
RX 7900 XT | |
RX 7900 GRE | |
Arc B580 | |
RX 7800 XT | |
RX 7700 XT | |
Arc B570 | |
RX 6800 | |
RTX 3070 | |
RTX 3090 | |
RX 6800 XT | |
RTX 3060 Ti | |
RX 6600 XT | |
RTX 3080 10GB | |
RX 6700 XT | |
RX 7600 XT | |
RTX 3060 12GB | |
RX 7600 | |
RTX 3050 8GB | |
Arc A770 16GB | |
Arc A580 |
ワットパフォーマンスは非常に良いけど、RTX 4080と同等レベル
ワットパフォーマンスは非常に良いですが、「RTX 4080 / RTX 4080 SUPER」と同等レベルであり、前世代から大きな向上には至っていません。
結果としては残念ですが、ポジティブに考えると、「RTX 4070 Ti SUPER」が前世代の中では若干悪いワットパフォーマンスだったのが少し改善されています。
DLSS 4のマルチフレーム生成など、RTX 50から対応する機能を活かせれば実質的なワットパフォーマンスは更に上がりますし、代替品としては十分な性能かなと思えないこともないです。
レイトレーシング性能
レイトレーシング性能
リアルタイムレイトレーシングを有効にした際の性能を見ていきます。レイトレーシングはメインコアと別のレイトレーシング用のコアも使用するため、上述のラスタライズ性能とやや差が出る可能性があります。DLSSやFSRといったアップスケーリングは無効の状態の性能を見ていきます。
また、レイトレーシングはVRAMを大量に使う処理な上、VRAMが不足するとパフォーマンスが一気に低下するので、特に1440p以降はVRAM 8GB以下のようなGPUは大きく不利になっています。
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 5070 Ti | |
RTX 4070 Ti SUPER | |
RTX 4070 Ti | |
RX 7900 XTX | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 XT | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 4060 Ti 16GB | |
RTX 4060 Ti 8GB | |
RTX 3070 | |
RX 7700 XT | |
RX 6800 | |
Arc B580 | |
RTX 3060 Ti | |
RTX 4060 | |
Arc A770 16GB | |
RX 6700 XT | |
Arc B570 | |
RTX 3060 12GB | |
RX 7600 XT | |
Arc A580 | |
RX 6600 XT | |
RX 7600 | |
RTX 3050 8GB | |
RX 6600 |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 5070 Ti | |
RTX 4070 Ti SUPER | |
RX 7900 XTX | |
RTX 4070 Ti | |
RTX 3090 Ti | |
RTX 4070 SUPER | |
RTX 3090 | |
RX 7900 XT | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 4060 Ti 16GB | |
RX 7700 XT | |
Arc B580 | |
RX 6800 | |
RTX 3070 | |
RTX 4060 Ti 8GB | |
Arc B570 | |
Arc A770 16GB | |
RTX 3060 Ti | |
RX 6700 XT | |
RTX 3060 12GB | |
RTX 4060 | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 7600 | |
RX 6600 |
GPU名称 | 平均FPS |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 SUPER | |
RTX 4080 | |
RTX 5070 Ti | |
RTX 4070 Ti SUPER | |
RTX 3090 Ti | |
RX 7900 XTX | |
RTX 4070 Ti | |
RTX 3090 | |
RTX 4070 SUPER | |
RX 7900 XT | |
RTX 4070 | |
RTX 3080 10GB | |
RX 7900 GRE | |
RX 7800 XT | |
RTX 4060 Ti 16GB | |
RX 7700 XT | |
RX 6800 | |
Arc B580 | |
RTX 3070 | |
Arc A770 16GB | |
RTX 4060 Ti 8GB | |
RTX 3060 Ti | |
RX 6700 XT | |
Arc B570 | |
RTX 3060 12GB | |
RTX 4060 | |
RX 7600 XT | |
Arc A580 | |
RTX 3050 8GB | |
RX 6600 XT | |
RX 7600 | |
RX 6600 |
「RTX 4070 Ti SUPER」を6%~10%上回る性能
レイトレーシング性能を「RTX 4070 Ti SUPER」と比較すると、向上率はフルHDで約6.1%、1440pで約10.4%、4Kで約8.5%といった感じになっています。やはり向上率は控えめで、ラスタライズよりも差が若干小さくなっています。
4Kでは向上率が若干下がることから、VRAMが少しボトルネックになるケースが発生しているのかもしれません。
レイトレーシングではVRAM容量が非常に多く、レイトレーシングの超重量級ゲームの高設定では使用VRAMが16GBを超える場面もあるとの検証結果もあったりするのがちょっと懸念点です。
4Kレイトレーシングを実用する人はほぼ居ないと思うので、弱点として数えるほどではないかもしれませんが、約15万円~のGPUでもボトルネックが若干気になるというのは残念感はあるかなと思います。
ただし、例によって、DLSS 4のマルチフレーム生成やニューラルレンダリングを活用できれば、ある程度カバーもでき、最終的な性能としては十分なパフォーマンスが大体得られると思うので、考え方次第ではあります。
DLSS
DLSS有効時のゲーム性能
DLSSはNVIDIAの提供するアップスケーリング技術です。AIを活用してフレームレートを向上させます。Tensorコアが必要なGeForce RTX限定の機能となっているため、普段は取り扱わないことも多いですが、今回はRTコアの刷新やDLSS 4の登場があったので、見ていきたいと思います。
4Kでレイトレーシング有効&最高設定の非常に高負荷な状態の4つゲームでのDLSS有効時の性能の平均を見ていきます。
※表の「FG」は「Frame Generation(フレーム生成)」の略称です。
GPU名称 | 平均fps |
---|---|
RTX 5070 Ti DLSS Performance / FGx4 | |
RTX 5070 Ti DLSS Quality / FGx4 | |
RTX 4090 DLSS Performance / FGx2 | |
RTX 4080 SUPER DLSS Performance / FGx2 | |
RTX 5070 Ti FGx4 | |
RTX 4090 DLSS Quality / FGx2 | |
RTX 4080 SUPER DLSS Quality / FGx2 | |
RTX 5070 Ti FGx3 | |
RTX 4090 FGx2 | |
RTX 4090 DLSS Quality | |
RTX 5070 Ti FGx2 | |
RTX 4080 SUPER FGx2 | |
RTX 4080 SUPER DLSS Quality | |
RTX 5070 Ti DLSS Quality | |
RTX 4090 ネイティブ | |
RX 7900 XTX FSR Quality | |
RTX 4080 SUPER ネイティブ | |
RX 7900 XTX ネイティブ | |
RTX 5070 Ti ネイティブ |
マルチフレーム生成を使えば「RTX 4090」をも大きく上回る
「RTX 50シリーズ」で利用できるDLSS 4の「マルチフレーム生成」では、従来では1つのフレームにつき1フレームしか生成できなかった(x2)のが、最大で3フレーム(x4)まで生成できるようになりました。
そのため、仮に基本性能が同じだったとしても、マルチフレーム生成を使えば前世代を圧倒的に上回るフレームレートを実現可能です。
「RTX 5070 Ti」でDLSS 4をフル活用すると、DLSS 3のフル機能を使用した「RTX 4090」すらも約43.6%も上回るフレームレートを出すことができます。圧倒的な性能です。
とはいえ、このレベルの性能のGPUなら従来のフレーム生成(x2)だけでも非常に優れたパフォーマンスを発揮できるので、そもそも追加のフレーム生成機能が必要なのか、という点はあります。
実際、上記の性能は「4Kレイトレーシングの最高設定」というものすごく高負荷環境ですが、「RTX 4080 SUPER」でもフレームレートを最大化する設定なら平均で90fpsを超えており、普通にプレイが可能です。
実際の環境ではフルHD~1440pが中心であることを考えると、x2のフレーム生成の重量級ゲーム&レイトレーシングで「RTX 4070 Ti SUPER」を使用したとしても大体の環境では十分快適だと思われ、マルチフレーム生成はオーバースペック感があります。
とはいえ、マルチフレーム生成の効果は絶大で、性能を飛躍的に向上することができる常識を覆すレベルの機能となっていると思います。
コストパフォーマンス
上述のfpsを基にGPUの1フレームあたりの価格を算出し、コストパフォーマンスを比較しています。数値が低い方が良い点に注意です。ラスタライズとレイトレーシング時の両方を見ていきます。
元のゲーミング性能の解像度は1440pを用いています。4Kなどではやや結果が異なる可能性がある点に注意です。
※各GPUの価格については、従来は記事執筆時点でのおおよその市場価格を基にしていますが、今回は生産終了に伴う品薄&高騰が発生してしまっているので、今回は高騰前の価格で算出しています。
また、「RTX 5070 Ti」の発売時の想定最安値価格は148,800円ですが、実際にはその価格での販売はほぼ無く、162,980円が実質的な市場最安値価格だったので、そちらでも算出して表に含めています。
1フレームあたりの価格(ラスタライズ)
まずはラスタライズ性能のコスパです。上述の1440pゲーム時の性能と現在の市場価格を基に、1フレームあたりの価格を算出し、コスパとして比較しています。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
RX 6600 | ¥28,800 | |
Arc A770 16GB | ¥39,800 | |
RX 7600 | ¥36,980 | |
RTX 4060 | ¥41,980 | |
RX 7700 XT | ¥62,980 | |
RX 7800 XT | ¥75,800 | |
RTX 3060 12GB | ¥39,980 | |
Arc B580 | ¥49,800 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 3050 8GB | ¥28,800 | |
Arc B570 | ¥44,980 | |
RTX 3080 10GB | ¥84,800 | |
RTX 4070 SUPER | ¥99,800 | |
RTX 4070 | ¥86,800 | |
RX 7900 XT | ¥116,800 | |
RX 6800 XT | ¥89,800 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RTX 5070 Ti | ¥148,800 | |
RX 7900 XTX | ¥154,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RTX 5070 Ti(実質初期価格) | ¥162,980 | |
RTX 4080 SUPER | ¥169,800 | |
RTX 5080 | ¥198,800 | |
RTX 4090 | ¥323,800 | |
RTX 5090 | ¥393,800 |
ラスタライズコスパは悪いけど、15万円弱なら準ハイエンドとしては少し良い部類
高性能GPUは高価になるほど全体的にコスパが悪く、「RTX 5070 Ti」も悪いです。
しかし、148,800円での計算なら「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」よりは若干良いです。AI面の強化やマルチフレーム生成対応などを考えれば、代替品としては悪くはないかなと思います。
とはいえ、やはり差は小さいので、従来の価値観が大きく変わるほどの影響はなさそうです。
また、実質的な発売時の最安値価格と言えそうな162,980円で計算すると、高騰前の「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」とほぼ同等のコスパになります。
希望小売価格を大きく超えても意外と悪くないコスパなのはちょっと意外でした。性能的にも劇的な向上ではないですし、わざわざ高価な発売時に買うほどの価値があるかは微妙なところですが…。
1フレームあたりの価格(レイトレーシング)
次にレイトレーシング時のコスパを見ていきます。DLSSやFSR等のアップスケーリング技術は使用していない場合のものになります。
GPU名称 | 1フレームあたりの価格 | 参考価格 |
---|---|---|
Arc A770 16GB | ¥39,800 | |
Arc B580 | ¥49,800 | |
Arc B570 | ¥44,980 | |
RTX 3060 12GB | ¥39,980 | |
RTX 4070 | ¥86,800 | |
RTX 4060 | ¥41,980 | |
RTX 4070 SUPER | ¥99,800 | |
RX 7700 XT | ¥62,980 | |
RTX 3050 8GB | ¥28,800 | |
RX 7800 XT | ¥75,800 | |
RTX 4060 Ti 16GB | ¥69,280 | |
RTX 4060 Ti 8GB | ¥57,800 | |
RTX 5070 Ti | ¥148,800 | |
RX 7900 XT | ¥116,800 | |
RTX 4070 Ti SUPER | ¥142,800 | |
RX 7600 XT | ¥50,800 | |
RTX 4080 SUPER | ¥169,800 | |
RTX 5070 Ti(実質初期価格) | ¥162,980 | |
RTX 5080 | ¥198,800 | |
RX 7900 XTX | ¥154,800 | |
RX 7600 | ¥36,980 | |
RTX 5090 | ¥393,800 | |
RTX 4090 | ¥323,800 |
レイトレーシングコスパは総合的に見れば良い方
レイトレーシングコスパは実用性を考慮すれば良い部類だと思います。
全体の位置としてはあまり良くないようにも見えると思いますが、レイトレーシングを実用的に使うにはそれなりの基本性能とVRAMが必須なので、それをある程度満たす高性能GPUに絞れば、意外と上位です。
現状でVRAMを16GBを搭載するGPUでコスパで負けているのは「RX 7800 XT」および「RTX 4060 Ti 16GB」くらいになりますが、どちらもレイトレーシング性能にはやや不安が残る性能ですから、レイトレーシングを十分実用的に使えるGPUとしては一応トップ層のコスパのGPUとなると思います。
ただし、162,980円では微妙な立ち位置になってしまうので、出来れば15万円を切るくらいで買えるようにまではやはり待ちたいGPUだなと思います。
AI・クリエイティブ用途
比較の最後は、AI・クリエイティブ用途でのパフォーマンスを見ていきます。
一般的な動画編集等の基準性能としてFP32(単精度浮動小数点演算)の理論演算性能、「MLPerf Client」におけるAI性能、「Procyon」ベンチマークを用いたAIイラスト生成ソフト「Stable Diffusion」、「Blender」におけるGPUレンダリング性能、「Blackmagic RAW 」によるビデオフレームのデコード速度の性能をそれぞれ見ていきたいと思います。
また、ここのテストは上述までとは異なるテストシステムを使用した海外レビュー(後述)を参考にしています。CPUには「Ryzen 7 9800X3D」、メモリには「DDR5-6000 CL28 32GB(16GBx2)」が使用されています。他の条件について気になる方は参考リンクをご覧ください。
理論演算性能(FP32)
FP32(単精度浮動小数点演算)は、理論演算性能を示す一つの指標です。単位はTFLOPS(テラフロップス)を用います。実際のテストから算出するものではなく、シェーダーユニット数(対応の演算器の数)とクロックから計算した、理論上の処理性能を表します。製品によってクロックが異なるので、下記の表の数値と異なる可能性がある点に注意です。
一般的な動画編集においてのクリエイティブ性能は、このFP32とVRAMの性能(データ量が多い処理の場合)によって比例する傾向があります。実際「Premiere Pro CC」や「Davinci Resolve」などの主要な動画編集ソフトでの編集やプレビュー速度はある程度比例する傾向があるので、まず参考に見ていこうと思います(完全に一致する訳ではないので注意)。
GPU名称 | FP32(TFLOPS) |
---|---|
RTX 5090 32GB 1792GB/s | |
RTX 4090 24GB 1008GB/s | |
RX 7900 XTX 24GB 960GB/s | |
RTX 5080 16GB 960GB/s | |
RTX 4080 SUPER 16GB 736.3GB/s | |
RX 7900 XT 20GB 800GB/s | |
RTX 4080 16GB 716.8GB/s | |
RX 7900 GRE 16GB 576GB/s | |
RTX 4070 Ti SUPER 16GB 672GB/s | |
RTX 5070 Ti 16GB 896GB/s | |
RTX 4070 Ti 12GB 504GB/s | |
RX 7800 XT 16GB 624GB/s | |
RTX 4070 SUPER 12GB 504GB/s | |
RX 7700 XT 12GB 432GB/s | |
RTX 3080 10GB 760GB/s | |
RTX 4070 12GB 504GB/s | |
RX 7600 XT 16GB 288GB/s | |
RTX 4060 Ti 8GB / 16GB 288GB/s | |
RTX 3070 Ti 8GB 608GB/s | |
RX 7600 8GB 288GB/s | |
RX 6800 XT 16GB 512GB/s | |
RTX 3070 8GB 448GB/s | |
Arc A770 16GB 16GB 560GB/s | |
RTX 3060 Ti 8GB 448GB/s | |
RX 6800 16GB 512GB/s | |
RTX 4060 8GB 272GB/s | |
Arc B580 12GB 456GB/s | |
RX 6700 XT 12GB 384GB/s | |
RTX 3060 12GB 12GB 360GB/s | |
Arc B570 10GB 380GB/s | |
RX 6600 XT 8GB 256GB/s | |
RTX 3050 8GB 224GB/s | |
RX 6600 8GB 224GB/s |
理論性能コスパは良くない
「RTX 5070 Ti」のFP32(単精度浮動小数点演算)の理論性能は約43.94TFLOPSです。非常に優れていますが、「RTX 4070 Ti SUPER」とほぼ同じです。コア数が少し増えたものの、クロックが下がったので、最終的にはほぼ同じ数値に落ち着いています。そして、価格が非常に高価なのでコスパは悪いです。
VRAM容量の16GBも価格を考えると不満が残るレベルだと思うので、色んな方面から見て理論性能コスパ的には「RTX 5070 Ti」は弱めです。ただし、「RTX 5080」よりは少しマシではあると思います。
MLPerf Client(AI性能)
「MLPerf Cliend」ベンチマークは、MLCommonsによって設計された、AI性能を測るベンチマークです。ここでは4つのワークロードの幾何平均のスコアを見ていきます。
幅広い環境で使えるONNX(DirectML)をサポートしていますが、Intelでは専用のOpenVINOパスも取得できるようです。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 5070 Ti | |
RTX 4080 | |
RX 7900 XTX | |
RTX 4070 Ti |
AIは汎用のONNX(DirectML)では「RTX 4080」を約9%上回る
汎用のAIテスト(ONNX)では「RTX 4080」を約9%上回る結果となりました。ゲームテストでは若干下回ることが多かったですから、AI面は特に大きく向上していることがわかります。
Procyon Stable Diffusion(AIイラスト生成)
現在、AIイラストソフトで人気のある「Stable Diffusion」での画像生成性能をUL Procyonの「AI Image Generation Benchmark」を用いて比較しています。
「Stable Diffusion XL」は1024×1024の高負荷なテストとなっています。XLではVRAM容量の要求度が高くなるため、特にVRAMが8GB以下のようなGPUではパフォーマンスが極端に低下したり、テストそのものが不可能なケースが基本となります。
ベンチマークではFP32、FP16、INT8といったデータ型のオプションがありますが、今回はFP16でのテストになっています。
また、各社のGPUにはAIの推論性能を高めるために特化したAPIとして、Tensor RT(NVIDIA)、Open VINO(Intel)、ROCm(AMD)といったものがありますが、2024年12月時点ではROCm(AMD)は現状Windowsでのネイティブ動作に対応していません(Linux前提で、WSLを用いてWindows上でLinuxを動作させて使用することは一応可能だけど)。
そして、ProcyonがWindowsを前提としたベンチマークであるため、サポートしているのはTensor RT、Open VINO、汎用のDirect ML(ONNX)の3つとなっており、AMD製のGPU(Radeon等)のみ汎用のDirect ML(ONNX)を使わざるを得ず、低めの性能となっている点に注意が必要です。
※しかし、記事執筆時点ではRTX 50(Blackwell)がベンチマークがTensorRTコア向けに更新されていないため、ONNXでの測定値の掲載となっています。
GPU名称 | スコア |
---|---|
RTX 4090(Tensor RT) | |
RTX 5090(ONNX) | |
RTX 4090(ONNX) | |
RTX 4080(Tensor RT) | |
RTX 4070 Ti(Tensor RT) | |
RTX 5080(ONNX) | |
RTX 4080(ONNX) | |
RTX 5070 Ti(ONNX) | |
RTX 4070 Ti(ONNX) | |
RX 7900 XTX(ONNX) |
ONNXの参考記録だけど、AI画像生成では「RTX 4080」に少し劣る
Stable DiffusionにおけるAI画像生成テストは、記事執筆時点ではBalckwellのTensorRTがサポートされていないため、正確な結果を得ることができないのが残念です。
代わりに汎用のONNX(DirectML)での結果を確認してみると、「RTX 4080」を約18.2%上回る性能でした。「RTX 4070 Ti」との差も小さく、さほど向上していないように見えます。
ただし、TensorRTに対応していないなど、RTX 50シリーズへの最適化がちょっと怪しいので、参考程度に見て置いた方がよいかもしれません。
とはいえ、性能自体は高性能で、現状でも十分実用的に使える性能ではあります。
Blender(GPUレンダリング)
「Blender」は定番の人気レンダリングソフトです。「Blender 4.3」を用いた「Blender Benchmark」の3つのテスト結果の幾何平均を総合スコアとし、比較していきます。
「Blender 4.3」では、Nvidia Optix、Intel OpenAPI、AMD HIPをサポートしており、それぞれが最善の性能が出せる方法で計測されています。しかし、それぞれの最適化には差があり、メインのGPUコアでも幅広い用途に対応できる「Nvidia Optix」が特に高い性能を出すため、現状ではBlenderのレンダリングは基本的にGeForce一強です。
GPU名称 | 総合スコア(幾何平均) |
---|---|
RTX 5090 | |
RTX 4090 | |
RTX 5080 | |
RTX 4080 | |
RTX 5070 Ti | |
RTX 4070 Ti | |
RX 7900 XTX |
Blenderのレンダリング性能は「RTX 4080」にやや劣る
BlenderのGPUレンダリングはシェーダーユニット数が重要な処理なので、向上はほとんど見られません。「RTX 4080」を約13%下回る性能です。
とはいえ、性能自体は非常に高性能です。「RTX 4070 Ti SUPER」よりは高負荷時のワットパフォーマンスも良いので、重いレンダリング処理用としても十分に使えます。
Blackmagic RAW(デコード速度)
「Blackmagic RAW Speed Test」はRAW画像のデコード速度を測定するベンチマークです。GPUを使用する場合にはCUDAかOpenCLを使うことになり、CUDAを使えるGeForceが有利な傾向があります。
また、このテストは圧縮率が低い場合にはシステムメモリの帯域幅の影響を受けやすくなり、GPU毎の差がでにくくなります。そのため、CPUおよびメモリの影響を小さくするため、高い圧縮率(12:1)での8Kおよび4Kのテストでのデコード速度(1秒あたりのフレーム数)を見ていきます。
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 5080 | |
RTX 5070 Ti | |
RTX 4090 | |
RTX 4080 | |
RTX 4070 Ti | |
RX 7900 XTX |
GPU名称 | スコア |
---|---|
RTX 5090 | |
RTX 5080 | |
RTX 5070 Ti | |
RTX 4090 | |
RTX 4080 | |
RTX 4070 Ti | |
RX 7900 XTX |
「RTX 4090」と同等のRAWデコード速度
RAWのデコード速度テストでは、「RTX 4090」とほぼ同じ性能でした。非常に優れたメディアエンジン性能です。
ちなみに、このテストとは別の話になりますが、「RTX 5070 Ti」はデコーダ(NVDEC)は1基となっており、「RTX 5080」の2基と比べると一つ少ないので、動画目的ならその点は一応注意。エンコーダ(NVENC)については2基で同じなので、逆にエンコードのコスパ的には「RTX 5070 Ti」の方が良いです。
まとめ
GeForce RTX 5070 Ti
- 「RTX 4080 SUPER」を若干下回る程度の非常に優れた処理性能(AI関連はやや大きめの性能向上率)
- 希望小売価格は「RTX 4070 Ti SUPER」よりも50ドル安い(ただし、日本では円安で価格上昇)
- 非常に優れたワットパフォーマンス(ただし、前世代のトップ層レベルで新世代感は無し)
- DLSS 4のマルチフレーム生成対応
- レイトレーシングの実用コスパは高め
- 非常に優れたメディアエンジン
- 非常に高価(想定価格:約15万円~)
- 価格の割には少ない16GB VRAM
- 消費電力が多い(TGP:300W)
- 「RTX 4070 Ti SUPER」からの基本性能向上率は小さめ(10%台前半)だけど、実売価格は上昇
- サイズが大型
- AIを含まないクリエイティブ性能は「RTX 4070 Ti SUPER」と大して変わらない
RTX 5070 Ti:「RTX 4080 SUPER」に近い性能で749ドル。「RTX 4070 Ti SUPER」代替品としては悪くないか少し良いレベルだけど、実売価格が気になる
「RTX 5070 Ti」は「RTX 4080 SUPER」を若干下回るくらいの性能を発揮する準ハイエンドGPUです。VRAMも16GB搭載しており、重い処理でも十分実用的に運用できる高性能GPUです。
実質的な先代と言える「RTX 4070 Ti SUPER」と比較すると、フルHD~1440pゲームでは10%台前半程度の向上率となっており、新世代の向上率としては物足りないものの、やや向上しています。ワットパフォーマンスも「RTX 4070 Ti SUPER」よりはやや改善しています。
それでいて、米国での希望小売価格は749ドルとなっており、「RTX 4070 Ti SUPER」の799ドルよりも50ドル安いのは嬉しいです。AI性能の強化やDLSS 4のマルチフレーム生成やニューラルレンダリングのことも考えると実質的なコスパはかなり良くなりそうな感じがあります。
特に、マルチフレーム生成の効果はめちゃくちゃ大きくて、フレームレートを最大化する設定なら、DLSS 3をフル活用した「RTX 4090」すらも大きく上回るフレームレートを叩き出すことが出来ます。
ただし、残念なのは、日本では円安が進んでいるため実売価格ではむしろ上昇してしまっており、発売時の最安値は148,800円と非常に高価になっている点です。「RTX 4070 Ti SUPER」の日本での発売時価格よりも約2万円高いです。しかも、それすらもアリバイ価格で、実際には16万円程度からと言われていたりします。
これでは安かった頃の「RTX 4070 Ti SUPER」と比較してしまうと微妙に見えてしまいますが、既に「RTX 4070 Ti SUPER」および「RTX 4080 SUPER」の在庫がほぼ無くなってしまっているため、その価格でも売れそうな気もするのが何とも言えないところです。
とはいえ、16万円台前半でも「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」と基本性能コスパは同等レベルなので、RTX 50からの新機能やAI性能強化を考えれば、実質コスパ的には少し上回ることにはなるとは思います。そのため、「RTX 4070 Ti SUPER」や「RTX 4080 SUPER」の代替品としては悪くないですし、むしろ少し良いと言えるレベルかなと思います。
ただし、やはり少し気になる点もあるので、個人的には出来ればもう少し安くなってから買いたいGPUなのかな思います。
気になる点一つ目はVRAM容量です。16GBは強力ですが、10万円台中盤のGPUとしては物足りなさはあります。希望小売価格よりも大幅に高い価格では魅力を感じない個人的な一番の理由はこれです。
ワットパフォーマンスも「RTX 4070 Ti SUPER」が「RTX 40シリーズ」の中では若干悪めの位置に居たために大きめに改善したように見えるものの、「RTX 4070 SUPER」や「RTX 4080 / 4080 SUPER」と比較すると、明確に良くなってはいないです。
目玉機能の一つの「マルチフレーム生成」も、効果自体は非常に大きいものの、「RTX 5070 Ti」レベルの性能なら従来のフレーム生成でもほとんどの条件で快適な性能を得ることができますので、実用性能的にはプラスと言えるのか、という疑問もあります。
実売価格がちゃんと「RTX 4070 Ti SUPER」よりも安いか、148,800円のモデルの在庫が十分であれば普通に高評価をあげることが出来たと思うのですが…。今後の価格に期待です。
また、これは「RTX 5070 Ti」の評価というより「RTX 50シリーズ」への所感という感じですが、新世代というよりは「RTX 40シリーズ」のリフレッシュ版か、AI性能強化版という感じで捉えた方がしっくりくる感じがしました。
といった感じで、本記事は以上になります。ご覧いただきありがとうございました。