当初 RTX 5090D 出来后大家都发现它的游戏性能丝毫不亚于 RTX 5090,原因就是对于很多游戏来说,在极高画质设置下,性能基本卡在渲染着色单元、内存带宽上,Tensor Core 削减的性能此时很难体现。
即使是在生成式 AI 应用例如 ComfyUI、生成式聊天对话中,性能瓶颈也往往卡在内存带宽上,我应该最先提出这个问题的。
不过经过我的大量测试,也发现了一些可能会卡在 Tensor Core 性能的应用场景,例如 ComfyUI 里跑 Flux.1 Dev NF…。
当初 RTX 5090D 出来后大家都发现它的游戏性能丝毫不亚于 RTX 5090,原因就是对于很多游戏来说,在极高画质设置下,性能基本卡在渲染着色单元、内存带宽上,Tensor Core 削减的性能此时很难体现。
即使是在生成式 AI 应用例如 ComfyUI、生成式聊天对话中,性能瓶颈也往往卡在内存带宽上,我应该最先提出这个问题的。
不过经过我的大量测试,也发现了一些可能会卡在 Tensor Core 性能的应用场景,例如 ComfyUI 里跑 Flux.1 Dev NF…。
“就算它身上的一颗螺丝钉也绝不能够出口。 ” ——普京谈...
2025-06-19阅读全文 >>看了高赞回答,很多人心里完全接受不了,2000多年前的古希腊...
2025-06-19阅读全文 >>咦这事和我之前参加过的讨论有关,我应该可以回答至少一部分原因...
2025-06-19阅读全文 >>嘿,兄弟们!今天你焦虑了吗? 反正我朋友圈的 JS 开发者群...
2025-06-19阅读全文 >>对GPU进行性能优化时,cudagraph是绕不开的话题。 ...
2025-06-19阅读全文 >>