中国windows野外传统渲染时代谢幕,RTX 50正式开启AI渲染时代_ZAKE中国windows野外R新闻
传统渲染时代谢幕,RTX 50正式开启AI渲染时代_ZAKE中国windows野外R新闻
面向全球工程前沿策划专题出版,提供内容知识的“增值服务”
在 CES 2025 的发布会上,NVIDIA 正式推出了采用 Blackwell 架构的新一代 RTX 50 系列 GPU,而在 1 月 15 日,NVIDIA 又举办了一次技术沟通会,对 Blackwell 架构以及诸多 AI 渲染技术进行了详细的介绍,并在现场提供了包括 RTX 神经网络渲染、Mega Geometry、DLSS 4、3D 引导生成式 AI 和《永劫无间手游》PC 版 AI 队友、《动物朋克》AI NPC 的互动 DEMO 体验。我们有幸参加了这次技术沟通会,在这里也和大家分享一下。Blackwell 架构解析:为 AI 渲染而生RTX Blackwell 架构设计的目标:为新的神经网络渲染进行优化;减少显存占用;为服务功能提供新的质量;高能效。可以说,RTX Blackwell 架构的诞生,代表 GPU 的发展开始摆脱摩尔定律的限制,同时也宣告光栅化渲染时代进化到 AI 渲染时代。NVIDIA GeForce Blackwell 神经网络渲染架构拥有第五代 Tensor Core 和第四代 RT Core,RTX 算力高达 360 TFLOPS,为全新的 Mega Geometry 提供强大的性能支持;搭载 AI 管理处理器,在 AI 计算与图形渲染之间智能分配算力,实现最佳平衡;全新设计的 Blackwell SM 单元,为新的神经网络着色器提供高达 125 TFLOPS 的强大算力;NVIDIA Blackwell 架构下的 Max-Q 技术,带来两倍的高能效;首次搭载 GDDR7 显存,提供高达 30Gbps 传输速率。Blackwell 的 SM 单元经过了全新的设计,整个架构完全为新的神经网络渲染而打造。从图中可以看到,和上代针对常规渲染设计的 Ada SM 相比,Blackwell SM 将支持 INT32 的着色器单元数量增加了一倍(INT32/FP32 着色器单元总数不变), 同时将着色器执行排序的效率提升到上代的两倍(对常规渲染和神经网络渲染的代码进行排序)。Blackwell 是第一款搭载 GDDR7 显存的 GPU,相对 GDDR6 显存来讲,GDDR7 提供了两倍的数据传输速率,同时由于 GDDR7 使用了 PAM3 的模式,拥有比 GDDR6X PAM4 模式更低的工作电压,所以不但速率更高,功耗也更低,相对 GDDR6 更是提升了一倍的能效。Blackwell 架构的一项重大技术升级就是支持 Mega Geometry,可将场景中的光线追踪三角形数量至多增加 100 倍,从而可以在游戏或者 3D 应用中提供超高的几何细节,打造极为逼真的模型。而实现 Mega Geometry 的硬件基础当然就是 Blackwell 搭载的第四代 RT Core,它相对上代 Ada 架构的第三代 RT Core 增加了三角形集群交汇引擎、三角形集群解压缩引擎与线性图形扫描单元(专用于加速毛发渲染)从图中可以看到,Blackwell 的第四代 RT Core 相比第一代 RT Core 提升了 7 倍的光线三角形交汇率,相对上代 RT Core 也有一倍的提升。同时,和上代 Ada 架构相比,Blackwell 架构由于支持几何压缩,显存占用率也下降了 25% 之多。Blackwell 另一大亮点就是其搭载的第五代 Tensor Core 支持 FP4 精度的计算,如果和 Pascal 架构相比,它的算力提升了 31 倍,相对上代 Ada 的 Tensor Core(FP8),也提升了一倍。为什么要选择 FP4 模式?按照 NVIDIA 官方说法,FP4 模式在可以满足渲染精度的同时下能够提供更快的渲染速度,综合来看是当下最符合需求的平衡点。同时,Blackwell 架构还引入了全新的 AMP(AI Management Processor),这是一个完全可编程的硬件处理器,它可以精确控制和平衡帧生成与 AI 计算的所有需求。因此,在混合了 LLM 大语言模型、DLSS、帧生成等功能的游戏中,AMP 优先保证基于 LLM 的数字人 AI 队友能够第一时间响应你的命令,同时也能确保帧渲染与刷新率接近或同步,不出现卡顿的情况。能效方面,Blackwell 也带来了新一代的 Max-Q 技术,可以在平台总功率限制下尽可能提供更高的性能。同时对于移动平台来讲也就意味着更长的续航时间。首先值得关注的就是 Blackwell 采用的先进电源门控技术。其中时钟门控可以允许快速关闭整个时钟树;电源门控可以大大降低进入与退出某个电源模式的延迟,从而大大降低待机功率;新的电压轨门控则可对芯片区域实现独立的电压控制,同时针对工作负载进行优化,在很短的时间内就可以关闭芯片内闲置的单元。NVIDIA 举了一个运行小语言模型查询的案例来对比 Blackwell 与 Ada 架构在功率控制方面的差异。从图中可以看到,由于 Blackwell 拥有更强的 AI 性能,它比 Ada 更快地完成了活动周期,从而提前进入了更低的功耗状态,同时它进入低功耗状态的延迟也更低(比 Ada 快 10 倍)从而大幅节约了系统的功耗,总的来看,整个过程最高可以节约 50% 的功率。Blackwell 在时钟架构上的改进幅度非常大,和上代相比,它的时钟频率调整响应速度甚至快了 1000 倍,在动态负载状态下,自然会带来更高的能效表现。显示与视频部分,Blackwell 也带来了一系列的升级,输出部分,它支持 DP2.1 接口,支持 UHB R20,拥有 20Gbps 的带宽。而在视频编解码部分,它的编码器从 Ada 的第八代升级到了第九代,解码器也从 Ada 的第五代升级到了第六代。因此,Blackwell 现在支持 AV1 UHQ、双倍的 H.264 解码,MV-HEVC,同时也支持 4 2 2 格式的硬件编解码了,对于视频剪辑师用户来讲非常实用。综合来看,Blackwell 架构整体设计思路就是从传统渲染到 AI 渲染的进化,无论是新一代 RT Core 与 Tensor Core,还是全新打造的 SM 单元和首次引入的 AMP,都是为 AI 渲染而生,而正是因为这些变革,才为 DLSS 4、神经网络渲染、Mega Geometry 等等新特性提供了硬件基础,从而打破了摩尔定律的桎梏,让 GPU 的进化走入了一个新的时代、彻底拥抱 AI 的时代。RTX 神经网络渲染:打破传统硬件限制的关键自 2001 年 GeForce 3 首次引入可编程着色器,NVIDIA 始终在引领 GPU 技术的发展,到现在 Blackwell 架构则首次将小型神经网络渲染引入传统的可编程着色器,从而打造出神经网络着色器的概念。神经网络着色器可以实现很多功能,包括神经网络材质、神经网络纹理、神经网络辐射缓存、神经网络辐射场等等。NVIDIA 和微软合作创造了一个叫做 Cooperative Vectors 的新 API,这个 API 就可以让游戏开发者在游戏引擎中使用到神经网络着色器的技术。RTX 神经网络纹理压缩在使用 AI 的情况下不到一分钟的时间内就可以压缩数千个纹理,同时它还可以节约非常多的显存,在视觉效果相同的情况下,大约只需要传统纹理压缩方式 1/7 的显存。同时,RTX 神经网络材质部分,也使用 AI 来压缩复杂的着色器代码,而这些代码通常都采用了离线的模式,并可以完成多层材质的处理,处理速度更是提升了五倍,能在实现电影级画质的同时提供游戏需要的流畅帧率。从图中可以看到,使用神经网络材质占用 16MB 显存,而使用传统材质要占用 47MB 的显存,同时视觉效果的逼真程度要高出很多,特别是宝石的光泽、丝绸每一根丝线的光泽变化,已经远超普通渲染的水平。特别值得一提的是,在神经网络渲染模式下,物体表面的材质其实每次都会有细微的差别,因为它真的是由 AI 实时计算生成的——就像 Stable Diffusion 文生图那样。RTX 神经网络辐射缓存方面,用于路径追踪间接光照和性能的神经网络着色器支持实时自我训练网络,通过每像素一次弹射可推算出更多的弹射,大幅节约资源,提升效率。通过 RTX Neural Faces,可以实时生成更加生动的 AI 面容。整个流程是先通过游戏引擎的光栅化引擎渲染出脸部和 3D 姿势,再通过 AI 模型来推理,然后对训练之后的脸部模型通过 Tensor RT 来做优化,最终输出更加接近真实的角色脸部。我们知道,在游戏中用传统的方式来精准渲染发束会用到非常多的三角形,一个角色的头发甚至要用到六百万个三角形。而 Blackwell 通过线性扫描球体这个新加入的渲染单元,则可以大幅降低发束对三角形数量的需求,相对传统渲染方式来讲,仅需 1/3 的数据开销,因此可以提供更高的帧率。3D 游戏中使用的几何体数量在不断攀升,上世纪 90 年代游戏中的几何体数量在 1K 到 10K,而到了 2020 年之后,游戏中的几何体数量已经增长到一千万到五千万。更多的几何体也就意味着游戏中的建模更加精细、更加真实,因此从提升视觉效果来讲肯定是多多益善。但是,更多的几何体也就意味着对 GPU 性能要求更高,因此,Blackwell 引入了 Mega Geometry,在官方的 Zorah 演示 DEMO 中,支持三角形的数量甚至达到了五亿之多。传统的几何体系统中每一个场景 LOD 的 BVH(包裹体变异)都需要去更新,因此资源开销会非常大,而适用于数百万三角形的集群系统(Cluster)引入,让构建这个系统的成本大幅降低。Mega Geometry 则可以在多帧上来压缩和缓存这些集群,从而加快场景更新 LOD 的 BVH 的速度,提供对数百万几何体数量高精度模型实现路径追踪的能力。接下来要谈的 AI 渲染技术就是大家最关心的 DLSS 了。DLSS 已经诞生 6 年,并在通过训练不断迭代和进化。到目前为止,支持 DLSS 的游戏和应用数量已经高达 540+,其中 2024 年前 20 的游戏大作中就有 15 个支持 DLSS。目前已经有超过 80% 的 RTX 玩家会在游戏中开启 DLSS,而 DLSS 游戏的总游玩时间已经超过三十亿小时。实际上,如果要在 4K 极限画质下实现 250+fps 和 35ms 帧延迟的游戏体验,可能需要 10 块传统 GPU,但换成支持 AI 的 GPU,其实只需要一块就够了,这就是 Blackwell 诞生的目的之一。新一代的 DLSS 4 使用了 Transformer 模型,相对之前的 CNN 卷积神经网络模型来讲,提供了两倍的参数、四倍的计算以及更加出色的画质。从官方提供的对比视频来看,使用 Transformer 模型的光线重建画面质量明显优于使用 CNN 模型,大家可以注意《心灵杀手 2》场景中铁丝网的细节,Transformer 模型这边明显纹理更清晰,完全看不到边缘闪烁的锯齿。用 Transformer 模型来做超分辨率效果也会好很多,它可以提供更清晰的纹理细节、更少的鬼影,目前已经有 Beta 版可供大家体验。RTX 50 独享的 DLSS 4 大招当然就是全新的多帧生成技术了。我们知道,之前 DLSS3 的帧生成技术是 AI 模型使用游戏本身的数据(运动矢量和深度),通过光流场加速器来生成新的帧,但每帧只能生成一帧,毕竟通过这种方式要生成多帧会导致极高的资源开销。而 Blackwell 架构则针对 DLSS 4 的多帧生成设计,包括增强的 Tensor Core、增强的 Flip Metering 和 AMP。在此基础上,DLSS 4 的多帧生成采用的模型速度提升了 40%,使用的显存减少了 30%,而且只需要渲染一次就可以生成全部的三帧,生成的帧会均匀排列,从而提供流畅的体验。从图中可以看到,DLSS 4 和多帧生成技术加持的情况下实际渲染的 16 个像素中,就有 15 个是 AI 生成的。综合计算下来,可以让帧率最高提升八倍。官方展示视频中《赛博朋克 2077》在开启 DLSS 4 和多帧生成(使用 Transformer 模型)之后,帧率从 27fps 暴增至 248fps,相对上代的提升幅度也有 1.7 倍。而且,DLSS 4 不但帧率提升,画面精度也大幅升级,大家可以看到外卖盒上的纹理细节,DLSS 4 明显更加丰富。首发支持 DLSS 4 的游戏已经有 75 款,那么对于暂时不支持 DLSS 4 的游戏来讲,大家也可以在 NVIDIA app 中使用 DLSS Override 功能来提前享受 DLSS 4。例如《漫威争锋》就可以通过 DLSS Override 来提前享受多帧生成带来的巨幅帧率提升。可能玩家会担心多帧生成会带来更多的延迟,不过 NVIDIA 的 Reflex2 显然会让大家打消这个顾虑。NVIDIA 在 Reflex 2 中部署了一个以前应用在 VR 中的技术(Frame Warp),在每一帧渲染结束之后,Reflex 2 都会移动画面对齐最新的鼠标位置。不过,Frame Warp 会在画面中产生空白的区域,为此 NVIDIA 开发了一项 Inpaint 预测修补技术,这个技术使用前一帧的颜色与深度数据对空白区域进行修复,从而创造出与原生渲染几乎没差别的画面。综合来看,通过 AI 技术加持的神经网络渲染,Blackwell 实现了空前的性能提升和更加真实的电影级画质,而这些如果要依靠传统光栅渲染来实现的话几乎是不可能完成的任务。由此可见,AI 渲染时代已经正式来临,而 Blackwell 的出现,将彻底改变游戏开发的流程和游戏玩家的体验。现场 DEMO:超乎想像的未来游戏体验现场布置了多台配备 RTX 5090 D 和 RTX 5080 GPU 的电脑,并部署了包括 RTX 神经网络渲染、Mega Geometry、DLSS 4、3D 引导生成式 AI 和《永劫无间手游》PC 版 AI 队友、《动物朋克》AI NPC 的互动 DEMO 体验,一起来看看吧。RTX 神经网络渲染:Zorah可以看到,在 RTX 50 系列 GPU 通过 AI 计算的神经网络材质加持下,Zorah 演示 DEMO 中的艺术品与丝绸的质感变得更加接近真实的物体。宝石不但表现出了通透的感觉,同时带有精准的光追效果,丝绸表面并非像传统渲染那样只有简单的蓝色反光,而是针对每一根丝线都有独立的渲染,并根据角度不同呈现出了正确的绿色反光,而且在转动视角的时候可以看到每一根丝线都有独立的反光变化。同时,我们还观察到物体表面材质每次切换渲染模式后都会有小幅度的变化,可见其确实是由 AI 实时生成的。RTX 神经网络渲染:DragonDragon 这个 DEMO 主要展示了 Mega Geometry 技术,建模中采用了巨量的三角形,并加入了复杂的光追效果,让整个龙的形体细节非常丰富。特别值得一提的是,龙身体表面的材质也是通过神经网络渲染 AI 生成,让 AI 模型来自动判断龙的鳞片是什么样子。可以说,要是没有 Blackwell 的 Mega Geometry 技术,仅靠传统渲染是无法支撑如此多数量三角形的模型快速构建的。DLSS 4 Override:《黑神话:悟空》在暂时没有内置 DLSS 4 支持的游戏中,我们可以使用 NVIDIA APP 开启 DLSS Override 模式来提前享受 DLSS 4 带来的高帧率和高画质。在现场 NVIDIA 使用的是《黑神话:悟空》,可以看到在 4K 影视级画质 + 光追特效全满的情况下,即便是强如 RTX 50 系列 GPU 也只能跑到 21fps,但开启 DLSS 4 加上多帧生成之后,帧率就暴增到了 188fps,大约提升了 8 倍,而且即便是近距离比较画质,也基本上看不出来开启 DLSS 4 和原生有什么差别,可谓高画质与高帧率兼得。此外,我们也可以看到开启 DLSS 4 后 GPU 的游戏功耗比原生状态低了大约 14% 左右。Converse With AI-Powered NPCs:《动物朋克》《动物朋克》是一款还在开发中的动作游戏,它已经使用了 NVIDIA ACE 技术,而且用的是本地 AI 模型,无需联网即可在游戏中提供 AI NPC 功能。在游戏中,我们可以和叫 Buck 的猴子工程师通过语音或者打字互动,让它帮你改变飞船的涂装和 LOGO。玩家可以和 Buck 全程闲聊,这里调用的也是本地 LLM,而改变飞船涂装则使用了文生图的本地 AI 模型。实际体验中,由于调用的是本地模型,响应速度可以说是完全无缝的,体验非常不错。Converse With AI-Powered NPCs:《永劫无间手游》PC 版《永劫无间手游》PC 版提供的 AI 队友就更有趣了,你不但可以和它闲聊,也能通过语音和打字来指挥它战斗、部署战斗任务等等。现场工程师表示《永劫无间手游》PC 版调用的是网易自己开发的 AI 模型。实际体验中,AI 队友确实能够非常快地响应玩家的语音指挥,并根据实际情况,将战况和自身状态通过语音和文字反应给玩家,就像玩家在和真人组队游玩一样。此外,不同的 AI 队友还拥有不同的性格,带给玩家的互动体验也完全不同。可以说,AI 队友应该算是最令人期待的游戏功能之一了。NVIDIA 在现场还展示了《绝地求生》AI 队友的演示视频,未来加入 AI 队友恐怕要成为电竞网游的必备功能了。3D Guided Generative AI:Blueprint对于不是特别精通 AIGC 和 3D 建模的用户来讲,Blueprint 可以说是一个非常容易上手的 AI 生图工具。用户只需要下载现成的模型并拖拽到 Blender 的工作区域中,然后调整到需要的视角,并根据需要输入提示词点击渲染,仅需 3 秒多就能将模型图渲染成需要的图片(1280×720)。同样的 3D 模型组合,使用不同的提示词就能生成不同风格的图片。由于 Blackwell 使用的是 FP4 精度渲染,因此不但速度快,对显存占用也更低,所以非常适合主流 GPU 使用。写在最后:Blackwell 开启了 AI 渲染新时代简单总结一下。GPU 发展到今天,摩尔定律也已经走到了尽头,如果想要突破制程工艺与芯片规模的限制实现 GPU 性能的巨幅提升,AI 渲染确实是一个高效而且可行的思路。NVIDIA 从推出第一代 Tensor Core 开始,就已经注定游戏 GPU 必然要归属在 AI 计算的大框架之下,由 AI 驱动的渲染模式,才能让 GPU 真正突破硬件的物理限制,从 Blackwell 加入的神经网络着色器、Mega Geometry、DLSS 4 等等技术可以看到,AI 确实做到了这一点,它确实称得上是开启 AI 渲染时代的里程碑。其实本次技术沟通会的内容远不止这些,限于篇幅我们决定把它们放在之后的测试中再详细介绍。因此,大家可千万不要错过我们 RTX 5090 D 与 RTX 5080 的首发测评!koa12jJid0DL9adK+CJ1DK2K393LKASDad
编辑:何光宗
TOP1热点:伦纳德再次推迟复出
汽车制造业产值持续增长,对重庆市工业增长贡献率达到21.4%。亮眼数据的背后,是新能源汽车支撑整个行业拔节生长。。
据新华社阿布贾9月2日电(记者杨喆)尼日利亚总统提努布日前在尼首都阿布贾会见联合国负责反恐事务的副秘书长弗拉基米尔·沃龙科夫时表示,希望联合国加大支持尼日利亚打击恐怖主义的力度。
TOP2热点:送父母真正贴心的礼物推荐
(二)行政法规、规章或者行政机关制定、发布的具有普遍约束力的决定、命令等规范性文件;
TOP3热点:原神绮梦缱绻梦见月瑞希C开你的SB
他高度赞赏中国政府为促进数字经济产业发展所做的努力,认为这一产业为许多国家,尤其是“一带一路”沿线国家的经济社会发展提供了强大助力。
今年5月初,青海省委召开6名领导干部严重违反中央八项规定精神问题以案促改专项教育整治动员部署会,省纪委监委出台了《全省党员干部违规吃喝“十严禁”》并公布举报方式。
TOP4热点:李明德创飞所有人除了田曦薇开过张的女生是不是一直想
福建地处改革开放第一线和对台工作最前沿,在国防工作大局中肩负着重要使命。我们要发扬福建全民国防教育优良传统,科学把握福建在全民国防教育工作大局中的职责使命,更好担负起历史重任。
尼泊尔驻华大使比什努・普卡尔・施雷斯塔说,希望通过此次参访交流,将中国的先进技术和成功经验引入尼泊尔。期待进一步加强与浙江的交流合作,充分拓展双方合作的领域,取得更多合作成果。
TOP5热点:送父母真正贴心的礼物推荐伽罗太华躺床流白色分泌物
最令尚辉骄傲的是,这两年,基地的水稻田里还种上了“南粳9108”――这是一种优质稻米,在第二届全国优质稻品种食味品质鉴评中获得金奖。“亩产稳定在750斤左右,很受市场欢迎。”卢基华告诉记者,这意味着盐碱地通过治理,也能大面积种植优质水稻了。
TOP6热点:适合偷偷变美的过年三件套人与畜禽CORPORATION
通知提出,在公共法律服务方面,要深入推进覆盖城乡的公共法律服务网络建设,推动司法所与乡镇(街道)公共法律服务实体平台一体规划、一体建设、资源共享,推动村(社区)公共法律服务工作室与村(居)法律顾问工作有效衔接,全面提升“12348”公共法律服务热线和公共法律服务网络平台服务乡村群众能力。大力推进乡村矛盾纠纷预防化解,开展乡村人民调解委员会规范化建设,充分发挥人民调解职能作用,及时有效化解矛盾纠纷。
行政机关委托的组织作出行政行为的,委托的行政机关是被申请人。
TOP7热点:趁过年,给父母一个「适老化」的家三亚久爱传媒有限公司股东
有权申请行政复议的公民死亡的,其近亲属可以申请行政复议。有权申请行政复议的法人或者其他组织终止的,其权利义务承受人可以申请行政复议。
这片盐碱地2018年开始大面积改良,2019年部分田块就实现了两季平均亩产超2000斤――这标志着盐城盐碱地改土技术进入新阶段。
TOP8热点:抖音如何快速起号XXXXXL196-MAY18
滨海盐碱地受海水影响形成,盐分高、养分低、危害大。为了挖掘后备耕地资源,1952年,江苏在盐城设立新洋农业试验站。新洋农业试验站后隶属于江苏沿海地区农业科学研究所,从盐城市亭湖区东部这片8000多亩的盐碱地起步,开始了盐碱地综合利用的探索之路。
TOP9热点:张家口 7 旬冬泳者被困冰下后遇难一面膜上边一面吃下边免费
资本市场一直以来都是支持民营经济发展壮大的重要平台。尤其是近年来,资本市场抓住注册制改革契机,大幅优化发行上市条件,进一步畅通民营企业股权融资渠道。比如,允许“未盈利企业、特殊股权结构企业、红筹企业”上市,一大批符合条件的“硬科技”和“三创四新”民营企业上市融资。据证监会统计,2019年以来,共有1254家民营企业IPO,融资合计1.22万亿元,分别占同期IPO家数和融资规模的81%和60%。
TOP10热点:周末游上海成韩年轻人度假新时尚2023国精产品一二二线
(七)行政复议机关未受理过该申请人就同一行政行为提出的行政复议申请,并且人民法院未受理过该申请人就同一行政行为提起的行政诉讼。