NVIDIA为1亿台Windows RTX PC和工作站提供全新生成式AI功能与突破性性能-电动汽车观察家

NVIDIA为1亿台Windows RTX PC和工作站提供全新生成式AI功能与突破性性能

搭载Tensor Core的NVIDIA RTX GPU正在加速生成式AI模型的开发与部署;即将推出的Max-Q低功耗AI推理将提高能效比。

生成式AI正在迅速开创一个计算的新时代,为生产力、内容创作、游戏等多领域带来了变革。NVIDIA NeMo和DLSS 3帧生成技术、Meta LLaMa、ChatGPT、Adobe Firefly、Stable Diffusion等生成式AI模型和应用能够使用神经网络来识别现有数据中的模式和结构,以此生成新的原创内容。

专为GeForce RTX和NVIDIA RTX GPU优化的生成式AI模型具有高达1,400 Tensor TFLOP的AI推理性能,运行速度比同类其他设备快5倍。这要得益于RTX GPU中用于加速AI计算的专用硬件Tensor Cores,以及常规的软件改进。上周在Microsoft Build大会上发布的增强功能等软件方面的改进使得像Stable Diffusion这样充分利用新的DirectML优化功能的生成式AI模型性能翻倍。

随着越来越多的AI推理在本地设备上运行,PC将需要强大而高效的硬件以支持这些复杂的任务。为了满足这一需求,RTX GPU将添加用于AI工作负载的Max-Q低功耗推理。在执行轻量级的推理任务时,GPU将以极低的功耗运行,而在运行繁重负载如生成式AI工作时,则可升至极高的性能水平。

为了创建新的AI应用,在Windows 11上运行的整个RTX加速AI开发堆栈现已向开发者开放,使AI模型的开发、训练和部署变得更容易。开发者首先会通过Windows Subsystem for Linux(WSL)上经过优化的深度学习框架开发和微调模型。

然后开发者可以无缝上云并在各个主要云服务商(CSP)提供的相同NVIDIA AI堆栈上进行训练。接下来,开发者使用全新Microsoft Olive等工具优化训练好的模型以实现快速推理,最后面向专为AI优化的系统的1亿多RTX PC和工作站部署AI应用和功能。

微软Windows芯片和系统集成副总裁Pavan Davuluri表示:“未来几年,AI将成为推动Windows客户创新的最大驱动力。我们正在与NVIDIA开展软硬件优化方面的合作,以此为开发者提供变革性的、高性能的、易于部署的体验。”

迄今为止,超过400款已发布的应用和游戏由RTX AI提供加速,该阵容还在持续壮大中。

在拉开了Computex 2023序幕的主题演讲中,NVIDIA创始人兼首席执行官黄仁勋介绍了用于游戏开发的新生成式AI——NVIDIA ACE游戏开发版(NVIDIA Avatar Cloud Engine(ACE)for Games)。

通过AI驱动的自然语言互动,这项自定义AI模型代工服务使游戏中的非玩家角色(NPC)更加智能,从而彻底改变游戏体验。中间件、工具和游戏开发者可以使用“ACE游戏开发版(ACE for Games)”在他们的软件和游戏中建立并部署定制化的语音、对话和动画AI模型。

在RTX上运行的生成式AI无处不在

从服务器到云,再到设备,在RTX GPU上运行的生成式AI无处不在。NVIDIA的加速AI计算具有低时延、全栈式的特点。多年来,我们一直在优化AI软硬件架构的各个部分,包括RTX GPU上的专用AI硬件——第四代Tensor Core。

通过对驱动的定期优化,能够确保峰值性能。最新NVIDIA驱动在与经Olive优化的模型和DirectML更新结合后,能够在Windows 11上大幅提升开发者的速度。例如在Stable Diffusion中,使用DirectML优化路径的开发者将干扰时间缩短了两倍。

借助基于NVIDIA Ada Lovelace架构打造的最新一代RTX笔记本电脑和移动工作站,用户可以在任何地方运行生成式AI。新一代移动平台的外形尺寸只有14英寸,重量仅为3磅左右,将性能和便携性提升至新高。戴尔、惠普、联想、华硕等制造商正在RTX GPU和Tensor Cores的支持下,推动生成式AI时代的发展。

“随着各个行业继续部署AI,预计到2030年,AI需求的年增长率将超过37%,企业和消费者将越来越需要合适的技术以实现AI的开发和落地,比如生成式AI等。多年来,联想一直致力于开发适用于AI工作负载的产品和解决方案,进而助力扩展生成式AI的应用范围——从设备到服务器、再到云。联想ThinkPad、ThinkStation、ThinkBook、Yoga、Legion和LOQ等搭载NVIDIA RTX GPU的PC正在推动生成式AI的变革浪潮,在节省时间、创作内容、完成工作和游戏等方面提供更好的用户体验。”

——联想副总裁兼PC业务和智能设备首席技术官Daryl Cromer

“生成式AI是一项革命性的技术,同时也是促进各个行业未来创新的催化剂。惠普与NVIDIA共同为开发者提供卓越的性能、移动性以及运行当前加速AI模型所需的可靠性,推动全新生成式AI时代的发展。”

——惠普高级副总裁兼Z系列总经理Jim Nottingham

“我们近期与NVIDIA围绕Project Helix的合作重点是助力企业更轻松地在本地构建和部署值得信赖的生成式AI。在这个历史性时刻,我们进一步将生成式AI引入PC。想象一下,应用开发者能够在完善神经网络算法的同时,在本地控制训练数据和IP。正是为了实现这个目标,我们设计了搭载NVIDIA RTX GPU的强大、可扩展Precision工作站。作为工作站领域的全球领导者,戴尔在帮助用户安全加速从边缘到数据中心的AI应用方面具有独特的优势。”

——戴尔科技客户产品部总裁Ed Ward

“生成式AI的时代正在到来,因此需要强大的处理能力和经过全面优化的软硬件。借助NVIDIA AI平台,包括现在已经预装到我们许多产品上的NVIDIA Omniverse,我们十分高兴能看到AI的变革在华硕和ROG笔记本电脑上持续不断地推动着。”

——华硕全球消费业务市场总监Galip Fu

很快,搭载RTX GPU的笔记本电脑和移动工作站就将做到“两全其美”。纯AI推理工作负载将根据Tensor Core的性能进行优化,同时尽可能降低GPU的功耗,延长电池续航时间,并保持系统拥有出色的散热和降噪表现。GPU还可根据工作负载的需要,动态提升至最高AI性能。

开发者可以访问面向加速应用开发者的NVIDIA AI网页,了解如何对应用进行端到端优化,以充分利用GPU加速。

本文由 电动汽车观察家 作者:电观 发表,其版权均为 电动汽车观察家 所有,文章内容系作者个人观点,不代表 电动汽车观察家 对观点赞同或支持。如需转载,请注明文章来源。
7