自今年二月Arctic Sound M(ATS-M)公开以来,我们对英特尔这款数据中心GPU上的细节依然知之甚少,而在此次Vison发布会上,英特尔终于公布了基于Xe架构下的新一代服务器GPU ATS-M的具体细节。ATS-M集成了32个Xe核心和XMXAI光追引擎,其软件栈已经在Xeon处理器上使用了,这也是英特尔oneAPI战略的体现,确保客户应用能够完美过渡。
英特尔给ATS-M做了四大应用定位,分别是云游戏、媒体处理、虚拟桌面和AI推理,并揭露了在这些应用中的具体性能。视频转码上,ATS-M支持30条以上1080p视频流,或8条4K视频流的同时转码,此外,这张卡也是业界首个集成了AV1硬件编解码器的服务器级独立GPU;云游戏场景下,单卡支持40个游戏进程的串流;至于AI推理,英特尔给出了150 TOPS(INT8)的性能。英特尔表示,通过ATS-M对这些工作流的优化,可以将渲染GPU、AI分析加速器和编解码加速器的多硬件需求简化为单个GPU。
鉴于目前占比最高的网络流量还是多媒体,英特尔的ATS-M GPU无疑就是为媒体处理与加速准备的。AV1编码的视频目前尚未完全普及,很大一部分原因就是硬件加速和成本的限制,但这一格式的视频在维持质量的同时可以显著减少流量,又完全开源,搭载ATS-M GPU的服务器无疑能在视频网站、短视频平台和社交网站找到市场。英特尔称该GPU将于2022年第三季度发售,分为75W和150W的两个版本,目前这款产品已经收获了15个客户,包括戴尔、浪潮、慧与、H3C和思科在内的服务器厂商。
在本次大会上,英特尔也揭露了下一代IPU(英特尔的DPU)的计划。该计划持续至2026年,分别涵盖第二代、第三代和第四代IPU,分别面向200G、400G和800G的网络架构。第二代IPU将于今年推出,分别是FPGA+英特尔架构的 IPU Oak Springs Canyon和ASIC的IPU Mount Evans。在英特尔给出的路线图中,这种FPGA与ASIC“双线作战”的设计也将持续至2026年。
C6000X-PL FPGA IPU / 英特尔
这两大IPU产品线给了服务器客户更灵活的选择,如果你想要更高的性能和更低的成本或功耗,就选ASIC IPU;如果你在部署IPU后依然追去更多的可编程性,那就选择FPGA IPU。显然,英伟达开启的DPU市场已经在逐渐扩张,连英特尔也不愿意错过这场盛宴。
第二代AI训练与推理加速器
被英特尔收购的Habana终于推出了其第二代AI芯片系列,专注于训练的Gaudi 2处理器和专注于推理的Greco处理器。Gaudi 2的具体性能体现在我们的另一篇文章中有详细介绍,这里我们来谈谈Gaudi的市场反响。
Gaudi 2处理器 / Habana
Gaudi应该算是Habana当下最受欢迎的产品,不仅此前与亚马逊合作率先上云,国防与医疗公司Leidos用其进行医学影像数据集的训练,连同属英特尔旗下的Mobileye都开始使用本地和云端的Gaudi处理器,完成目标检测和目标分割这类自动驾驶训练工作。此外,由于此次Gaudi 2主打高性能,Supermicro和DDN也分别计划推出集成Gaudi 2处理器的AI服务器和服务器存储方案。
至于Greco推理处理器则没在发布会上提及,其实也可以理解,毕竟今晚的主角中还有Arctic Sound M这一服务器GPU,同样主打推理。由于本处理器今年下半年才开始送样,明年第一季度才开始量产,所以具体性能仍是未知数,但Habana还是分享了一些有趣的细节。Greco与Gaudi 2一样,同样从台积电的16nm工艺升级至7nm工艺,得益于制程优势,Greco也成功将功耗从Goya的200W减少至75W。
为了提供更快的理速度与效率,Greco这次集成了片上媒体编码和处理,支持当下最常见的H.265、H.264、JPEG等格式,同时也支持BF16、FP16、INT8和INT4等数据类型。从定位上来看,Greco并非ATS-M这样的通用GPU方案,而更像是一个专门面向机器视觉推理的AI加速器。
正式向英伟达宣战?
从英特尔此次发布会公开的产品来看,几乎每一个都可以找到对应的英伟达竞品。在半导体企业各大业务有起有伏的当下,服务器市场依然是最大的香饽饽,维持着这些公司的利润率。英伟达进军服务器CPU,又在服务器GPU市场赚得盆满钵满,英特尔要想维持现在的地位,也必须做出大刀阔斧的行动。
版权申明:本站文章均来自网络,如有侵权,请联系01056159998 邮箱:itboby@foxmail.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有