时间: 2024-10-30 14:30:23 作者: 半岛官方登录入口
AI时代的到来,正在为各行各业带来深刻影响。在PC领域,因为AI的加持,也呈现出加速变革的趋势。
凭借制程、架构、工艺等方面的系统性创新,近年来,AMD在高性能计算领域风头无量,也成为AI PC的技术创新和引领者。
在日前举行的AMD Tech Day 2024上,AMD官宣基于新新一代Zen5架构,面向桌面和移动端处理器新品,代号为“Granite Ridge”的锐龙9000系列,以及代号为“Strix Point”的 AMD锐龙AI 300系列移动处理器将于月底正式推向市场。作为AMD年度技术创新和展示盛会,AMD也在此次大会上,分享了包括Zen、RDNA、XDNA等核心架构的最新研发进展和细节。
自2017年Zen架构推出以来,AMD一直在稳步提高性能表现,连续5次实现两位数IPC提升,而此次Zen 5的出现,则是提升最大的一次,凭借设计、制程、工艺等方面的创新,Zen 5架构使得IPC性能实现16%的飞跃,此外,伴随RDNA 3.5以及XDNA 2等全新架构的加持,一举成为目前性能最强的PC芯片产品,进一步巩固AMD在AI PC领域的领先优势。
即将发售的锐龙9000系列具有四个型号:锐龙9 9950X、锐龙9 9900X、锐龙7 9700X、锐龙5 9600X,最高支持16核心32线程。
领先的性能,出色的能效,极致的超频、长周期的平台寿命一直是AMD在桌面产品上的愿景,上述特征也在锐龙9000系列上充分呈现,从而为AI时代桌面PC在生产力以及内容创作、游戏等方面带来出色的使用体验。
从官方提供的数据看,四款产品非常能打,在性能上均实现了对英特尔旗舰产品酷睿i9-14900K的超越。
在能效方面,通过采用全新的热设计的具体方案,能带来7℃的温度降低。相比于锐龙7000系列,在功耗和性能上均实现较大提升。
在超频方面,结合AMD自家的PBO(Precision Boost Overdrive)技术,锐龙9000系列可以在一定程度上完成6%-15%的性能提升,一键实现在使用体验上,无论是对小白用户还是极客玩家都非常友好。
去年AMD在发布Zen 5架构时,便曾确认AM5Socket平台将实现对Zen 5处理器的支持,此次宣布对该平台的支持将延续到2027年。
AMD表示AM5平台能够充分支持AI性能的释放,在AI大模型运行以及存储带宽方面,均大幅领先酷睿i9系列处理器。在采用Zen 5 核心的AI加速方面,运行Llama以及Mistral的速度分别相比竞品快17%和20%。
毫无疑问,创新的Zen 5架构是此次AMD新品的灵魂基石。在AMD看来,这代表着Zen架构的巨大进步和飞跃。
AMD执行副总裁及首席技术官MarkPapermaster介绍,Zen 5架构的创新包括四大方面:包括每个周期内的更多指令、调度和执行的扩展宽度、双倍缓存数据带宽以及AI加速。
具体而言,包括双通道的Fetch寻址以及高级分支预测,从而带来延迟的降低,准确度的提升,带宽的改善等。在Zen 5中,有8-wide用于调度和执行,6个算数逻辑单元,同以往每个单元有一个调度器不同,Zen 5中进行统一调度,可以优化每个区域的执行,通过较宽的执行通道,保证执行流水线的性能,同时扩大执行窗口。
同时,Zen 5架构也通过增大一级缓存DTLB,一级数据缓存容量从32KB增大到48KB,载入存储队列加宽,浮点单元扩大一倍等方式,减低延迟,增加吞吐量的方式提升性能表现。从而有助于AI PC中对游戏和内容创建等的要求。
此外,Zen 5架构引入512位AI数据路径,可以直接执行AVX-512,性能更强,也可高效执行VNNI等指令,更加有助于提升AI表现。
和Zen4架构相比,Zen 5平均IPC性能提升16%,特别在AI方面,单核心机器学习速度提升32%,AES-XTS单核心加密速度提升35%。
此外,MarkPapermaster还透露,Zen6正在按计划推进中,基于Zen 5的第五代EPYC数据中心处理器(代号“Turin”)将于今年下半年推出,最高支持192核心和384线程,同时具备更强的安全性能。
2023年初,AMD推出锐龙7040系列处理器,首次为X86平台引入独立NPU,开启AI PC时代。此后推出锐龙8040系列处理器,以及最新的锐龙AI 300系列。
作为AMD第三代AI PC处理器,锐龙AI 300系列提升幅度非常之大。这中间还包括全新Zen 5架构的CPU,升级RDNA 3.5架构的GPU,以及全新XDNA 2架构的NPU,与上代相比,AI解决能力提升三倍达到50TOPS,持续引领AI PC行业的创新。
对于AI PC,AMD的态度是无极限、不妥协。在AMD看来,完美的AI PC解决方案包括全生态的兼容能力;完整的PC平台要素;Copilot和第三方AI体验的完善;领先的性能;全天候续航。
此外,通过与领先OEM厂商的深入合作,不断推进各种PC端形态的创新,如轻薄本,游戏本,商务办公,移动工作站等多种场景需求。而在官方展示的针对上述场景的诸多测试中,均击败了英特尔酷睿Ultra 9和高通骁龙X Elite。
锐龙AI 300系列采用了升级到RDNA 3.5的集显,最高端型号Radeon 890M能够支持高画质游戏。在此前海外博主爆料中,Radeon 890M跑分超过RTX 2050。
对于AI PC而言,NPU越来越成为设备的核心,而XDNA之所以可以在一定程度上完成领先的算力,得益于微架构的创新。
AMD人工智能事业部高级副总裁VamsiBoppana介绍,AMD XDNA在设计上并没有采用传统多核处理器的架构,而是采用了灵活的计算和自适应存储调度的方式。
相较于上一代20个AI引擎Tiles,在XDNA 2上达到32个,可以在一定程度上完成2倍的计算量,同时带来1.6倍的片上存储,此外,AMD采用块状浮点Block-Floating-Point(BFP)的数据类型,在不损失准确性的情况下,大幅度的提高性能,对于高阶AI而言很重要。由此,XDNA 2可以在一定程度上完成5倍计算能力和2倍能效的提升。在FP16条件下,50TOPS的算力,使其成为能够支持下一代AI PC的全球最为领先的NPU。
清华大学物理系熊启华课题组合作在钙钛矿半导体微腔中实现室温光学自旋霍尔效应及自旋光子学器件