amd 2023年初发布的锐龙7040系列(代号pheonix),是全球首款集成独立npu ai引擎的x86处理器,基于全新设计的xdna架构,算力约10tops(每秒10万亿次浮点运算),加上cpu、gpu整体算力约33tops,开创了ai pc的新时代。
2023年底的锐龙8040系列(代号hawk point),npu ai算力一举提升了60%,达到约16tops,整体算力也提升至39tops。
现在,strix point终于登场了,官方命名为“锐龙ai 300系列”,架构焕然一新,性能也再次飞跃,成为下一代ai pc的基石。
cpu是全新的zen5架构,gpu是升级版的rdna3.5架构,npu是全新的xdna2架构,号称“面向下代ai pc/copilot pc的世界一流处理器”。
锐龙ai 300系列首发只有两款型号,都定位高端市场。
其中,“锐龙ai 9 hx 370”是顶级旗舰,cpu部分拥有12核心24线程,多年来首次在这一定位上提供更多核心,相比锐龙8040系列增加了多达1/3。
二级缓存还是每核心1mb,总容量自然增加到12mb。
三级缓存终于打破了16mb的“禁锢”,增加了足足一半来到24mb。
最高主频5.1ghz,和现在倒是差不多。
gpu部分不但升级架构,cu单元数量也从12个增至16个,命名为“radeon 890m”。
npu部分算力来到了50tops,增加了2倍有余,问鼎最强npu的宝座。
“锐龙ai 9 365”也是高端型号,10核心20线程,二级缓存10mb,三级缓存仍为24mb,最高频率达5.0ghz。
npu算力还是50tops,gpu部分也还是radeon 890m。
说了这么多,大家也看到了,amd这一代移动处理器采用了全新的命名方式,不再是单纯的四位数字,而是将ai直接加入品牌名,地位之高前所未有。
9 hx、9都是代表产品级别,但注意这里的hx,和以往高端游戏本处理器用的hx(比如锐龙9 7945hx)不是一回事儿。
数字编号采用300系列,代表从npu单元的角度来看,这已经是第三代ai pc处理器。
以上是一二代xdna npu架构的对比图,可以看到整体布局基本一致,但规模大大扩充。
ai tile(初代叫aie tile)也就是核心的ai计算引擎模块,从之前的20个增加到32个,再加上本身的增强。
mem tile也就是本地内存模块,从原来的5个增加到8个,可以更好地配合更大规模的本地调度、运算。
另外,用于互连的交叉总线也从普通的data fabric,升级为zen/rdna家族上无处不在的infinity fabric,传输带宽和效率更高。
amd声称,xdna2 npu的计算能力提升了多达5倍,多任务并行能力翻了一番,能效也提升了最多2倍。
这里说的提升5倍,来自llama 2 70亿参数大模型的响应速度,从启动到获得第一个token,锐龙ai 9 hx 370达到了锐龙9 8940hs的多达5倍。
另外非常关键的一点,xdna2首发引入了全新的block fp16浮点精度,也就是bfloat16、bf16。它在cpu、gpu上已经很常见,而在npu上还是第一次。
传统的fp8浮点格式性能高而精度不足,fp16浮点格式精度高而性能略逊,而将二者融合起来的bf16可以在精度、性能上达到较好的平衡,灵活性也更高。
同时,大多数ai应用都采用了16位精度,因此有了bf16,不再需要量化为8位精度,减少了转换步骤,提高了执行效率。
高通骁龙x elite npu的算力为45tops,intel即将推出的下一代酷睿ultra lunar lake npu算力同样是45tops,锐龙ai 300系列则一举超越二者,成为当今最强npu。
至于苹果,m4 npu的算力只有区区38tops,还不到windows阵营这边copilot pc的最低算力需求门槛40tops。
随着算力的大幅提升,npu的应用也将不再局限于一些持续性低负载场景(比如视频会议),而是有了更多可能,一方面可以在更多场景中部分取代cpu、gpu,以更高的能效执行ai运算,大大提升笔记本的续航能力。
另一方面,更强力的npu配合更强力的cpu、gpu,可以在更多场景中部署端侧ai,进一步摆脱对云侧的依赖,最大好处就是可以避免隐私泄露和安全威胁。
当然,硬件算力再强,也需要生态应用的落地配合。
作为ai pc的先行者,amd 2024年内的isv合作厂商将超过150家,既有adobe、微软、topaz labs这样的世界级大厂,也有百川智能、钉钉、、无问芯穹、有道这样的国内名企,前途不可限量。
当然,新一代ai pc的最大亮点就是配合windows,可以打造全新的copilot 体验,比如历史回忆、视频会议实时录制与翻译、协同创作等。
最后是一些官方性能对比,供参考。
锐龙ai 9 hx 370对比骁龙x elite,日常办公、生产力创作、多任务、图形等各方面都遥遥领先,尤其是图形计算,骁龙在移动端无敌,但是在amd面前还是个弟弟。
对比intel目前最好的酷睿ultra 9 185h,无论是日常应用还是游戏,都已经不在一个级别上,就看下一代lunar lake的表现了。
苹果这边就更不够看了,尤其是多任务、3d图形性能,不在一个层次上。
锐龙ai 300系列的笔记本将从7月份起陆续上市,目前已有100多款设计,涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要oem品牌。
华硕会在台北电脑展上宣布一系列配备锐龙ai 300系列处理器的笔记本,其中轻薄本有16英寸的灵耀(zenbook s)、14/15/16英寸的无畏(vivobook s),创作本有16和13英寸的proart p16/x13,游戏本有16英寸的rog幻系列、14/16英寸的天选系列(tuf gaming a14/a16)。
微星首批三款,都是16寸大屏机型,包括面向高端商务办公的summit a16 ai ,轻薄全能游戏型的绝影a16 ai 、主打超薄商务与创作的尊爵a16 ai 。
芯片图赏: