一、前言:制程工艺不变 IPC性能暴涨20%的Zen 5架构
这十年来AMD的CPU给我们带来了一次又一次的惊喜!
今天上市AI PC所搭载的锐龙AI 300系列处理器,与上代的锐龙8000系列移动处理器一样,都是采用了台积电4nm先进工艺。
但如标题所言,基于Zen 5架构的锐龙AI 9 HX 370是当今最优秀的移动处理器,甚至没有之一!
那么AMD是怎么做到的呢,Zen 5架构和锐龙AI 300系列处理器到底做了哪些技术上的革新呢?
1、更多的算术逻辑单元(ALU)
在拥有了足够强大且成熟的设计能力之后,AMD的工程师大幅度提升了Zen 5核心的流水线宽度,ROB重排序缓冲区(Reorder Buffer)从原来的320个条目指令提高到了448个条目指令,增加了40%。
更宽的流水线,让Zen 5核心可以容纳更多的算术逻辑单元(ALU)和地址生成单元(AGU)。
Zen 4架构每个整数运算器中包含了4个ALU和3个AGU,而Zen 5则分别提升到了6个和4个。特别是至关重要的ALU单元数量相比上代增加了50%,这也意味着Zen 5核心在相同周期内能处理更多的指令。
配套的调度器数量也大幅度增长!
Zen 4拥有3×24一体化ALU/AGU Scheduler和单独的1×24 ALU Scheduler,总计是96个。Zen 5则设计了88 ALU Scheduler和56 AGU Scheduler,理论上可提升50%的运算吞吐量。
2、更快的L1/L2缓存
Zen 5主要改进了一级数据缓存(L1 Date Cache),从Zen 4的8路32KB提升到了12路48KB。
同时,通往一级缓存、浮点单元的最大带宽,也比上代翻了一番,并改进了相应的数据预取。
二级缓存的容量没有变化,依旧是每核心1MB,但是链路通道从8路倍增到了16路。简单的说,就是L2带宽翻倍。
更快的L1/L2缓存能让Zen 5核心拥有更稳定的峰值性能。
3、更高效的同构大小核设计
酷睿第12代处理器开始采用大小核策略让Intel一时风头无两,大核玩游戏,小核提升多线程性能。
核心数量和多线程性能上的劣势让AMD略显被动,而代号为“Strix Point”的Ryzen AI 300系列处理器就是AMD首次采用混合核心设计的产品。
Strix Point SOC包含2个CCX,大核拥有4个高性能Zen 5核心,16MB三级缓存;小核则有8个紧凑型Zen 5c核心,8MB三级缓存。
不同于Intel P-Core + E-Core的大小核异构架设计,Zen 5和Zen 5c拥有完全相同的架构设计、IPC性能和ISA指令集,不同之处只是后者缓存更小、频率更低(但能效更高)。
另外需要注意的是,由于Zen 5和Zen 5c分别位于2个CCX之中,它们的三级缓存虽然理论上可以互相访问,但延迟会有所增加,同时传输速率也会受到IF总线带宽的限制。所以AMD采取了特殊的控制策略,通过Windows调度管理,尽可能地让Zen 5、Zen 5c分别访问自己的三级缓存。
4、1024个流处理器的RDNA 3.5 GPU
在内置集显领域,AMD一直没有对手!
锐龙AI 300系列处理器集成了升级版的RDNA 3.5架构的AMD Radeon 800M系列GPU,最多拥有1024个流处理器,足足提升了1/3。
除了增加流处理器数量之外,RDNA 3.5还增强了向量指令集架构(ISA),提高了插值和比较的速率,从而提升了图形渲染的效率。
内存管理方面,AMD对图形数据结构进行了优化,包括L2缓存和SoC(System on Chip)总线,以减少内存访问次数,提高数据压缩技术和工作负载的优化。
按照官方说法,在同样的15W功耗释放下,Radeon 800M系列对比前代的3DMark理论性能,在Night Raid和Time Spy项目中分别提升了多达19%、32%。
当然,理论性能并非与实际等同,新一代的GPU架构肯定需要驱动的持续优化才能发挥出最佳效能。
除了以上几点之外,Zen 5处理器的浮点性能也得到了增强,拥有了完整位宽的AVX 512指令集。
其实Zen 4架构也能支持AVX 512 浮点运算,但它是通过2个256-bit FPU合并运算来实现,而Zen 5则是拥有完整的512-bit FPU以及与其位宽匹配的流水线管道。
对于支持AVX 512指令集的程序,例如AIDA64 GPGPU、Geekbench 6、PS3模拟器等应用,Zen 5架构最多可以带来50%的性能提升!
此次我们收到的是华硕送测的灵耀16 Air,它搭载的是锐龙AI 9 HX 370处理器,拥有4个Zen 5和8个Zen 5c内核,共计12核心24线程,二级缓存12MB、三级缓存16MB+8MB、Zen 5核心加速频率可达5.1GHz,本机性能释放28~33W。
这一款厚度仅有1.1cm的高端超轻薄笔记本,下面我们来看在30W的功耗限制下,锐龙AI 9 HX 370能发挥出怎样的性能。
二、华硕灵耀16 Air图赏:赏心悦目的颜值 + 顶级OLED屏
华硕灵耀16 Air继承了灵耀家族一贯以来的当代艺术美学风格设计,同时在机身设计上比上代产品要更加轻薄。
A面有经典刻花标识,几何线条的全新大A LOGO,搭配了坚固楔形设计,磨砂表面工艺。
笔记本三围356×243×11.9mm,净重1.49kg。
B面有一块16英寸的OLED屏幕,采用四面窄边框设计。
分辨率2880*1800,10bit色深、对比度1000000:1、 支持100%的sRGB色域和100%的DCI-P3色域覆盖、刷新率120Hz、响应时间0.2ms,SDR模式下最高亮度400nit,10%小窗峰值亮度可达550nit(HDR模式下)。
ErgoSense人体工学背光键盘,支持三级背光调节+自动背光,而且非常静音,最多可以消除90%的输入噪音。
键盘上方设计打造出3500+CNC机工散热孔,可加强空气流动提升散热效率。
D面。
机身左侧有一个HDMI接口,2个40Gbps的雷电4接口,一个3.5mm耳麦合一接口。
机身右侧有一个标准SD卡槽、一个10Gbps的USB 3.2 Gen2接口。
65W的USB-C PD充电器,支持5V3A、9V3A、15V3A、20V3.25A输出规格,5-20V宽幅电压。笔记本还支持充电宝供电。
三、锐龙AI 9 HX 370性能测试:30W性能释放就能媲美90W的酷睿Ultra 7 155H
1、CPU-Z
2、CineBench R15
3、CineBench R20
4、CineBench R23
5、CineBench 2024多轮测试
6、POV-Ray
7、X264 FHD Benchmark
8、X265 FHD Benchmark
测试数据汇总如下:
和上代锐龙7 8840U相比,在相同的功耗下,锐龙AI 9 HX 370的单核性能强了21%,多核性能强了24.3%。
让人没想到的是,锐龙AI 9 HX 370仅仅只需要30W的功耗,性能表现就足以媲美90W的酷睿Ultra 7 155H。
从测试来看,锐龙AI 9 HX 370的单核性能比90W的酷睿Ultra 7 155H强了10%,多核性能也只有4%的差异。
四、Radeon 890M游戏性能对比:720P畅玩3A 期待后续驱动优化
1、3DMark
在3DMark Time Spy测试中,Radeon 890M的图形分数为3498,运行频率稳定在2328MHz,最高功耗33W。
从理论分数上看,Radeon 890M与Radeon 780M的成绩十分接近,下面我们来看看实际游戏表现。
2、GTA V
3、艾尔登法环
1080P分辨率下,帧率为44FPS。
720P分辨率则能跑到满帧60FPS。
4、孤岛惊魂5
1080P分辨率帧率为52FPS。
720P分辨率下,帧率为77FPS。
5、古墓丽影:暗影
720P分辨率下帧率为74FPS。
1080P分辨率下帧率为42FPS。
6、霍格沃茨之遗
1080P分辨率下,帧率为32FPS。
720P分辨下,帧率则有54FPS。
7、极限竞速:地平线5
1080P分辨率下,能流畅跑到66帧。
720P分辨率则达到了85FPS。
8、赛博朋克2077
1080P分辨率时,帧率是42FPS。
720P分辨率可以达到69FPS。
9、巫师3
1080P分辨率是49fps。
720P分辨率帧率是77FPS。
10、无主之地3
1080P分辨率下,帧率为34FPS。
720P分辨率能跑出52FPS。
11、最终幻想15
1080P分辨率总分3996。
720P分辨率分数为5994.
测试数据汇总如下
Radeon 890M在720p分辨率下的性能相比Radeon 780M平均只提升了3%,而在1080p分辨率下基本一致。
考虑到Radeon 890M只有28W功耗,而Radeon 780M是30W,如果功耗相同,Radeon 890M应该是更强一些的。
很显然,初版驱动还未完善也是一个重要因素!类似的情况我们在Radeon 780M刚推出的时候也遇到过,期待AMD后续的驱动更新能够进一步改善Radeon 890M的性能表现,毕竟这是一款拥有1024个流处理器的RDNA 3.5 GPU。
抛开AMD自己的上一代集显,与竞品相比的话,Radeon 890M在实际游戏中的性能表现则大幅领先,720P和1080P下分别领先30%和20%左右。
720P分辨率下开启高画质,灵耀16 Air全部10款游戏的测试中都超过了50FPS,其中有7款≥60FPS。
五、AI体验:24GB专用显存 AI算力7倍于GTX 1650 4GB独显
锐龙7040处理器首次集成了Ryzen AI引擎,锐龙8040系列在此基础上大幅提升性能,最高拥有39TFLOPS的AI算力。
锐龙AI 300系列升级到了全新的XDNA 2架构,也是AMD的新一代NPU,AI算力进一步提升到了50TFLOPS,超越了骁龙X Elite,是当今AI算力最强的NPU。
与Ryzen 7040系列相比,AMD XDNA 2架构提供了高达5倍的AI计算能力。
目前大部分AI应用都是使用GPU进行加速,且极度需求显存容量。对于有AI需求的用户,可以考虑给Radeon 890M手动分配更多的专用显存。
打开Adrenalin控制中心,依次点击性能、调整,然后在“Variable Graphics Memory”下拉菜单中选择“High”,保存后重启即可,这样就将默认的512MB显存增加到了16GB。
在下拉菜单中选择“Custom”,最多可以分配24GB专用显存。
1、Stable diffusion测试
我们使用的是Stable Diffusion绘世整合包,现在绘世启动器已经可以直接Radeom 890M进行硬件加速。
Radeom 890M的优势在于显存容量不受限制,我们直接在BIOS中设置了8GB显存,当然你如果你的内存足够,最多可以设置16GB显存。
下面我们来测试一下Radeom 890M 24GB与GTX 1650 4GB的AI计算力,A卡我们使用的是DirectML部署加速,N卡则是CUDA加速。
测试时使用Euler a采样器,分辨率512X512、迭代步数20、提示词引导系数7、总批次数5,单批数量1。
Radeom 890M 8GB用时2分55秒,显存占用也达到了9.7GB。
同样的参数,GTX 1650 4GB用时竟然长达17分钟31秒,算下来24GB显存的Radeon 890M的AI绘图算力将近是GTX 1650 4GB的7倍。
2、Gigapixel 7
Topaz Labs 的 Gigapixel AI 无需过多介绍,这是一款旗舰级AI图片缩放应用,它可以直接调用Radeon 890M的GPU进行AI加速运算。
我们将一张1440*1920分辨率的照片缩放6倍,看看会有什么样的效果。
在Radeon 890M加速下,整个AI缩放过程仅用掉了2秒。
放大大楼的塔尖可以看到,不论是画面细节、锐度还是分辨率,AI处理器过的画面都有肉眼可见的提升。
六、屏幕与磁盘性能测试:100%P3色域覆盖 色准Delta E值小于0.9
1、色域
100%的sRGB色域覆盖、94%的Adobe RGB色域、100%的P3色域与92%的NTSC色域。
2、SDR亮度
SDR模式下,这块屏幕最高亮度347nit,对比度为25810:1。
3、HDR亮度
10%小窗模式下,HDR亮度可达542nit。
4、色准
在色彩精准度方面,最高Delta E值是2.04,最低是0.23,平均Delta E值是0.84。
5、磁盘性能测试
灵耀16 Air搭配的是一款三星1TB PCIe 4.0 SSD,型号为MZVL81T0HELB。
在AS SSD Benchmark中,这1TB SSD的总分为5984。顺序读写超过3700MB/s、2800MB/s,4K随机读取62MB/s,随机写入208MB/s。
在CrystalDiskMark 64GB容量的测试中,顺序读写速度分别达到了5065MB/s和3633MB/s。
6、内存性能测试
灵耀16 Air板载双通道LPDDR5x 7500MHz内存,总容量32GB。
实测内存读取88382MB/s、写入102GB/s、复制82196MB/s,延迟119ns。内存读写性能比起Zen 4移动版要好很多。
七、烤机与续航测试:PCmark 10实测12小时续航
1、烤机
使用AIDA64 FPU进行烤机测试,锐龙AI 9 HX 370功耗一开始为31W,后面稳定在28W,核心温度86度。
其中P-Core烤机频率为2.65GHz,E-Core频率则是1.9GHz。
2、续航测试
灵耀16 Air内置了一块容量为78Wh的大容量锂电池,我们用PCMark 10来实际测试一下笔记本的续航能力。
测试选择的场景为PCMark 10的现代办公,测试时关闭所有其他进程,屏幕亮度调为50%。
灵耀16 Air在PCMark 10现代办公场景下的续航测试成绩达到了12小时28分钟,轻松支持一整天的移动办公需求。
八、总结:这才是高性能轻薄本该有的样子!
一句话评价灵耀16 Air笔记本:这才是轻薄本该有的样子!!
不知道从什么时候开始的,各家厂商的轻薄本竞相比拼性能释放。从最初的15W到25W、到35W、45W。更有甚者,某些厂商将标压处理器强行塞进轻薄本,然后将功耗解锁到65W…
而这一切将会被锐龙AI 300系列处理器终结!
锐龙AI 300之强,大大超出我们的想象!
在区区30W水平的性能释放下,锐龙AI 9 HX 370的多核性能就足以匹敌对手90W的酷睿Ultra 7 155H,单核性能都有10%的优势。
也就是说,酷睿处理器需要90W才能达到的性能,锐龙AI 9 HX 370只用30W就行了。因此,搭载了锐龙AI 300系列完全无需超高功耗,就能拥有媲美高端游戏本的处理器性能,笔记本能做得更轻、更薄、更加静音。
以下是本次测试小结:
1、Zen 5 IPC性能
和上代锐龙7 8840U相比,在相同的功耗下,锐龙AI 9 HX 370的单核性能强了21%,我们可以直接认为是Zen 5的IPC性能相比Zen 4,提升了21%。
同时,多核性能提升了24.3%,毕竟核心数从8个增加到12个,基本符合预期。
2、Radeon 890M游戏表现
28W的Radeon 890M与30W的Radeon 780M似乎并没有太大差别,不论是3DMark跑分还是实际游戏帧率,二者的表现都非常接近。
不过当初Radeon 780M首发测试时性能表现也不尽如人意,与Radeon 680M完全拉不开差距。但后来在新驱动的加持下,Radeon 780M性能暴涨,超越Radeon 680M将近30%。据此推断的话,未来Radeon 890M的游戏表现肯定也会随驱动优化而明显提升。
Radeon 890M毫无疑问已经是当今最强集显,毕竟流处理器数量比Radeon 780M多了1/3。希望AMD尽快优化驱动,让它发挥出应有的性能。
在现有的驱动下,720P分辨率下开启高画质,灵耀16 Air在全部10款游戏的测试中都超过了50FPS,7款超过了60FPS,实际游戏性能表现远超竞争对手。
同样是“高”画面设置,将分辨率提升到1080P之后,游戏的帧率也能稳定在40FPS左右。当然,如果你愿意适当降低画质,帧率还能更高。
3、续航
灵耀16 Air在PCMark 10 现代办公场景模式下实测续航时间高达12小时28分,锐龙AI 9 HX 370的续航表现一如既往的优秀!
最后再说说灵耀16 Air笔记本!
在锐龙AI 9 HX 370处理器的加持下,灵耀16 Air是目前为止性能最强的轻薄本。同时由于处理器极低的功耗,再加上笔记本本身优秀的散热设计,即便是长时间满负载运行,我们完全听不不到一丝丝噪音。市面上拥有同样性能的其他型号轻薄本,绝对不可能做到如此的静音!
灵耀16 Air还搭载了一块16英寸的OLED屏幕,支持400nit的SDR亮度和550nit的HDR亮度,实测它还拥有100%的P3色域以及媲美专业显示器的色准,这应该也是目前轻薄本能用到的最好的屏幕之一。
得益于与AMD坚固的战略合作伙伴关系,灵耀16 Air成为了市面上首款搭载锐龙AI 300系列处理器的笔记本,而且还会有一段时间的独占期。
购买链接:京东(12999元)
【本文结束】如需转载请务必注明出处:快科技
声明:如若本站内容侵犯了原著者的合法权益,请提供凭证,可联系我们进行处理,详见<免责声明>