【点评】AMD锐龙4000系列测试&分析

【点评】AMD锐龙4000系列测试&分析

2020年1 月 7 日早晨六点,AMD 在 CES 2020 发布会上正式推出了 7nm 锐龙移动处理器。这是全新的4000系列,包含了U和H两种规格类别,面向不同散热设计的笔记本产品。

基于ZEN2架构开发的4000系列,注定它会跟上一代产品有着完全不同的表现,甚至可以说,它是一个里程碑,对当下的笔记本市场有着决定性的影响。

本篇文章会介绍一下这个系列的产品会有什么样的表现

PS:由于最近项目上有很多事情,测试的内容不够完全,后续或许会补上,请谅解


【0】前言

这两年ryzen架构的产品大放异彩,但这主要是集中在桌面CPU平台。笔记本的锐龙是从2500/2700U开始的,虽然相比之前的APU有很大进步,但跟同时代的intel对比还是有点力不从心,续航和性能上都有些欠缺。

标压H系列之前有文章介绍过,实质上,这是一个MKT的“标压”,本质是低压U提高TDP的换名

孤独凤凰战士:【点评】锐龙标压R7-3750H测试(小新Pro13)zhuanlan.zhihu.com图标

从之前的测试来看,3750H/3700U的核显性能还可以,跟icelake的1065G7(64EU)相近,但后者能耗比显著好于前者,并且前者的CPU性能不理想,单核效率较差。3750H也就能和低压U玩玩,跟游戏本标配的9300H/9750H没法比,所以当时的市场中AMD只能混低端,靠价格取胜。

估计AMD也知道这样不是个事,ZEN2架构得到消费者认可后,便马不停蹄的将移动版也设计了出来,这便是锐龙4000系列

说起来AMD确实很赶,去年6月份的时候也只是PPT,直到9月份后才真的有了样品,并且样品每一版都会有大幅的提升,一下子从“看起来还行”变成了“给力”

4000U系列参数

上图是低压U的所有规格(消费类),所有规格实际都是一种die,原生8核基础上阉割而来。AMD区分高低端一个显著的特征就是核显规格,最高配的4800U是8cu的Vega,4700U则是7cu,4600U和4500U都是6cu,最低配的4300U则是5cu。

从核心线程数来看的话,也是比较有阶梯性的。最高的4800U是8C/16T,4700U是8C/8T,4600U是6C/12T,4500U是6C/6T,最低的4300U而是4C/4T

似乎少了4C/8T的规格?

不,实际是有的,只是它给了商用类的锐龙pro系列

Ryzen7 PRO 4750U, 8C/16T, 其他规格和R7-4700U一样

Ryzen5 PRO 4650U, 6C/12T, 其他规格和R5-4500U一样

Ryzen3 PRO 4450U, 4C/8T, 其他规格和R3-4300U一样

换个角度,除了4600U/4800U,其他的CPU刚好和商用类是一一匹配的关系,只差了个超线程。

实际上,R7-4800U原本叫R9-4900U,而R5-4600U,直到CES,才突然“蹦出来”的

所以才会显得很乱,4600U和4700U让人觉得定位不够清晰


看完低压U,再看一下标压H的。标压的整出来两个类别,H和HS,看起来主要是TDP的差异。不过说实话之前一只都没有HS这个说法,民间传闻这是华硕定制的产品,目前没有得到AMD的官方承认,最近的文档更新出现了4900HS,看起来这个说法应该是假的。

如果将4600U去掉,4800U定位成R9,H和U系列的主要差别是超线程和TDP了,至少纸面参数是如此

刚才一直没有介绍频率差异,是因为AMD官方公布的频率,和实际运行的频率不符,接下来会介绍


【1】参数

我手上没有R3-4300U的机器,相关截图也就没有了。

先看U再看H,从高到低

1.R7-4800U

R7-4800U,Renoir-U架构,7nm制程,BGA封装不可更换。八核十六线程,L3缓存8MB。

R7-4800U默认频率1.8GHz,实际睿频最高4.3GHz(官方宣称4.2GHz),待机时为1.4GHz,热设计功耗15W

R7-4800U搭载的核显是Vega 7架构,8组CU共计512SP,默认频率1.75GHz。GPU-Z显示它运行在PCIe 4.0*16下,实际是没有识别,应该是IF总线


2.R7-4700U

R7-4700U,Renoir-U架构,7nm制程,BGA封装不可更换。八核八线程,L3缓存8MB。

R7-4700U默认频率2.0GHz,实际睿频最高4.2GHz(官方宣称4.1GHz),待机时为1.4GHz,热设计功耗15W

可以看到4700U相比于4800U主要是频率和超线程的差异,其他一致

R7-4700U搭载的核显是Vega 7架构,7组CU共计448SP,默认频率1.6GHz。



3.R5-4600U

R5-4600U,Renoir-U架构,7nm制程,BGA封装不可更换。六核十二线程,L3缓存8MB。虽然R5少了两个物理核心,但L3缓存没有缩减。

R5-4600U默认频率2.1GHz,实际睿频最高4.0GHz(官方宣称4.0GHz),待机时为1.4GHz,热设计功耗15W

R5-4600U搭载的核显是Vega 7架构,6组CU共计384SP,默认频率1.5GHz


4.R5-4500U

R5-4500U,Renoir-U架构,7nm制程,BGA封装不可更换。六核六线程,L3缓存8MB。

R5-4500U默认频率2.375GHz,实际睿频最高4.0GHz(官方宣称4.0GHz),待机时为1.4GHz,热设计功耗15W

R5-4500U和4600U的核显完全一样,没区别。

对比下来4500U和4600U真就只差超线程的差异了


5.R5-4600H

R5-4600H,Renoir-H架构,7nm制程,BGA封装不可更换。六核十二线程,L3缓存8MB。

R5-4600H默认频率3.0GHz,实际睿频最高4.0GHz(官方宣称4.0GHz),待机时为1.4GHz,热设计功耗45W

4600H的核显跟4500U/4600U也是完全一样的

对比下来4600H和4600U基本看不出差异点在哪,默频的差异是TDP决定的,而TDP是可调的,不算本质差异。


6.R7-4800H

R7-4800H,Renoir-H架构,7nm制程,BGA封装不可更换。八核十六线程,L3缓存8MB。

R7-4800H默认频率2.9GHz,实际睿频最高4.3GHz(官方宣称4.2GHz),待机时为1.4GHz,热设计功耗45W

R7-4800H的核显和4700U一样,阉割了一组cu。


7.R9-4900H

R9-4900H,Renoir-H架构,7nm制程,BGA封装不可更换。八核十六线程,L3缓存8MB。

R9-4900H默认频率3.3GHz,实际睿频最高4.45GHz(官方宣称4.4GHz),待机时为1.4GHz,热设计功耗45W

R9-4900H的核显和4800U一样,是完整版的8cu,频率1.75GHz。


汇总一下数据,跟当前的intel同步比较一下

除了R5的官方频率和实际频率一致外,其他的几个全都是实际大于宣称(4900HS最大频率是4.4GHz,表里没写),并且内存频率支持都很到位,标压H也可以搞4266的LPDDR4X

核显方面,AMD的规格配置碾压14nm的intel,跟10nm的icelake有竞争力,但是与上一代3750H相比反而缩水了。具体性能稍后会介绍。

上图是台式APU的参数,相比笔记本来说核显规格对应提了一档,频率大幅提升,CPU部分的话主要是最高频率有提升。


【2】一点科普

虽然上次讲R7-3750H有提到过,但这次还是得说一下,很重要,以后大家可以用hwinfo来check这些实际的参数,并利用民间工具改造自己的笔记本。

intel调节功耗频率的机制叫DPTF,广泛应用于所有笔记本中,AMD同样也有这个机制,只是它的名字叫DPTC(毕竟不是一家人)

intel的DPTF里有PL1/PL2/(PL3)/PL4的设定(min和max值),也有PsysPL1/PsysPL2的设定,还有Tau,这些都是规定CPU功耗和turbo状态的,除此以外还有场景判定条件(比如某个sensor触发,某个程序开启,dGPU启动等),这个解释起来很复杂,需要额外一篇科普来说,这里不写了。

AMD的DPTC类似,但是名字完全不同。

三个关键值,写功耗的:

  • FAST PPT Limit(简称fPPT), 相当于PL2的一阶段;
  • SLOW PPT Limit(简称sPPT),相当于PL2的二阶段;
  • Sustained Power Limit(简称STAPM),相当于PL1阶段,这个值通常会被厂商设定为TDP数值。

两个关键值,写时间的:

  • SLOW PPT TIME CONSTANT,描述FAST PPT Limit的存在时间
  • STAPM TIME CONSTANT,描述SLOW PPT Limit的存在时间

用一个完整的高负载过程来解释这些参数的作用:

  1. 开始Cinebench R20的多线程测试;
  2. CPU会先进入fPPT阶段,功耗上涨至fPPT设置值;
  3. 然后开始倒计时;
  4. 在sPPT time后进入sPPT阶段;
  5. 功耗降到sPPT设定值;
  6. 再等待STAPM time后进入STAPM阶段,功耗至此稳定。

这个完整阶段具体到某个机器上可能会有不同,有这些情况:

  • 达到fPPT的前提是频率没有到最高,像4500U这种低阶CPU,满载功耗都很难到40W,你设定45W是不会限制到的;
  • sPPT阶段存在时间,官方推荐值很大(275秒),所以大部分跑分可能撑不到STAPM阶段就搞定了,实际CPU跑出来的性能并非STAPM的设定值(通常也就是TDP)
  • 以上任意阶段触发温度墙,都会发生降频现象,轻则降低功耗,重则取消睿频,取决于厂商的策略


以上是玩家比较容易理解的设定值,某些发烧友还会基于DPTC机制开发了相关解锁工具,用户可以利用这些非官方工具来解锁限制,获取更高性能,比如下面这个

Ryzen Controller Team / Ryzen Controllergitlab.com图标

目前应该还没支持4000系列,不过等等估计就有了


除了这些参数,还有一些也会影响性能的项目,同样很关键,只是可能用户没办法解锁:

  • VRM Current Limit, 也叫TDC Limit,TDC=Thermal design current
  • VRM Max Current Limit,也叫EDC Limit,EDC=Electrical design current
  • Thermal Core/Gfx/SOC Limit,核心/核显/平台温度墙

第三个在intel平台也很常见,很多机器到94度不上去就是因为有这个

前两个电流墙是无法被感知的,如果设定很低,即便你的频率能跑满,性能也会莫名其妙的下来,但是这个设定跟你机器的供电设计是强相关,无脑解锁使用可能会导致主板烧毁等后果,需要慎重。


有一个好消息是,Hwinfo可以完美识别新一代锐龙4000的功耗等信息了,本章介绍的数值也能查询到,但是以百分比显示的,实际运行数值在上方,可以反推算出来。

(不过坏消息是,AMD的固件一直在更新,新版本的BIOS又不能让hwinfo识别完全了,只有功耗频率等比较基础的信息)


这里总结了DPTC里定义参数的取值范围,但这仅仅是参考值,实际使用工具设定的范围远比这个大得多

【3】测试前的性能探索

看过所有设计文档后,我觉得这一代的低压U和标压H本质上还是一个产品,只是固件不同而已(PI Code),通过一些设定,总能让低压U跑到标压H的水平。

在早期ES阶段,测试时发现,4800U的单线程分数比4800H还低

左为4800U,右为4800H

单线程测试功耗不高,排除散热影响,4800U当时是4.2GHz,4800H为4.0GHz,正常应该是前者要明显高,结果测试几遍后还是前者低,很不合逻辑。

用hwinfo抓个数据看看

一对比发现,温度功耗都是合理的,唯独那个GPU momery clock不正常。这项参数一般来说,是跟内存频率直接匹配的,4800H用的是3200内存,所以核显的momery clock就是1600MHz;而4800U我用的是LPDDR4X-4266的,核显的momery clock应该是2133MHz才对,为啥跑分时只有1200MHz,甚至会掉到1066MHz?

怀着疑惑的想法思考了半天,突然一位高人点醒了我——这个或许就是ZEN2架构的IF总线分频导致的

百度一下,这个问题还真的像是那么回事

不要盲目地推高频:寻找三代锐龙最佳内存频率 - 超能网www.expreview.com图标
AMD ZEN架构中,Infinity Fabric总线与内存频率绑定,通常是1:1关系(3200MHz内存实际运行频率为1600MHz,对应IF总线频率1600MHz)。
IF总线频率存在上限,Zen 2架构的内存控制器引入了IF总线与内存的分频机制。当内存频率超过3733MHz时,ZEN2架构的锐龙处理器就会自动切换到内存/IF总线2:1分频。
这样做的好处就是内存频率不会再受IF总线所限制,平台会获得更高的内存带宽,但是采用2:1分频会导致内存延时大幅增加。

废话不多说,直接改内存频率试一下

真的是这么一回事!

由于IF总线频率到1800MHz左右就是极限了,更高的内存频率导致IF总线必须分频,从而保证了CPU的稳定性,笔记本平台是在3600MHz进行了分频,而台式机则是3733MHz,稍有差别

分频前后,最显著的影响就是内存响应时间,3733/4266MHz下延迟有120ns以上,而3600MHz仅有105ns,差别十分显著,当然,LPDDR4X还是干不过DDR4的延迟,但总比分频后的效果好。

然后再测一下看看

这就对了,连着多线程性能也有了提升。


但是问题就这样结束了么?

错!

当你以为只是4266MHz的LPDDR4x存在分频的时候,AMD偷偷把量产版的分频贯穿到了全部的低压U系列,只要内存频率大于2666MHz,这个分频就会存在,惊不惊喜,意不意外?!

但是为了不让消费者感知到,在量产版CPU上,AMD开启了全新的操作!

先科普一下,IF总线频率全称为Infinity Fabric Clock (FCLK),之后统一用FCLK来称呼。

AMD将FCLK分成了多个运行频率(800-1333MHz),然后根据场景的需求自动变更频率,这样就彻底跟内存频率脱钩了,一直处于分频状态。

然而,标压H处理器仍然是1:1的运行状态(使用DDR4-3200),所以FCLK是可以保持1600MHz的,没有分频。

于是乎,量产版的低压U缓存测试都成了这样……

即便用了DDR4-3200,4800U也不能避免的增加了内存响应时间(83.4→95.8ns),内存带宽也明显差很多。

没办法了么?

不!我绝不会倒下!

去BIOS找一圈,还真的有!

新玩具 篇七:宏碁 传奇14 锐龙 R5-4500U CPU超频测试_值客原创_什么值得买post.smzdm.com图标

这篇文章前面讲解的路径就是改FCLK的关键


解锁的BIOS里,在AMD CBS目录下找到NBIO Common Options,进去后再选择XFR Enhancement,最后一张图里就已经能看到FCLK了。

从Auto改成1600MHz,重启后进系统,大功告成!

PS:我只测试了DDR4-3200的机器,对于LPDDR4X-4266的机器,不建议改成2133MHz,大概率黑屏,只能先降到3733或者3600MHz后改成1800或1866MHz使用,改内存频率在其他菜单里。

改完后,内存响应时间有了显著的改善,这个延迟比4800H都小了,很可以

跑个分,看看差异

不管是核显分数还是物理分数,4800U都有显著的提升。不过在R15/R20测试中,这个区别没有那么大,因为FCLK在auto时这个场景是识别为最高频率的,而3Dmark系列就不会,只能800或1066mhz。

鉴于这个显著影响性能,后续的测试都在强制FCLK=1600MHz下进行(实在是没那么多精力再全部重测一遍)


【4】CPU性能测试

前面铺垫那么久,终于可以展示数据了……

PS:图中的性能都是基于解锁功耗墙下测试的结果,但由于机器本身散热限制,会发生不同程度的降频情况,实际平均下来的功耗和频率都有注释,与第一章提到的频率作等比例换算可得到理论最大性能

先对比一下R15/R20的分数,新一代的锐龙4000可谓一骑绝尘,多线程成绩令人非常满意

  • R5-4500U多线程比i5-10300H还强
  • R5-4600U和R5-4600H性能基本没差
  • 锐龙4000在R20中单线程比R15好(相比于intel)
  • R7-4800H多线程远超i7-10875H
  • 同规格下,锐龙4000性能比intel强,功耗比intel低

看到巨大变化的同时,还需要注意以下的情况:

  • AMD单线程普遍低于同级别10代标压
  • R9-4900H相比R7-4800H提升微弱
  • 低压U带超线程型号的性能比不带超线程的要高很多


咱们再看看加上物理分数的表现

不得不承认,AMD在物理分数上确实赶不上intel,相比R15/R20都有不同程度的缩水,一来是因为锐龙4000的L3缓存较少,二来就是单核和多核没有区分频率导致单线程性能吃亏。

不过即便如此,R5-4600U仍然综合上跟10750H相当(UMA);而4800H即便没有独显的加持,性能上也跟9880H不相上下;4900H与10875H在都有独显的情况下平均值很接近,这是十分令人意外的。

以往AMD的CPU在游戏性能上都不理想,这次算是彻底翻身了,可喜可贺。


以上都是最大性能(极限散热)下获取的数据,用户可能更关心在限制TDP下的性能,这里也汇总了一个列表,可以参考一下:

PS:参考第二章的知识,将fPPT/sPPT/STAPM均设定为统一值,使得CPU的实际运行功耗完全等于标称的TDP,然后用Cinebench R15测试得到上图

可以看到,低压U确实有特殊优化(这里仍然是强制FCLK=1600MHz),在15W的功耗下明显好于标压H,但是随着功耗提升,这个差距越来越小,最后低压U因为散热瓶颈输给标压H。

横向来看,25/35W下的锐龙4000表现都很不错,相比intel真的是好了太多

这是i7-10710U和i7-9750H的数据,25W下连4500U都干不过,被完爆

这是各种4C/8T的intel集合,让icelake跑4GHz才能勉强追上4500U,但人家只需要35W……tigerlake-U很危险啊

总的来说,CPU方面,锐龙4000的性能不容置疑的,不管是极限性能还是能耗比都控制的很理想,笔记本就需要这种处理器。


这里提及一点比较关键的信息,锐龙4000系列是7nm制程,硅晶对于温度的变化十分敏感,不能简单地把功耗提升等同于频率提升/性能提升,实测中发现散热较差的机器,在同样频率下从60度涨到90度后,功耗可能会“凭空”多出来5-10W

也就是说,散热越差,“徒增功耗”越多,实际性能反而还可能不如功耗限下来温度低下来的情况


【5】核显性能测试

CPU方面很理想,是因为有ZEN2架构的加持,核显方面第一章有介绍过,规格上相比于上一代R7-3750H是缩水的,实际性能也会Yes么?

先看标压H的表现,虽然4600H仅有6组CU(384SP),但凭借更高的频率和内存带宽,使得性能上比原来10组CU的R7-3750H还高,同样也超过了icelake的最高配1065G7的核显,4800H超过了MX150,4900H超过了MX250,十分意外。

缩规格还能提升性能,这是为什么呢?

上一代R7-3750H,虽然规格频率都挺高的,但实际运行时,总会出现不明原因降频的情况:

Heaven Benchmark 4.0里,核显频率一致都只有1.15GHz左右,那么咱们看看4600H和4800H的情况:

核显频率一直处于满频状态(除了切换场景自己掉下来的),功耗分别为23和26W,而R7-3750H这个场景下也有26W了。

为了看清新锐龙的功耗,咱们再对比一个R7-3750H优势项目,3Dmark 11

上图是R7-3750H的状态参数,除了最后的结合测试,前面核显基本保持1.4GHz满频,功耗大概36-44W之间,物理分数测试能到45W

4600H和4800H和刚才的Heaven Benchmark一样,核显频率保持满频

4600H功耗在22-25W左右,物理测试36W,结合测试30W

4800H功耗在31-35W左右,物理测试57W,结合测试43W

4900H功耗在30-34W左右,物理测试56W,结合测试37W

可以看到这三个功耗相比3750H都有了一定的优化,跑分上4900H/4800H比3750H也高了不少,4600H稍弱于3750H,能耗比提升显著。


看得出这一代因为7nm和3200内存的双重加持,Vega7老架构的核显同样可以跑出来比较不错的水平,频率也不会莫名其妙的缩水了。


看完标压H,咱们再回头看低压U

低压U这边的成绩就不那么乐观了,4500U的性能显著低于4600H,4700U也不如4800H,4800U即便跟4900H一样,结果还是打不过4800H,只有4600U一枝独秀,跟4600H性能完全一致

这难道是又一个对低压U的负优化?

咱们再看一下状态曲线


先看除4600U外的情况

4500U功耗在17-20W左右,物理测试25W,结合测试23W

4700U功耗在18-23W左右,物理测试35W,结合测试27W

4800U功耗在21-26W左右,物理测试45W,结合测试30W

所有核显全程保持满频,这个功耗相比标压H少了很多,除此以外看不到什么特殊的问题,功耗低是因为被神秘原因限制了?

现在看看4600U的情况

4600U功耗在18-20W左右,物理测试37W,结合测试27W

跑图形测试的场景下,4600U和4500U并无本质差异(考虑到超线程的功耗增加),物理分数有差距是超线程的问题,所以跑分低并不是功耗上不去的原因。

那到底是发生了啥问题?

细心的读者应该能发现,缓存测试的时候,即便开了FCLK=1600MHz,4800U的内存性能也是显著弱于4800H的

内存响应时间是下来了,但是内存带宽只有4800H的81-84%,损失了将近20%的带宽。

众所周知,AMD核显对内存带宽是非常敏感的,单通道和双通道下性能是两个水平,这个20%带宽的差距自然也会体现在性能上。

那么,R5-4600U的带宽如何呢?

居然跟标压H的一样!难怪核显性能也是出奇的一致!

问题根源找到了,是内存带宽的差异,但是为什么只有R5-4600U会这样,其他低压U有什么特殊的地方么?

不带超线程?R7-4800U解释不过去

没开强制FCLK=1600MHz?确认过已经开了,不开比这个还差

我又看了一圈跑分时的状态参数,愣是没瞅出来差距,直到我把数据分享出去后,其他人来复制这个情况时才发现了问题……

R5-4600U并没有特殊的光环加成,根本原因是在内存本身的差异上。

这个时候又需要科普一些知识了……这里引用一下老狼写的科普文章:

老狼:DDR3 vs DDR4? 为什么说内存是个很傻的设备?DDR5在哪里?zhuanlan.zhihu.com图标
DDR4还有个巨大且很有意思的改变,也和效能有关。那就是Bank Group:
图片出自参考资料4
随着Bank Group还带来了两个新Timings:tCCD_S和tCCD_L。CCD代表“Column to Column Delay”。S是Short,L是Long。每个Group都可以单独工作,一次完整的8n prefetch不需要等待另一个group,所以是短的delay,也就是tCCD_S,一般是4。Group内部,每次都要等待一个更长的时间,也就是tCCD_L,tCCD_L随不同频率各不相同。
如果我们的数据十分凑巧,都分布在不同的group中,Bank Group会带来巨大的性能提升。最好情况下,2个bank groups和16n prefetch的提升一样,4个bank groups和32n prefetch一样。如果我们的数据刚好都在一个bank group中,频率又十分高,最坏情况,bank group不会带来任何好处。借助Bank interleave,我们的实际情况一般在最好和最坏之间。
DDR4借助核心频率的提升和bank group,性能提升不少。即使PC4-12800和PC3-12800相比,无论功耗和性能,都有不少提高。

bank group的数量会直接影响DDR4内存的效能,前面测试的4500U/4700U/4800U都是2组bank group的内存测出来的,而4600U则是4组bank group

那为啥这个会有4组bank group?

因为这个板载颗粒是DDP(Dual Die Package)内存,而其他的是SDP(Single Die Package)内存

这个DDP是Dual Die Package的缩写,简单理解就是双核心封装,其实就是双核。而这个双核应该是基于DIE的真双核,而不是基于chip的胶水双核。所以使用了DDP技术的颗粒应该在长宽尺寸不变的情况下,在芯片的厚度上有所增加,但是是基于die的堆叠,因此厚度也不会超过太多。

从其他地方找到的一个解释,使用这个技术是在当前的工艺无法满足更高密度时使用的,将两个颗粒装在一起,实现翻倍的单颗粒容量。由于DDR4内存有bank group,使用DDP工艺后也就翻倍了bank group,性能自然就会有提升。

现在读者应该理解为啥前面的显卡天梯图里标注SDP和DDP了吧?

那为啥都不用DDP内存呢,性能好那么多?

从DDP描述的工艺来看,这个显然是成本较高的,当内存厂商有能力直接做更高密度的颗粒时,肯定就会放弃DDP工艺,采用SDP工艺来降低成本。现阶段的DDP内存估计也会越来越少

为啥只有低压U会这样,标压U就没有这个情况?

其实这个是被带偏了,不是标压H这样,而是标压H配的是插槽内存,不是板载内存。

这是网上找到的三星内存颗粒规格,插槽内存用的一般是4组bank group的(x4 or x8颗粒),而板载是2组bank group的(x16颗粒/SDP),所以插槽内存不需要担心bank group数量。所以如果标压H用了板载(X16颗粒/SDP),结果也会跟低压U一样的。

但凡事总有例外,内存条是有X16颗粒的,板载也是有X8颗粒的。

单条4G的DDR4内存,一般就是x16颗粒的,比如上图所示的,按照JEDEC规范的命名(红框标注的部分),“1RX16”意思就是x16颗粒了。如果这里的标识为“1RX8”或者“2RX8”,那就是X8和X4颗粒了。

更多命名查阅请看:

DDR4 SDRAM SO-DIMM Design Specification 4wenku.baidu.com

板载机型中,最特殊的当属Macbook Pro了,其板载颗粒不是用的x16而是x8,主板需要16颗内存才能组成双通道(16*8bit=128bit),所以MBP要是用了AMD平台,也是不用担心SDP和DDP问题的。

不管插槽内存还是板载颗粒,两者直接差异不是SDP或者DDP,而是SDP和DDP带来的Bank Groups数量的差异,考虑到未来X16颗粒几乎都是SDP的(甚至插槽内存也会普及X16颗粒),之后以4BG和2BG来区别内存更合适。

BG=Bank Group

4BG(DDP)相比于2BG(SDP),带宽有20%的提升,跑分上来看4500U→4600U是9.3%,4700U→4800H是11.2%,也就是说换个内存可以提升约10%的核显性能

由于内存本身的差异,导致了低压U会有部分机器性能显著提升,使用插槽内存(目前slot基本是X8/X4也就是4BG)的机器突然有了天生的性能加成,真的太有意思了……

所以未来所有的AMD笔记本评测&测试,不标注2BG/4BG的,基本就没啥参考的意义了,没法横向对比,这也就是为啥要在天梯图里标注出来这个信息,很关键。(FCLK也是同样的道理)


好了,DDP内存讨论到底为止,现在才刚看完跑分,咱们接下来看看实际游戏中的表现

PS:L4D2是最高画质,巫师3为中画质,看门狗2为低画质

求生之路2中,锐龙4000系列全都打不过低功耗版MX150最接近的4900H也还是差了快8帧,这个游戏中基本上所有核显都不行,比较吃内存/显存带宽。

巫师3中,4500U用2BG内存都可以打过R7-3750H,换了4BG内存的4600U/H比低功耗版MX150还好一点。这个游戏主要吃GPU,不吃CPU和带宽,所以各种核显都比较理想。

看门狗2中,4BG内存的4600U/H跟低功耗版MX150一致,远高于3750H和1065G7,4800H更好一些但还是没到标准版的MX150水平。

4BG和2BG的性能比较中,求生之路2中带宽明显让vega核显瓶颈了,4800U甚至还不如4600U,而巫师3和看门狗2里4500U是89%的性能,4700U是87%的性能,缩水幅度也是很明显的。

如果都按照4BG内存的性能来看,锐龙4000系列性能提升显著,核显终于可以跟入门独显MX150LP打一打了,不再是只能跑分不能游戏的“假把式”。


功耗实在不想做那个图了,给你们汇总一个表吧……

可以看到,低压锐龙U的功耗控制的很不错,去年测过的R7-3750H和i7-1065G7在游戏中都有30W左右的发热,而4800U最高也不过32W。

标压H的功耗明显要高于低压U,应该是在游戏里没有刻意限制CPU的频率,这样会带来性能的提升,但从4600U和4600H的最终帧数来看,似乎并不是很值得。


【6】总结

上面的内容应该会劝退绝大部分用户,这里总结点关键信息,方便大家掌握:

1.锐龙4000的CPU多核性能不错,单线程落后于同时期的intel,物理分数/游戏会因为L3缓存而吃亏,但整体来看还是更好点;

2.核显性能上有大幅提升,R5基本可以媲美低功耗版MX150,可以玩一些游戏了;

3.低压U的FCLK被限制,CPU和核显性能损失约5%(相比于文中的测试结果);

4.板载/插槽内存要区分2BG和4BG,4BG(DDP)会让核显性能提升10%以上,插槽内存(x8/x4颗粒)和DDP(x16颗粒, 4BG)性能一致;

5.锐龙4000因7nm制程对温度很敏感,高温高功耗下的性能不一定比控制功耗温度变低的好,也就是“徒增功耗”;

6.锐龙4000能耗比控制的相当不错,极限性能的功耗也不算很夸张,相比同时期intel好很多;

7.购买建议:低压U首选R5-4600U,标压H看散热,好的可以买R7-4800H。

8.AMD, YES!


终于写完了,先开始我是没想到低压U会有这么多坑,各种奇怪限制把CPU和核显的性能搞的乱七八糟,再加上各家DPTC的差异性,未来的锐龙本一定会是千奇百怪,有可能会出现你买的4800U甚至不如人家4600U的情况,务必要做好购买前的准备工作。

题外话,第四条的情况最让我无语,目前各大品牌应该都是混用DDP(x16颗粒, 4BG)和SDP(x16颗粒, 2BG)内存的,这不就意味着用户买机器就跟买彩票一样去猜么?其他啥都不变,就只是板载的内存不一样,凭空就多出10%以上的性能,谁愿意接受买到SDP内存的机器?

还是插槽好,可惜轻薄本基本没这玩意了。4BG和2BG性能差异理论上在intel平台也会出现,可能一直没人注意……至于LPDDR4X,这个技术标准里没有Bank Group概念,只有8Banks,相当于2BG内存,就不用纠结了。


题外话2,文中的测试都是基于DDR4-3200下进行的,LPDDR4X-4266因为FCLK问题肯定会损失性能,但核显对延迟没那么敏感,显卡跑分和游戏帧数肯定还有一定幅度的提升,但可能不如LPDDR4X-3600/3733这个最佳的FCLK不分频临界点。

或许后续会有厂商出面解决低压U的FCLK分频问题,应该就能看到4800U最强的水平了。

全文到此结束,intel的文章我不想写了,没啥意思,看看大家的反馈。

编辑于 05-29

文章被以下专栏收录