阅读视图

发现新文章,点击刷新页面。

比Intel快2倍的传说,Mac用苹果处理器的一点想法

苹果 PowerPC 时代,我在上高中。那时有件事我印象很深刻。当时我们班有个很懂计算机的人,拿着一本计算机杂志,跟我安利 iMac G4,说你看这个电脑多好看啊,多牛逼啊,比 Windows 电脑不知道好看了多少倍。而且他还跟我强调说,你知道吗?这台电脑的 PowerPC 处理器比你们奔腾处理器快 2 倍。

我当时还是个高中生,根本不知道什么是 PowerPC,我当时就只知道 Intel 的奔腾处理器(还听说过 AMD),听他说完就觉得苹果好牛逼;而且他那么懂电脑,他说快 2 倍,那就应该是 2 倍吧。iMac G4 用的处理器是 IBM 的 PowerPC G4(具体应该是 PowerPC 7445 之类)…

iMac G4

苹果芯片的精准制导

其实“快 2 倍”这个说法,好像也是当年乔布斯在发布会上吹出来的(也可能是当年某本苹果杂志的编辑写出来的)。最早苹果在宣传广告中提到,PowerPC G3 比当时的奔腾 II 要快 2 倍;后续说 G4 比奔腾 III 快很多;G5 比奔腾 4 快很多。差不多就是这样。(我高中时期,时代一脚刚刚跨入到奔腾 4 等灯等灯)

当年乔布斯曾经公开对比过 Mac 和 Windows PC,对比的方式是双方自动执行一组 Photoshop 任务。当时 Mac 以快得多的速度完成工作,碾压奔腾处理器的 Windows PC……当年奔腾正在搞超长流水线,处理器主频不知道飞跃到哪里去了。PowerPC 那会儿走的线路更偏宽核心,频率是低很多的。苹果那一时期还做过一个叫“The Megahertz Myth”的宣传,主要就是教育公众,别迷信时钟频率。

Intel 奔腾 III 处理器

这事儿吧,其实有一定的道理。不过乔布斯的这次对比,PowerPC 的胜出,主要是因为 PowerPC G4 处理器配了个 AltiVec 加速单元,这是个 128bit 的矢量处理单元,可以单周期内执行 4 路单精度浮点数学运算(或者 16way 8bit/8way 16bit 之类),而且还是超标量设计,同时可以执行 2 个矢量操作。Photoshop 就能充分利用这个单元。AltiVec 效率比那会儿的 MMX 扩展指令要高。

就这个角度,也能一定程度解释,为什么现在的 iPad Pro 剪视频那么流畅,但桌面 PC 同等操作下却没那么快。这其实跟处理器设计的思路有很大关系。我觉得这么对比,并不存在什么公平不公平的问题。而且奔腾 4 当年在路子上的确出了比较大的问题。

只不过你不能就此得出一个结论说,PowerPC G4 就比奔腾 III/4 快多少。那现在,我们是不是也可以只对比一下充分利用 AVX512 的特定任务,来让 Intel 和 AMD 比比,后者会不会被 pia 出银河系吗?这是不合理的。

拿某些固定工作单元去比性能的意义,其实没那么大,尤其是对通用性很重要的 CPU 而言。这一例中,且不说究竟有多少程序代码能用上 AltiVec 单元(就像现在很多人质疑 AVX512,说用不到它);应该要比的还是日常消费用户比较频繁的操作,在效率上怎么样。苹果日常就非常善于呈现一些他想让你看到的数字,虽然没在说谎,但也未展示事物全貌。

MacBook Pro

我觉得,在 CPU 通用计算发展思路,该用的技术基本上都用过一遍以后(比如乱序执行、分支预测、超线程等近代技术),CPU 单线程性能推进本来就遇上了瓶颈。这时候是需要引入专用处理单元的,这也是一个常规思路——典型的像是在 GPU 领域,NVIDIA 为光线追踪引入了专用处理单元,这是提升性能和效率明显收益更高的方案。

苹果面向消费用户,或者目标群体时,一向都十分清楚自己需要针对硬件(或软件)做什么样的强化。所以事实上,苹果自己掌控处理器的设计,对目标群体的确是一件好事——就像它也掌控操作系统和软件一样。比如历史经验告诉我们,大量 Mac 用户用苹果电脑来剪片子,而 Final Cut Pro 在软件优化上的苹果平台加成,就是 Premiere 和 Davinci 都望尘莫及的,不管是视频编辑时的实时渲染、编码预览,还是输出速度。硬件层面为此若进一步做加成,还能再度提升效率。

iPad Pro 实现一些简单视频后期,效率明显比 x86 的 MacBook 更高,即是这一思路的集中体现。不过我也始终觉得,这种思路是有明确目标用户定位的。大部分人,并没有这些需求,如果我压根儿不用 Photoshop,那么像 AltiVec 这样的专用单元只能成为一种资源浪费。至于很多人,把这类思路解读为苹果在芯片设计上的黑科技,那也大可不必;毕竟 Intel 在服务人群的思路上和苹果是大相径庭的;就像高通也不可能面向 Android 阵营极为草率地,推出一颗性能与苹果 Ax SoC 相当的产品一样。

Arm 效率真的高过 x86 吗?

自从苹果宣布 Mac 要开始用 Apple Silicon,就一大堆媒体说了,看那个 iPad Pro 牛逼坏了——A12Z,一个功耗那么一点点的处理器,性能那么彪悍了,要是苹果给它提个主频、核心数,那岂不是立马把 Intel/AMD 之流轰出地球了吗?

有关这一点,早前的文章《MacBook 要采用 Arm 处理器,难度有多大?》我也用一个段落提到过,即 A12/A13 这些芯片的能效比,似乎还挺美好的。但实际上,如果苹果给这些芯片暴力提频,提到桌面处理器的程度,则其功耗和能效也会立马崩边——因为频率提升,越往后,给功耗带来的压力就会显著更大,而不是平缓变化的。当然我觉得这种描述略有些片面了。

我们还可以来看看 Cortex-X1 的设计——就是前不久 Arm 发布的一个微架构 IP。这个微架构被 Arm 设计出来的初衷,很大程度上就是面向高性能的。而且需要注意的是,它是以一定程度牺牲功耗和能效,来提升性能的——这跟 Cortex A78 的设计就很不一样。Cortex A78 是纯面向移动平台的那种传统核心,就是必须在 PPA 上做权衡,面积、性能、功耗都必须考虑在内,做到针对手机这类设备尽可能的最优解。

Arm Cortex-X1 与 Cortex-A78/A77 微架构性能对比。其实我也挺想说,CPU 层面增加一些扩展指令集的能力,包括上面这张图列出了机器学习性能提升,也表明:现在很多人认定,x86 CPU 增加 AVX512 这样的支持没有必要,是在浪费芯片尺寸和功耗(Linus Torvalds 为代表),而应该完全让专用处理器(比如 NPU、GPU)去处理这些事——这类想法可能是十分片面的

但 Cortex-X1 的指导思路就不是这样。Arm 给的一些数据是这样的:相比 A77 在相同频率下,X1 的峰值性能提升 30%。具体应用中,X1 的提升理论上还会更大,因为频率肯定比 A77 要高。不过 Arm 基本没提功耗和面积的事情。AnandTech 预计,X1 的核心大约会比 A78 大出 50%,包括 L1 L2 cache 部分;功耗估计也要多出这么多。

AnandTech 认为,在实际实施方案里,这个数字可能会更大,X1 的功耗可能会达到 A77/A78 的两倍;能效(energy efficiency)会比 A78 差大概 23% 左右。不过讲真的,这根本没什么大不了。Arm 现在大部队都期望去攻占 PC 平板市场,X1 也符合这种设定。

AnandTech(Andrei Frumusanu 博士)假想的一张图,可以表示 Cortex-X1 3GHz 5nm AT Projection(蓝色点状条)的能耗与绝对性能情况。这张图的左边柱状条表示的是 SPEC2006 测试全程消耗的能量(单位:焦耳),柱状条右边有两个数字,一个是平均功耗(单位:瓦特),另一个就是柱状条长度表示的能量(单位:焦耳)。右边柱状条则表示绝对性能,即跑分数字。

但这至少表明了 Arm 并没有什么黑科技,像很多人想象的那样,跟 Intel x86 比起来效率高到天上去——上面这些数据还是在台积电的 5nm 工艺不要出什么大纰漏的情况下;Arm 要做高性能,牺牲效率和功耗也是必须的,这事情真不像很多人想的那么简单,苹果做个高性能处理器就等比放大下 A 系列处理器就可以的。

之前我写 Mac 要用 Arm 处理器有多难的时候就提到过了,性能提升和功耗提升,这不是线性的关系。把 A12Z 提到 3GHz 频率,你看它功耗会崩到哪里去…

所以针对以上段落的总结是:苹果给 Mac 上自家芯片自然是好事——这里的“好”,体现在苹果收拢自家生态,Mac 迭代节奏也能完全掌握在自己手里;更重要的是,面向目标群体(比如做设计的、vlogger、搞摄影的等等)实现硬件层面更高效的支持,因为苹果可以更具针对性地去做硬件和芯片,Mac 设备的体验也因此可以更好。这也是苹果一直以来,对生态掌控力的固有经验——iPhone 即是这个思路下的产物。之所以等到现在,Mac 才使用 Apple Silicon,也是因为苹果现有的技术储备已经足够。

但这并不意味着,其芯片技术领先到了哪里去,更不表示 Arm 现如今在桌面市场比 x86 平台已经表现出了多大的技术优势。

番外:苹果需要做几颗处理器?

苹果用自家处理器,另一个我觉得挺现实的问题是,Mac 产品线有那么多不同的产品,比如 MacBook Air/Pro、iMac、Mac Pro 之类。如果要全线用自家芯片,那是不是要做一堆不同型号的处理器出来?

好吧,就算苹果能通过芯片体质的 binning 来自己划分个 A14-a,A14-b,A14-c 几个档位的 SoC 出来(比如针对较弱体质的就屏蔽掉两个核心之类的,或者用更低的频率,用在低端产品线上,那这样还节约了设计成本,桌面 CPU 本来也是这么搞的嘛)。问题是,Mac 一年的销量才多少(而且还要划分不同设备类型的不同芯片)?

Apple Silicon

之前的文章《摩尔定律失效,FPGA迎来黄金时代?》曾经提到,用尖端工艺去设计和制造芯片,所需耗费的成本不菲——这个成本并不是哪个行业都耗得起的,就算是汽车产品,其出货量也走不起最尖端工艺的量(汽车销量爆款能达到百万就很不错了)。iPhone 之所以能用自己的芯片,而且性能炸裂,一个很大的原因是 iPhone 的年销量非常高。所以苹果能走得起最先进制程工艺,比如现在的 7nm 制程。iPad 本质上是沾了 iPhone 的光,设计成本和制造成本都可以有效控制。

Mac 年销量才多少?开一个 5nm 的产线要多少钱?如果走不起量,就不可能用得起最先进的制程。去年 Mac 全产品线的销量是 1800 万台左右;iPhone 预期是在 1.9 亿部上下。这个就有 10 倍出货量差距。

如果给 Mac 重新设计高性能处理器,这里面的设计成本负担其实也非常高,尤其是配合每年的最先进制程——每年还要迭代,苹果又不是专门做芯片的,没有客户摊薄成本(这一点和 Intel、高通这些厂商就显著不同);生产成本已经说了,走不走得起这个量,我觉得有兴趣的同学可以算一下(苹果肯定也算过这笔账了,或者苹果有某种高端的解决方案,衰 O_o)。

当然苹果也可以不去刻意设计高性能处理器,比如跟 iPad 用一样的处理器,或者也就改个款,或者可能有什么黑科技,规模化放大设计(有了解芯片设计的朋友跟我说,有这样的可行性)…那我觉得这样的话,至少就现在来看,苹果的 A 系列芯片起码在通用性上,日常操作在 Intel 面前真没什么特别的效率、性能优势(虽然 Intel 现如今正在渡过自己非常难堪的一段时间)。

Mac Mini

另外,在 GPU 方面——看很多分析文章提到,未来苹果极有可能完全采用自家集成在 SoC 内部的 GPU,放弃 AMD 家的独立 GPU 设计——这一点从苹果现在的开发者文档能看出些端倪,AMD、NVIDIA 统统被苹果归到旧款 Mac 设备行列了,这也符合苹果一贯以来的尿性;毕竟苹果的 Metal API 也搞这么久了。如果是这样的话,Radeon GPU 还真是做了这么长时间的嫁衣——可见老黄不愿意支持苹果 Metal API 的决策是正确的…(逃

这篇文章谈的比较散了,真像 Intel 的软文——实际上,我的确不希望 Intel 在 PC 市场没落。

Surface Book 真的是高性能笔记本吗?

在笔记本或者超级本市场上,处理器有个概念叫“低压”,再转义一下也就是 TDP 功耗比较低的处理器。低压 CPU 一般是专为超级本设计的,它所专注的市场在低功耗、高能效比、长续航,以及不可避免的就是性能更差。

之前针对无风扇 Surface 的分析文章里,我大致提到了低压 CPU 的性能表现怎么样,其实很大程度受制于 PC 本身的散热设计[1]。“超级本”这个产品门类本来就十分考验 OEM 厂商的系统与散热设计能力,因为超级本必须很轻、很薄,这与散热系统越大越好是相悖的。所以在合理的空间内做到高效的散热(与科学的 CPU 频率调节),让 CPU 在更长时间内处在低温环境里,那么其持续性能就会明显更好。

在我之前的那篇文章里,我们还提到了 PL1/PL2 长时与短时睿频时间的问题。现在很多的酷睿 i7 低压超级本,在一个较短的时间里,都允许低压 CPU 将 TDP 功耗临时抬升到 45W/51W 这种水平。也就是在很短的时间里,这些低压超级本有一个变身为标压笔记本的机会——有时是半分钟不到,有时是几秒钟。那么至少在这几秒的时间内,低压 CPU 就成了标压 CPU,性能有了与标压 CPU 短时竞争的机会。

那么如果我们假定有这样一款超级本,散热设计逆天,而且我们还不用考虑功耗、续航的问题,那么当低压 CPU 的睿频时间无限久时,它是否就已经成为了一款标压 CPU 呢?或者说,如果把一颗低压 CPU 塞进一台散热设计十分出色、热设计功耗限制比较小的游戏本里,它是否可以当做一颗标压 CPU 来用?因为镇压其温度蹿升的散热系统已经完全可以承受住其睿频的发热了。

img
Surface Laptop 3

为什么 MacBook Pro 13 那么早就有雷电接口?

实际上,这个想法虽然有一些问题,但似乎还真是有一定的可操作性。当代比较知名的一个具体产品是微星 Prestige 15,这是一款采用十代酷睿低压处理器(Core i7-10710U,六核心)的笔记本,虽然配了 GTX 1650 Max-Q 这样的独显,但它从三围到可移动性,都不是一台高性能笔记本或者游戏本(好像对 Max-Q 来说算是废话)。

现在很多厂商都喜欢推某一类中间形态的产品,即轻薄性比不上真正的超级本,性能比不上游戏本或者移动工作站,但处在某种中间状态:即它仍有轻薄性可言,但也有性能可宣传(不过貌似很多同类产品多考虑采用标压移动 CPU)。Dell、Razer 之类都有类似的产品,价格其实也是比较高的。

Prestige 15 的特点就是心怀一颗低压 CPU,但其持续性能发挥和标压的酷睿 i7-9xxxH 系列差不多。这和这台笔记本的散热设计、调节机制之类是分不开的,让低压处理器在绝大部分任务场景中发挥出标压处理器的水平。

只不过当超级本十分轻薄时,这种条件是难以达成的,尤其是局促空间的散热和续航要求就不允许。而且除了上述差异外,至少我所见移动低压 CPU 与标压 CPU 还有两个很大的差别:

  1. 低压 CPU 更贵
  2. 低压 CPU 还阉割了一些 I/O 控制器

说得有逼格一些,I/O 属于 uncore 部分——Intel 针对低压 CPU 的 I/O 阉割似乎是一路推进的。uncore 的部分阉割,让 CPU 核心部分能够分得更多功耗资源,这对低压 CPU 这种资源原本就比较紧张的产品来说也是重要的。

img
Thunderbolt 接口

如果你有在关注 Intel 在低压处理器上的变化应该就知道,Intel 直到如今的第十代酷睿(Ice Lake)才加入了对 Thunderbolt 雷电的支持(同期还有支持 Wi-Fi 6)。估计对很多人来说,雷电接口根本就不重要(比如我),所以不会关注这种问题(甚至觉得 I/O 什么的,也不是很重要)。

不过其实我们仔细想一想,同样采用低压处理器的苹果 MacBook Pro 13′ 似乎从 2016 年开始就有雷电接口了,所以这是怎么做到的?

在当代已经不怎么说“北桥”和“南桥”的时候,有个叫 PCH(Platform Controller Hub)的东西就出现了——最早可以追溯到 2008 年。PCH 可以看做是南桥的“迭代”,很大一部分 I/O 功能是在 PCH 上面分配的。比如下面这张图,比较小的那一块 die 就是 PCH(现在应该不会以这种形态出现了)——这颗 PCH 芯片跟 CPU 是封装在一个基板上的,PCH 也可以独立放在主板上。

img
PCH 与 CPU

对当代低压 CPU 来说,PCH 是集成在整个封装上的(似乎是从 Haswell 开始的),而不是像标压 CPU 那样采用独立 PCH 的形式。PCH 这部分一般相较 CPU 本身,会采用差一代的制造工艺,比如十代 Ice Lake 酷睿 CPU 的 PCH 用的就是 14nm 工艺,而非主体部分的 10nm。

图1:2016 年末款 MacBook Pro 15′ 的 I/O 分配
img
图 2:2016 年末款 MacBook Pro 13′ 的 I/O 分配

上面这两张图是 2016 年末 15 寸与 13 寸版 MacBook Pro 在 PCH 与 I/O 上的分配。需要注意的是 15 寸的 MacBook Pro 使用的并非低压版 CPU(图 1),而 13 寸则为低压版 CPU(图 2,所以 13 寸的 MacBook Pro 其实一点也不 Pro)。不难发现,当时的第六代酷睿(Skylake)低压处理器自身连 PCIe 通道都没有,而 PCIe 控制器是挂在 PCH 上面的——当时的标压版 CPU 没有这方面的限制。

所以早期 MacBook Pro 13′ 的雷电接口是依托于 PCH 实现的。而且这其中还有两件事值得一提:对标压 CPU 而言,PCH 与 CPU 的连接采用 DMI x4,基本等同于 PCIe 3.0 x4——这真的只能算是个小水管,不过其实问题不算太大,因为标压 CPU 本身不需要依赖 PCH 就有可直连独立 GPU 的通道(当然还有内存控制器),还有额外的 PCIe 通道可支持雷电接口之类;PCH 则负责 SSD 存储、低速 USB、WiFi 等等。

但低压 CPU 这边的情况就相当捉襟见肘了(图 2)。低压 CPU 自身没有 PCIe 通道(也没有为独立 GPU 准备的通道)。如此一来,单纯依靠 PCH 来挂一大堆 I/O,包括雷电 3 这种带宽需求量大户(甚至可能是独立 GPU),再依赖一根小水管连接 CPU,那么带宽资源是可能出现争抢的问题的。

另外,低压 CPU 与 PCH 连接的 OPI 总线(On Package DMI interconnect Interface),根据不同的选择,有时仅有标压 CPU 的 DMI x4 的一半带宽(2 GT/s),就会让问题进一步恶化。这其实也是低压 CPU 在选择低功耗时付出的一部分代价。

如此便不难理解,MacBook Pro 13′ 虽有 4 个雷电接口,但其中有两个是半速接口,只占用 PCIe x2 lane,因为如果真的都用全速接口的话,加上 SSD 之类,更多 I/O 将没有带宽资源可用。(似乎有一些缓解技术出现,比如针对无线的 CNVi)

一款奇特的设备:Surface Book 2

这其中有个话题是值得探讨的,即 Intel 的低压 CPU 如今根本就不给独立 GPU 留通道。所以如果某台采用低压酷睿处理器的笔记本要用独立 GPU,那么这个 GPU 实则是挂在 PCH 下面的——或者说得再夸张点,是挂在南桥下面的(听起来有没有很惊悚)。

低压 PCH 到 CPU 的 OPI 总线带宽瓶颈,也就基本决定了低压超级本不大可能采用什么高级的独立 GPU。所以绝大部分在宣传上采用所谓“独立显卡”的超级本,也就配个 MX150/MX250 这种在我看来聊胜于无的 GPU,毕竟由于其性能本身也不怎么样,对带宽的需求自然就比较低。

img
Intel 十代酷睿低压处理器的 I/O
img
十代酷睿 PCH 的高速 I/O 通道设置

最新的 Ice Lake 十代酷睿的 PCH-U(495 系列芯片组),在 PCIe 的扩展上通道数是 16 个(全部 16 个高速 I/O 都可配为 PCIe,Comet Lake 好像也是这样)。相比之前的八代有了升级,似乎是一种更加灵活的搭配,比如现在 PCIe #1-#6 也皆可配置为 USB 3.2 [2] 。以前都是有 4 条固定配置给 USB 3.0 的。好在这次的低压 CPU 本身有一个 USB Type-C 形态支持的雷电 3,这也给 PCH 释放了压力。

Intel 官方介绍中说十代酷睿的 PCH-U 至多 16 条 PCIe lanes,也就是最多 6 个 PCIe 设备可接入,当然前提就是 USB、GbE 这些也都别用。SSD 要占掉其中 4 条 lane,不知是否有选择在十代酷睿上给独立 GPU 分配更多条 PCIe lane 的,理论上独显依然只能分得 4 条 lane(单个 PCI-e 设备最多好像也只能分配 4 条 lane,每 4 条就一个 PCIe 控制器)。

七代和八代酷睿的情况比这个还要捉襟见肘,可配置的 PCIe lane 一共就 12 条;如果还装配独立 GPU 的话,那么独立 GPU 理论上可能会和 SSD 争抢带宽资源——十代针对这个问题的改进应该也是没有的,因为 CPU 到 PCH-U 的连接小水管带宽依旧不变。当然,或许在具体的使用场景中,并不存在 PCH 挂载高速设备争抢带宽的问题,但起码 OPI 的带宽局限还在,所以无论如何都不可能采用什么高端独立 GPU 了——要知道 GeForce GTX 1080 用 PCIe x8 尚且略微有些悲伤了。

img
Surface Book

似乎在这么多超级本(或采用低压处理器的笔记本)中比较奇特的一款就是 Surface Book 了。众所周知的是,这款设备在 dock 部分可选配独立 GPU。Surface Book 在很多人的心目中,定位都是高性能移动工作站,但实际上即便是 15 寸 Surface Book,都仍在用 Intel 的低压处理器。

高配 15 寸 Surface Book 2 可选配的独立 GPU 是 GeForce GTX 1060(处理器是 Core i7-8650U)。无意外的是,这颗独立 GPU 也没有直连 CPU,而是挂在 PCH 下,占用通道 PCIe x4。这看起来还是个颇为奇葩的搭配方式,好像市面上还没有 OEM 厂商为低压处理器超级本选配这个规格的 GPU,毕竟 GTX 1060 是部分游戏本才会选择的独立 GPU。

只不过也的确没有听人说过它放在 Surface Book 2 身上存在什么带宽压力:似乎受制于 Surface Book 2 自身的功耗与温度限制,它身上的 1060 相比同样搭配 1060 的其他标压笔记本,游戏性能明显更糟糕[3]

NoteBookCheck 认为,原因应该在 Surface Book 2 自身的功耗限制上,但好像网上也有人将其归咎于带宽资源受限。

我觉得可以这样对比:13 寸 Surface Book 2 独显选配的是 GTX 1050(处理器和 15 寸一样);如果看 NoteBookCheck 的图形测试跑分的话,和同样选配 HQ 标压版的机型差不多[4];更重要的是实际游戏测试中,13 寸 Surface Book 2 也与其他选配 1050 的标压笔记本差不多。所以低压超级本选配 1050,大约在游戏上是没有受到带宽限制的。

不过很奇特的是,针对 15 寸 Surface Book 2,NoteBookCheck 竟然没测图形跑分成绩,而只是跑了跑游戏——并表示游戏水平和同 GPU 配置的其他机型有帧率上的差距。这就让人无法判断这种差距主要来自哪里。另外就是游戏大概还好,不知做 CUDA 计算数据量大时,情况会如何,估计 GTX 1060 就是低压 CPU 在选配独立 GPU 时的极限了吧。

另外就是,也正因如此,PCH 被占得如此之满,Surface Book 2 也就完全没可能再配 Thunderbolt 3 接口了。如此,你还会觉得 Surface Book 2 算得上移动工作站吗?

img
游戏本

玩游戏还是买个游戏本吧

本来还是想花点笔墨再说说 Intel 十代酷睿(Ice Lake)的 Iris Pro 核显提升,以及 AMD 不同体系下对于独显的支持,以及 AMD 独立 GPU 本身吃更多带宽的特性的(所以似乎并不存在 Intel 低压本选配 AMD GPU 的情况)。不过感觉有点太废话了,还有前面提到微星的 Max-Q 搭配也不多说了。

其实这一代核显的 G7 最高配,也就是 64 个 EU 的版本,图形跑分已经介于低功耗版和标准版 GeForce MX150 之间了,而且功耗表现也很优秀;但实际游戏测试就不难发现,没上 eDRAM 的带宽瓶颈,令 Ice Lake 在 GPU 和 CPU 同时跑的情况下,会发生主内存资源的争抢,令游戏画面有比较严重的掉帧,实际体验是比不上低功耗版 MX150 的。(推荐各位去看这篇文章:intel 10代酷睿移动版性能测试(四)—— IceLake-U 显卡篇[5]

近期我在家用 Surface Laptop 3(Core i5-1035G7)玩《伊苏 8》这种甜点级别的游戏,大致上也有这种体验,中等画质下的流畅度表现是非常好的,不过一旦 CPU 同时要干点儿什么活,游戏的掉帧问题就会非常严重——等 CPU 干完活儿,帧率立刻又回来。这是个挺诡异的事情。

不过 Ice Lake 这代 CPU 的核显部分提升的确相比八代有了不小的提升,用来玩玩这种对性能要求不高的游戏也非常怡然自得。在这种情况下,类似 MX150 这种在宣传上还比较好听的独显,就显得没那么必要,即便它依然在实际性能表现上优于 Ice Lake 的核显。(MX350 似乎有不错的提升)

总体我想说的是,若选择超级本,大部分情况下就别想着玩什么高级游戏了,尤其是低压 CPU 还对高端显卡存在诸多限制。虽然这话说起来跟屁话似的。另外一点是,低压 CPU 即便在优秀的系统设计中可以达成标压 CPU 的性能水准,它依然存在很大的限制,独立 GPU 即是其中一部分。

最后补充一点,Ryzen 4000 Mobile 对 Intel 十代酷睿的屠杀估计很快就要开始了,如果你不是个技术爱好者的话,就导购的角度来说,现在也绝对不是购买笔记本的好时机。几天前,Intel 的首席财务官 George Davis 在摩根士丹利的会议上已经明确表示,自家 10nm 时代,再也没有当年 14nm、22nm 时期对竞争对手的优势了,而且是“not reach process parity with competitors until it produces the 7nm node at the tail end of 2021”,并且要到 5nm 节点上才能找回制造工艺的优势[6]。对这一点我还是不怀疑的,不过究竟是什么时间呢?

详情还可参见:PC处理器市场在变天:Intel的王者宝座还能坐多久?

参考来源

[1]聊聊无风扇的Surface Pro:性能比一般笔记本差多少?- WEB VIEW

[2]Intel® 495 Series Chipset Family On-Package PCH Datasheet Vol. 1 – Intel

[3]Microsoft Surface Book 2 15 (i7, GTX 1060) Laptop Review – NoteBookCheck

[4]Microsoft Surface Book 2 (13.5″, i7, GTX 1050) Convertible Review – NoteBookCheck

[5]intel 10代酷睿移动版性能测试(四) —— IceLake-U 显卡篇 – 孤独凤凰战士的小屋

[6]Intel Says Process Tech to Lag Competitors Until Late 2021, Will Regain Lead with 5nm – tom’s HARDWARE

❌