首页 > 软件百科

手机GPU堆核的成本有多高？为什么样联发科就是不肯提高gpu

时间：2017-12-12 01:00:02 浏览：次点击：次作者：来源：

为何海思跟联发科坚持不堆核？海思麒麟跟联发科芯片坚持少核高频策略，舍不得堆核，是技术问题还是堆不起呢？

诚邀

GPU是什么？

　　事实上在笔者写过的科普文里面已经不是第①次提及GPU的基本概念了，这里为了内容的完整性就先简单重复①下。GPU即图形处理器（Graphics Processing Unit），就是显卡的核心处理单元，本质上是强调高性能高强度大规模多线程浮点运算的处理器单元。

　　具体来说，GPU就是基于硬件加速思想，专门为图形加速任务和类似原理的用途所构建的专用处理器，和作为通用处理平台的CPU有着本质的不同，无论是基本构造还是运行方式。其中比较重要的①点在于我们知道CPU的规模翻倍，也就是核心数翻倍并不①定会大幅提高性能，尤其是对于受强调的单线程毫无贡献，但GPU相反，以用户视角而言，同频同架构，规模翻倍就可以认为是性能翻倍。

　　MP、ALU与核心数的区别：

　　接下来我们就说说大家关心的核心数的问题。对于核心数我们更熟悉的还是CPU那边的定义，①个核心对应①个逻辑线程，而对于手机在内的移动平台而言，因为都基于ARM指令集，即便是有不少的自主架构，同期同档次的产品也是可以同台竞技，因为各自的核心之间并不会有太离谱的差异。

　　然而GPU则不同，因为各家厂商都拥有独立迭代的图形技术体系，这就意味着即便核心②字⑩分生动形象，其实也不能用从CPU那边借来的“核心数”概念来直接衡量，因为厂商完全可以自己定义核心，这样同代同档产品的核心数很可能就会有几个数量级的区别，完全失去了横行比较的意义。

　　目前为止，我们最常见的核心数所对应的概念是MP，出现在ARM Mali系列的GPU上，③星、海思、联发科等SOC厂商都是它的客户。具体而言，MP指的是“可独立运行和销售的基本规模”（实际是按照shader core的数量），对应的是ARM对外授权的销售需要，即依照GPU吃规模的特点，通过对shader核心进行有限数量的重复叠加，来满足客户们不同档次的需求，同时节省自家的研发和宣传成本。这样在同样核心的基础上，比如都是T⑧⑧⓪ · 粗略估算，T⑧⑧⓪MP④就是基本型T⑧⑧⓪MP①的④倍性能，而T⑧⑧⓪MP①②则是①②倍。

　　特别需要注意的是，由于Mali近些年的产品型号都以⓪结尾，这样也有另①种后面不接MP的简写，即T⑧⑧⓪MP④写作T⑧⑧④ · T⑧⑧⓪MP①②写作T⑧⑧①②。然而在某些地方比如①些OTT盒子的店家宣传上，这种写法被错误使用于虚假宣传，比如写成T⑧⑧④MP④实际④核但对外号称①⑥核，这种则需要各位冷静辨明。

　　此外，在Mali ④⓪⓪和④⑤⓪系列上，由于彼时是顶点和像素处理器分开而非现行的shader core统①渲染，①般只计算像素处理器的数量，或者将顶点和像素处理器分开计算。

　　而在另外①家大厂，即Imagination的PowerVR系列上也有类似的计算方式，但除了⑤XT系列，都是将核心数融入产品型号的第②位数，即PowerVR ⑥②③⓪ · GT⑦⑥⓪⓪等即分别是双核心和⑥核心。

　　至于高通则是另①种做法，由于它的Adreno系列GPU只供给自家的骁龙SOC，完全的自产自销就没有像前面两位那样按照基础规模分级的必要，故而高通①直不宣传核心数，外界只知道型号，给人①种只靠单核打天下的印象。当然了解GPU基本构造的人当然知道Adreno肯定是多核规模，只是计算起来仅能通过数ALU即算术逻辑单元的方式进行，比如目前当红的Adreno⑤③⓪就是②⑤⑥ALU。

　　那有没有直接计算ALU还宣传出来的厂商呢？当然有，就是以桌面GPU出名的厂商NVIDIA，自家Tegra④的⑦②核和TegraK①的①⑨②核宣传都是直接以ALU（CUDA）计数，看起来很吓人。当然必须强调的是，其实别家定义的①个核心内也会包含①定数量的ALU，直接比较数量根本无法对应GPU实际规模上的不同，自然也毫无意义。事实上横向判断性能高低最好还是通过图形跑分。

　　规模、频率和能耗比：

　　无论是核心数还是ALU，最终指向的还是GPU的规模。那么除此之外还有什么会影响GPU的性能呢？当然还有频率，这里任何类型的处理器定义都①样，是指驱动处理器运行的时钟脉冲信号在单位时间内发射的数量，通常①次脉冲对应①次完整的核心计算，因此也可以视为处理器的性能跟随频率线性增减。

　　举个例子，海思麒麟⑨⑤⓪的GPU是T⑧⑧⓪MP④@⑨⓪⓪MHz，而换算到满血Exynos ⑧⑧⑨⓪的MP①②规模，对等性能大约需要③⓪⓪MHz，即在①定范围内，少核高频可以做到和多核低频①样的性能，毕竟⑧⑧⑨⓪实际在⑥⑤⓪MHz，是K⑨⑤⓪的两倍有余。然而高频会带来①个问题，即能耗比的降低，随着频率的提升，功耗的增加要比性能快得多，而同样的性能下，少核高频的耗能也要明显高于多核低频。

　　为什么海思和联发科不受待见？

　　这就可以解答为什么③星处理器的声望要高于海思和联发科，正是因为在旗舰平台上，③星是秉承和高通①样的大规模低频率的策略，而海思和联发科则相反。少核高频带来了更大的功耗和发热，好处则是节省成本，毕竟只需要改时钟不需要花钱买额外的晶体管，显然这说明海思和联发科过于抠门，不如③星堆料良心。

　　此外无节制的高频还是①种恶性循环，因为带来的额外功耗造成发热，会使机体更早触碰到温控限制而导致降频，使处理器的性能下降，所以频率不是随意提升的，要看制程工艺具体的可承受情况而定。华为海思麒麟⑨⑥⓪和联发科Helio X②⓪系列的GPU性能被人诟病的缘由就是如此。

高通的Adreno系列核心因为骁龙芯片优异的市场表现而获得了最大的市场份额，但Adreno不对外开放授权，是高通自家的宝贝；

Imagination的PowerVR系列核心主要用于苹果的芯片，苹果在移动游戏领域的强势地位也让PowerVR得到了游戏厂商最好的优化；

ARM的Marli系列核心比较中庸，综合表现不突出，但因为是ARM自家的产品所以借捆绑销售策略也得到了不少订单。

联发科①直以来偏爱PowerVR系列GPU，是Imagination仅次于苹果的大客户。但是联发科并不像苹果那样是Imagination大股东，所以很难介入他家的产品研发过程。苹果可以专门定制市面上没有的⑧核心PowerVR GPU给A⑧X用，联发科就只能买现成的产品。

在过去，这种合作关系对联发科来说不是什么问题：中低端PowerVR GPU表现很不错，成本也不高，很适合联发科移动芯片的定位。但随着联发科企业定位的变化，尤其是其计划推出高端品牌与高通正面对抗后，继续买现成的GPU授权就不太合适了。

高通的GPU都是自主研发，可以在芯片开发初期就根据产品定位、竞争对手情况调整GPU部分的具体参数；苹果与Imagination的合作关系较深，也可以实现深度定制。联发科要做高端也需要这么①个深度合作伙伴，但它又不能抢苹果的老朋友，另①个选择ARM的图形技术也满足不了高端市场的需要，联发科的抉择还是比较艰难的。

最近刚刚宣布开放GPU技术授权的NVIDIA是①个不错的潜在合作伙伴。NVIDIA已经借Tegra X①的优异表现证明了自己的实力，Maxwell图形核心毫无疑问是移动领域最强。那么为什么联发科不找NVIDIA，却看上了连实际产品都没有的AMD呢？

①方面，AMD在出售移动图形部门后错失了大好的市场机会，眼睁睁看着高通、Imagination的GPU混的风生水起；现在AMD整体业绩低迷，重返火热的手机、平板GPU行业有助于提升收入，提振投资者信心。

另①方面，AMD为了抢夺蛋糕必然会给出很优惠的合作条件。NVIDIA的技术虽好，但是不太可能答应与联发科高级别合作的请求。AMD自己不做移动芯片，也不受苹果或高通控制，与联发科联合研制GPU不存在什么障碍，有利于后者的高端战略。

此外AMD毕竟在PC市场征战多年，技术底蕴没得说。其HSA技术体系还可以利用GPU的运算性能辅助CPU，加强芯片的整体处理能力。

现在手机和平板很多非游戏类应用都可以借GPU实现明显加速，诸如图像和视频编辑、③D地图、虚拟实景处理等等。Radeon在这些应用中的表现甚至强过NVIDIA 的Geforce。联发科不具备自研高性能CPU核心的能力，只能买ARM的Cortex系列CPU核心授权，无法靠CPU的表现与③星、高通等竞争对手拉开差距；如果能靠AMD的实力做出GPU部分很强的芯片，它就有了与高通高端芯片正面对决的底气。

反过来，联发科庞大的出货量也能帮助新手AMD在移动市场赢得口碑，得到企业与用户的认可。

收起

手机GPU堆核的成本有多高？为什么样联发科就是不肯提高gpu

相关推荐

相关应用

评论