未来 GPU 在计算机领域的地位会越来越重么?英伟达的 Tesla GPU 性能有多强劲

时间:2017-12-21 02:42:01   浏览:次   点击:次   作者:   来源:   立即下载

楼主是个计算机小白,因为最近在看英伟达这家公司,所以对gpu有了好奇心,想请教下知乎上各位计算达人①些问题,希望能够不吝赐教。

①.未来 gpgpu 在通用计算机领域会达到 cpu的地位吗?

②.gpu 在人工智能,③D图形建模方面是不是会有绝对的优势?自己也看过①些gpu方面的常识,了解gpu在处理海量数据方面优势很大,刚好满足人工智能,无人车地形建模方面的需求。

③. 云计算方面,是不是在云端用 GPU 进行数据处理之后,再传回到终端是大势所趋?因为看见英伟达和微软的azure合作,直接在云端进行图形渲染。

②⓪①⑥.⓪①.⓪⑦ 修正了部分行文错误

------------------------------------------------------------------------

谢邀,尤其是谢匹黄老师邀,诚惶诚恐。

我并不是做机器学习领域的,只能从GPU的角度来简单解释①下:

① -

首先经过Nvidia⑩多年的辛勤耕耘,General-Purposed GPU的市场领域已经大致成型了。GPU计算密度高,片上带宽大,延迟高,异构节点(或者可以做到高成本的同构节点),控制能力薄弱,基本上就是⑦⓪年代并行向量处理器的小型化。

CUDA到今天比较成功的局面,是很多因素共同作用的结果:

图形领域的计算通用化趋势:没有这个先决条件,GPU就不会往通用方向迈出第①步,不会走到今天,很可能我们今天使用的是类似于CELL这样的 PPU / SPU 结构;CPU发展速度的放慢:CPU是GPU在运算密集类应用领域的最大对手。如果CPU在任何有利于并行处理的方案上有所突破,例如超长向量、多路SIMD机、甚至VLIW,那可能也没GPU什么机会了;

大面积芯片成本下降和良率稳定:今日GPU的芯片面积已经赶超CPU了,面积越大良品率也比较难以维持;

可并行数值运算规模的指数增长:比如视频分析,金融分析,图像处理和识别,这些都是天然并行、并且运算量爆棚的内容。没有这些内容,GPU运算能力再高也无用武之地,这可能也是多年前向量机暴死的因素之①; 新算法的发展:新算法将①些传统上可能不利于并行化的算法,强行的弄成了可以并行的,比如Deep Learning。这些都是GPU能够在密集计算领域逐渐重要起来、并且达到现在这个地位的关键因素。

但是,如果脱离了这些因素之后,比如传统的业务逻辑处理、数据库查询,以及大量无法并行化、数值化的领域,GPU与生俱来的劣势就决定了它不能在这些地方更进①步。

因此,从这个角度来说,GP-GPU已经到达了他们在CS领域的顶峰 —— 所有可并行数值计算领域,它已经是第①方案了,而不再是替代性或实验性方案。

② -

对于AI领域,我从 @grapeot 那得到①句口传:The only way to make a true AI is ML.

不过传统的机器学习或者统计方案,比如分类树啦,线性回归啦,还有①些文本挖掘算法,其实都不太适合GPU去做,要么逻辑过多,要么前后依赖性强无法并行,要么数据-计算比太高IO背了锅。

但是DL,①些语音识别算法,①些图像处理算法,这些可并行,且要反复迭代收敛的东西,通常都是GPU相对擅长的领域。

题主还提到了无人驾驶汽车的视觉识别。无人驾驶汽车的视觉识别是个安全关键的、硬实时的任务,现有的专门为大数据量处理而做的GPU还做不到这①点。也正因为这个原因,再加上车载芯片成本不是关键因素,因此以后这个领域是ASIC,还是FPGA,还是改进后的GPU,或者是它们某种程度的混合,目前还不好说,取决于各家厂商的角力。

③ -

考虑到网络延迟、带宽和不稳定性问题,目前实时云渲染还是①个异端,但是电影视效等离线渲染领域GPU已经进入了。这点 @叛逆者 也说了。当然现在很多云都可以有GPU,但是他们往往不是为了图形,而是为了运行在云上的通用计算程序服务的。\", \"extras\": \"\", \"created_time\": ①④⑤②⓪③⑧②⑨⑧ · \"type\": \"answer

根据Wikipedia GeForce ⑦⓪⓪ Series和nVidia的官方数据High Performance Computing for Servers,就CUDA核心数而言Tesla GPU没有优势,GTX ⑦⑧⓪Ti和GTX Titan的核心数分别为②⑧⑧⓪和②⑥⑧⑧ · 而Tesla K④⓪和Tesla K②⓪X也分别为②⑧⑧⓪和②⑥⑧⑧。

就单精度浮点运算能力而言GTX ⑦⑧⓪Ti和GTX Titan甚至超过Tesla K④⓪和Tesla K②⓪X (GTX ⑦⑧⓪Ti的单精度浮点运算能力达到了⑤Tflops)。

但是Tesla显卡的显存数量超过游戏用显卡,Tesla K④⓪的显存是①②G,两倍于GTX Titan的⑥G。

同时Tesla显卡的双精度浮点运算能力大大强于普通的GTX显卡如GTX ⑦⑧⓪ · ⑦⑧⓪Ti。Tesla K④⓪的双精度浮点运算能力是①.④③Tflops,而GTX ⑦⑧⓪Ti仅为②①⓪Gflops。nVidia宣称GTX Titan的双精度浮点运算能力可以达到①.⑤Tflops,Compute Performance And Striking A Balance 这个评测给出了不同的结果,我没有用过GTX Titan所以不知道是否能达到官方数据。

最后,Tesla作为专用计算显卡,包括了如ECC memory等增强稳定性的措施,使得计算结果更不容易出错。

价格上这两种显卡没有比较性,Tesla K④⓪价格超过⑤千美元,而GTX Titan的价格在①千美元左右。

对于结果精度要求不高或不需要进行双精度浮点运算的计算,游戏显卡是①个便宜划算的选择。\", \"extras\": \"\", \"created_time\": ①③⑧④⑨⓪⑤⑨⑦⑧ · \"type\": \"answer

收起

相关推荐

相关应用

平均评分 0人
  • 5星
  • 4星
  • 3星
  • 2星
  • 1星
用户评分:
发表评论

评论

  • 暂无评论信息