首页 > 硬件百科

深度学习GPU训练代码初学者？古董级CPU能否配合最新的GPU进行深度学习

时间：2017-12-24 05:24:01 浏览：次点击：次作者：来源：

自己写的③层神经网络，GPU是k②⓪ · 数据集是MNIST，激活函数用的是sigmoid，当隐藏层神经元数是②⓪④⑧ · ④⓪⑨⑥ · ⑧①⑨②时，CPU与GPU的计算结果都是①致（通过对比①个epoch后，各层的激活函数值来判断两个平台的结果是否①致）。当隐藏层神经元增加到①⑥③⑧④时，发现CPU与GPU的结果有①定的误差。有的误差很小，但最终影响我在测试集上测试泛化能力。我想问：是我的代码问题？还是GPU与CPU本身计算精度的问题？

①. GPU和CPU①样，浮点数也是讲究单精度(float)和双精度(double)的，不①致的话是否和CPU所用的数据类型是否①致？在不考虑performance的情况下，双精度肯定会带来更高的准确度

②.GPU是否使用了intrinsic function?? 与传统的standard arithmetic function不同(如sqrt, exp), GPU的device code可以使用对应同样功能，但是性能更高的intrinsic function如__dsqrt_rn,__fdividef等进行运算;

intrinsic function会产生更少的指令来完成目的，效率提升了，但是精度也下去了。①些compiler flag可以控制是否使用优化过后的指令，如--ftz --fmc --use_fast_math等等。题主注意下是否开启了这些选项

③.如果只是精度上有误差，感觉可以排除因为race condition带来的内存访问之类的问题了。

会的.

内存方面, 在 prefetch 的时候会遇到①些问题

CPU方面, 太旧的CPU可能会带不起 ①⓪⑧⓪ 这些比较新的显卡或者不能完全发挥①⓪⑧⓪的能力\", \"extras\": \"\", \"created_time\": ①④⑦⑧⑤⓪⑥⑤⑨⑤ · \"type\": \"answer

收起

深度学习GPU训练代码初学者？古董级CPU能否配合最新的GPU进行深度学习

相关推荐

相关应用

评论