近日,社交新闻站点 Reddit 用户 polaryon 在机器学习板块发起了一个讨论,展示了自己如何用 1200 美元打造一款家用型深度学习配置的全过程,其中英伟达 GPU GTX 1080 专用了一半的预算;在 CPU 方面,polaryon 有多个选择:英特尔的新一代 CPU Core i5 与旧一代 CPU Xeon 2670,并讨论了使用后者的优势与劣势。
我最近觉得是时候做一个能够运行深度学习模型的家用工作站。因此,我用不错的价格购买了 GTX 1080。在等待到货时,我一直在思考一个问题:什么样的 CPU 最符合我的需求。鉴于我还是学生,我尽力把预算控制在 1200 美元以内,其中一半预算已经花在了 GPU 上。
我阅读了大量资料(主要来自 Tim Dettmers 令人惊奇的博客),资料中说 CPU 对深度学习没有那么重要,但是我运行的其他代码,比如预处理、增强、分析等,仍然需要用到 CPU。我一直使用 Python,也大量使用 Numpy。我只考虑 Intel 的产品,因为英特尔的数学核心函数库(MKL)实在是太快了。我唯一看到的基准,比如 Ryzen,是这个(https://openbenchmarking.org/showdown/pts/numpy)。应该说我现在没有经历多线程,只是在学习。
我想了好多种方案。下面的方案包括一个新一代的标准 CPU,我认为它能很好地完成工作。但是,它不能扩展,最多只有 16 个 PCIe 通道。另一方面,我可以选择有 40 个 PCIe 通道的旧一代 Xeon,如下表所示。这些将在更旧的架构上运行,同时时钟频率也更低。但是,它们能够提供 8 核/16 线程,其价格是 4 核 Kaby lake i5 的一半。
我一直记得我也用一个不错的价格购买了 Xeon 2670 (Sandy Bridge) 和 GA-X79-UP4,整体价格比上面列出的组合更便宜。
优势:
对我来讲,这样一个系统有能力处理更大的工作负载。
更多的内存通道,更高速的宽带,我猜这很利于深度学习?由于你需要把信息快速迁移到 GPU?而不是一个专家。LGA2011 主板上有更多的内存空间和插槽。
40 个 PCIe 通道 LGA2011 主板允许我扩展到多 GPU 系统。
目前存在的劣势:
我很担心它已相当过时。LGA2011 主板似乎很难找到和替代。同样,没有任何保证。
在不远的将来(至少今年),我不会使用多 GPU 设置,因此 40 个 PCIe 通道很不错,但是我很可能会选择一个更新的处理器,并且价格优惠更多。
我不会使用两个 2670,这样电耗将非常高,我还需要省下钱来买一个更贵的主板。
更旧的主板,并不能拥抱未来的新事物,比如 M.2 SSD。
你觉得什么是能满足我的需求的更适宜的选择?欢迎可再降低成本的建议。