在AI行业从业至今,写了大量的代码项目,在创作过程中遇到过很多问题,而做自媒体也有快两年了,同样踩了很多坑。
今天就从硬件这方面总结一下目前对设备的一些使用经验,主要也是谈谈之前自己在日常开发和创作中所面临的问题,以及这些问题是如何被【工作站】这一方案一招解决的。——先从大家最关心的日常开发使用这块讲起。
技术开发
在技术开发上,平时用的最多的开发环境是基于IntelliJ IDEA、Visual studio这两个平台,主要是进行代码的调试、编写等需求——当然底层都同样用的一套Anaconda。
最开始做开发的时候我还在读研,那个时候用自己几年前的老游戏本,无论是跑Matlab(研一的最优化课程作业)还是写C++小项目,速度都非常慢,包括但不限于repo编译、矩阵计算、Matlab渲染——尤其是渲染,本来软件就做的不太好,很多坑,但这还并不是主要问题——工作场景中的存储稳定性才是核心。之前的游戏本用来跑简单的深度学习demo不但非常慢,代码项目如果多开超过2个就会非常卡,甚至会出现闪退、崩溃问题(说到底还是穷~)。
那个时候太年轻,不知道实时灌日志的重要性,CMD崩溃导致几个小时的计算结果丢失真的十分令人痛苦,而从那以后即使到今天我也养成了每2分钟保存的习惯。
这几方面的问题是在毕业后将游戏本升级成工作站之后才彻底解决的(读书时就一直用的戴尔,毕业时才升级到了Precision工作站),并且这套方案一直延续至今。以今年刚升级的Precision 3660为例,相比自己办公用游戏本和打游戏的台式机,工作站的优势非常明显,在技术开发上有更好的体验,让AI的编程设计也更高效。
其实最主要还是计算设备上升了很多档,Precision 3660的两大算力核心都比较强,CPU和GPU都可选配。最高支持英特尔第12代酷睿i9-12900K处理器——之前我在一期视频里说过,12代酷睿基本属于牙膏挤爆了,12900K又是旗舰天花板。另外Intel针对这一代工作站不再用衍生Xeon W-1xxx系列的做法来支持ECC内存了,酷睿CPU+W680芯片组主板可支持ECC或非ECC内存,直接简单省事。而这次像PCIe 5.0和x4 PCIe 4.0 Lane都是直接连接CPU的。
此外,这次英特尔还将RST RAID对NVMe SSD的支持扩展到了CPU直连的通道,使其不再受限于PCH芯片组与CPU之间DMI 4.0连接的带宽——简答来说就是包括L3缓存在内的几个模块读的更快了。
在日常使用中,还有两点不得不提:
• CPU频率的优化设计让数据预处理、生成的操作更快(比如对很多半监督模型和DQN这样的强化学习很友好)并且可以和其他预处理过程并行
• 指令集执行的更快——有的开源库里会使用循环,特别是有顺序依赖的循环(点名numpy)所以有时候CPU拉跨会拖慢整体模型迭代速度
哦对了,这代Tower的CPU散热器还加入了液冷选项,虽然困于预算我没上,但据说效率赶上一些小型数据中心了,运行高能耗的算力程序时控温能力很强,超频跟喝水一样。
整体看下来这是日常使用的服务器里相对较高的规格了——和Xeon Gold系列相比,性价比算是很不错,毕竟租一台服务器只能以小时计费。当然,像很多矢量运算、矩阵运算,除了框架自身的设计,也依赖GPU的性能联动。考虑到这一点,工作站的GPU也基本开始一步到位,官方顶配直接就上了英伟达专业显卡RTX A6000 48G(8nm制程,没记错的话),学校里的新服务器不少也用的这套,提供PCIe 4/5扩展槽,加上Precision DO软件智能调优,跑CV据说非常丝滑,比V100有明显进步。一台3660就相当于一台专属的深度学习服务器,虽然听着略显夸张,但Precision真就做出来了——不过为了避免显卡爆炸,戴尔很谨慎的把电源功率最高升到了1000W(估计是友商的前车之鉴)
最后还有个重要区别——跟传统设备相比,3660这类中高端工作站的可扩展潜力更大。以AI行业为例,硬件更新换代很频繁,所以对显卡、内存的扩展非常必要。之前我那台游戏本可扩展性基本等于0,而Precision工作站则拥有很多扩展接口,比如:
• 3个工作站板载的M.2 NVMe SSD安装位,内存上升级方便、上限也高——NVMe SSD的单盘理论支持带宽是远大于PCIe Gen4的
• 大容量HDD存储——看起来是为了给大规模预训练模型或者AlphaFold这种需要海量数据集读取的模型准备的,扩展也比较方便
除此之外还有个前置插拔驱动器,这东西之前确实没见过,如下图:
说白了就是个硬盘/SSD扩展位,并且可以加锁。我看说明书上写的,这个位置可选3.5英寸、2.5英寸或者M.2 NVMe SSD,如果配NVMe时估计支持热插拔(前提不要是系统盘或RAID组成员)
举个例子你就懂了——当你抱着这台工作站到实验室,准备放在那跑实验,给师弟师妹炫耀一下不用抢计算资源的壕气,但是又怕隐私数据被看到,这时候就可以把实验结果保存在这个扩展位的卡上,当你离开主机时,可以采取“盘随人走”的方式来避免数据/隐私泄露。
当然,除了上面场景的专业性要求,日常使用中还有些别的方面Precision也比较符合我的口味,比如:工作室空间有限,3660的放置占用空间比台式机小很多,外观低调,设计感足,噪音也很少,而益于液冷和机箱设计,这台Precision在超频时也不会很吵。
最后,其实作为互联网技术和媒体从业者,我在很多方面都对电脑的软硬件性能有更高要求,一方面是为了让创作更加高效,另一方面对生产设备的性能追求也影响了我的科技观感,让很多思路也更加清晰。
未来随着Precision系列的不断迭代,会有更加高效、有趣的工作设备出现(比如基于VR、AR的高性能计算设备),让我们在未来的创作中更加具备效率和体验,也兼具娱乐,让成本越来越低、生产力越来越高。
让们拭目以待!
关键词: