x86反击战再继续,“蓝色巨人”推专为AI设计的POWER9(5)
2023-10-27 来源:旧番剧
三
Power主打高端服务器市场,对于这些客户来说,部署人工智能应用不仅会看重部署的速度以及未来的可拓展性。而这正是POWER9的两大优势。
根据IBM官方的数据,全新POWER9系统专为计算密集型人工智能工作负载而设计,可将深度学习框架的训练时效提高近四倍。
商业市场,唯快不破。研发人工智能的应用,模型训练环节至关重要。大量的数据投喂给机器,更快的处理速度才有可能更快的验证想法、做出模型。举例来说,如果在人工智能网络里选错了超参(Hyper-parameter),做了几天才发现,就需要重新设计算法和网络;而加速计算的过程,在几小时内发现这样的问题,就意味着拖慢的研发周期大幅缩短。
这在POWER8时代就已经被验证。根据深科技的报道,2017 年 8 月 IBM 使用自行开发的 POWER8服务器,配合 256 块 GPU,处理来自 ImageNet-22K 数据库的 750 万张图片时,不仅识别准确率高达 33.8%,高于微软2016 年创下的 29.8% 纪录,更将周期缩减到7小时,而一年之前微软则花费了10天。
除了硬件本身,IBM也在软件层面加速这一过程。以深度学习做人工智能的算法应用为例,IBM通过Hyper-parameter Search(超参挑选)这样的软件工具,帮助用户在GPU里进行分组,同时跑几组数据,从而得出最优的参数。
另一方面,今天很多人工智能的应用,已经不仅仅是跑在一台机器上,往往需要多台机器的配合。而这也是一直以来Power服务器的优势所在。
相比于采用NUMA结构的x86,采用SMP的Power架构可以保障内存在访问任意一枚CPU时速度是一致的,不会像x86一样,出现访问自己部分的内存速度飞快,但访问其他部门的内存就速度就会大幅缩减。因此,也不会像x86一样,很少做到4路以上。软件方面,今年12月初,IBM发布了名为Deep Learning Impact的软件工具,利用大数据的技术,可以把人工智能的框架水平扩展到多台机器上去跑。