x86反击战再继续,“蓝色巨人”推专为AI设计的POWER9(4)
2023-10-27 来源:旧番剧
几种技术的叠加,意味着Power 系统中的数据,无论是在CPU- GPU之间传输还是GPU-GPU之间传输效率都有大幅度效率提升。而传统的x86服务器,数据传输的提升受到PCI-E 3.0 I/O能力的限制,Intel也很难给你提供一套完整的特殊的超高速数据传输方案。
此外,Power是一款典型的SMP架构处理器。顾名思义,对称架构处理器之间是平等工作的,它们共享一块内存(RAM),而Power的深度学习系统更进一步,让CPU们和GPU们能够访问一块内存,而不再有x86系统中常见显存和内存的概念。这意味着系统可以处理一些原来GPU单独很难达到的高密度或者大规模的计算问题。以内存宽度为例,POWER8系统为200GB,但到了POWER9数据提升到306GB。当前,POWER9支持的内参密度还是1TB的容量,将来这一数据还可以更多。
换句话说,在核心数提升和运算力不够增加GPU的情况下,Power的系统运算力的增长要远远快于x86的服务器系统,而这对于云计算或者数据中心来说是一个巨大的优势,有效提高了数据中心的性能功耗比。
IBM当前最先进的Power System AC922做得更直接,直接将2个POWER CPU和6块Tesla GPU互联在一起,提供了一站式的解决方案,从常用的神经网络(AlexNet VGG等)训练结果来说,得益于数据传输速度的大幅提升。Power的神经网络训练时间大幅缩短。
目前每一个POWER9可支持24核CPU,AC922有32核、40核两个版本可选,同时可以支持最多6个NVIDIA Tesla V100的GPU,这是今天业界最高端的GPU。在一个2U的空间中,封装6个GPU,无疑是业内领先的能力,也是做AI平台最主要的能力所在。侯淼告诉36氪,这也正是美国能源部橡树岭国家实验室看重AC922的原因之一。