正在升级Microsoft的Azure云,以加快整体数据中心性能和特定计算工作负载。
添加到平台的大量新服务器将配备现场可编程门阵列(FPGA)--一种芯片,其核心逻辑可以使用软件进行重新配置。
FPGA的灵活特性使他们能够比在CPU上运行的软件更快速地定制处理特定的计算任务,这就是服务器传统处理的工作负载的方式。随着新方法被识别为加速任务或新任务被识别,这些任务或新任务能够被加速,因此FPGA的可延展特性允许它们被重新配置。
尽管微软自2010年以来就尝试在其数据中心使用FPGAs作为Catapult项目的一部分,但这些新的Azure和Bing生产服务器中的FPGAs通过一种快速网络体系结构连接在一起,微软称之为Configurable Cloud,有效地创建了一个可按需使用的几十万FPGA池。
"数据中心中的每个FPGA可以以少量微秒到达每一个(以数百数千的比例),而没有任何中间软件,"根据微软项目弹射器研究人员发布的一份新文件。
据研究人员称,微软已经使用该FPGA池加速Bing搜索,以加快网络加速,并且将来也可以部署用于帮助大规模的机器学习和生物信息学。
在测试中,使用此池的可配置云FPGA的服务器能够更快地解决Bing查询,并且在高需求的时间中更不易陷入停顿。
微软早期使用FPGA的实验使用了不同的网络体系结构,它只允许最多48个FPGA直接通信,限制了可用的、共享的FPGA处理能力。
Microsoft的新可配置云体系结构不仅使平台能够提供大量的FPGA池,可以根据需要进行挖掘,而且还允许将FPGA应用于新任务。
在这种新架构中,FPGA与数据中心网络紧密耦合,从而允许加速与数据中心基础架构相关的任务。
为此,微软一直在尝试使用Azure的可配置云FPGA层来加速数据通过其网络的速度,通过高速传输数据。
微软表示,其生产数据中心中的大多数新服务器进入超过15个国家,五大洲正在使用可配置的云架构与FPGA进行安装。
在每台服务器的内部,Microsoft在自己的主板上使用IntelAlteraStratixVD5FPGA,配备4GB的DDR3-1600RAM。CPU和FPGA可以通过PCIExpressGen3总线在每个方向以16Gbps通信。每个主板使用两个独立的40Gb以太网接口连接到可配置的云网络中,这些接口分别连接到服务器的网络接口卡(NIC)和机架(ToR)交换机的顶部。
因为FPGA板位于服务器和流向网络和来自网络的数据之间,所以它可以在其进出服务器时对其上的数据进行操作。
该方法允许FPGA作为加速器,用于本地计算任务,并在其通过网络时处理在传输中的数据。
"我们展示了一种用于FPGA间通信的可靠通信协议,其实现与现有技术相当的延迟,同时扩展到几十万节点,"...........
微软不是唯一的技术巨头,除了CPU之外,还可以加快数据中心的速度。谷歌正在使用它自己的专用集成电路,它调用一个张量处理单元,以支持它的机器学习努力。
英特尔正在使用内置FPGA和包括戴尔EMC、Google和IBM在内的众多技术巨头构建至强CPU,本周宣布计划在CPU和FPGA之间建立新的、更快的接口构建服务器。
硬件加速器(如FPGA、GPU和ASIC)的使用增加的原因各不相同,但部分原因是,由于构建越来越快的CPU的难度增加,需要寻找新的方法来提高数据中心性能。
DevOps、虚拟化、混合云、存储和运营效率只是我们将要强调的一些数据中心主题。星期一及星期三交付