你知道吗:谷歌AI让数据中心PUE降低15%?
作者: 侯角
责任编辑: 阚智
来源: CBINews
时间: 2016-07-21 12:06
如果知道将要发生什么,那么,你对应采取的措施将最奏效。知己知彼百战百胜。这就是谷歌数据中心节能的AI思路。

谷歌数据中心冷却系统
以同样的思路,谷歌DeepMind阿狗曾于今年3月份人机大战,完胜李世石。虽然19X19的围棋走势不可通过计算机暴力计算穷尽,但阿狗仍然基于预测及取舍这两个网络战略,猜透了李世石。
谷歌DeepMind于2014年开始涉足数据中心节能优化,利用机器学习寻求更高效运作数据中心的解决之道。由于数据中心能耗大户之一是冷却,即通过冷却拿走计算机系统运行所产生热量,保证系统连续正常运行。所以谷歌DeepMind数据中心节能目前聚焦在冷却系统部分
在过去的几个月里,DeepMind研究人员开始与谷歌的数据中心团队加大协作,极大提高了系统实用程序的效用。利用在数据中心通过不同的工作场景和参数培训过的神经网络组建的系统,搭建出一个更加高效和自适应工作框架,实现对数据中心的动态认知并优化效率。
接下来,谷歌DeepMind用数据中心采集的所有历史数据,如温度,电源,泵速,操作设定值等去培训深神经网络。谷歌的目标是提高数据中心的能源效率,培训神经网络去预测未来的平均PUE(能耗使用效率,即数据中心总能源消耗对IT能源消耗的比例)。
进一步,谷歌附加培训要求,要深神经网络综合预测出未来一小时数据中心的温度和压力。预测目的是通过模拟PUE模型,洞察预前操作建议,以确保数据中心冷却系统不会超越任何操作限制。
也就是说,如果你预知未来一个小时数据中心包括温度和压力在内换热负载,那么立马预前采取措施,比如冷水塔温度调整,冷却泵转速该降的降,该停的停,则绝不配置多余的冷却能耗。当然,数据中心热负载主要来自包括服务器在内设备散热,它直接关联运算负载。因此,数据中心能耗AI需多维打包。
以谷歌DeepMind在自己数据中心的AI节能实践,效果相当可观。谷歌的结论是可持续降低冷却能耗40%,相当于降低整个PUE值15%。谷歌AI在该数据中心创造了有史PUE新低。
谷歌AI降低PUE测试图
据此前谷歌通报,谷歌全球数据中心目前的PUE平均值是1.12。
谷歌指出,数据中心节能优化目前的挑战在于:
1,数据中心能耗设备的操作,以及与环境相互关系复杂,形成非线性的相互作用。传统基于公式的工程设计和人的直觉往往难以捕获彼此的交互关联。
2,系统不能快速地适应内部或外部的变化(如天气)。因为我们无法对应每一个操作场景制定出规则和直觉反应。
3,每个数据中心拥有独特的建筑和环境。一个以客户化模式定制的系统并不适用于其它数据中心。因此,需要建立一个通用智能工作框架,了解数据中心的交互关系。
实际上,针对自家数据中心节能场景,谷歌DeepMind的人工智能和算法基础是理解复杂的动态场景,并以通用的目的建立解决方案工作框架。由于其通用性,谷歌计划未来几个月将扩大应用到数据中心的其它领域,解决数据中心进一步挑战。
应用谷歌DeepMind通用人工智能工作框架举一反三的场景远远超过数据中心本身,这个技术应用完全可以到其它领域,比如提高发电厂的转换效率、降低芯片加工能耗和水耗、增加制造设施的产率、甚至智能城市的搭建等等。
谷歌将把此节能成果向自己的全部数据中心推广。与此同时,崇尚开放的谷歌准备对外公开成果,以便其它数据中心和工业系统操作者分享,使他们在自己的最终环境从谷歌的成果中受益。CBI
