行健讲坛学术讲座
第 451 期
时间: 2022年12月1日(周四)下昼14:40-15:25
所在: 线上(腾讯聚会:714861587)
讲座: “物理指导”助力强化学习在数据中心的清静安排
演讲者: 王睿航 新加坡南洋理工大学,,,,博士生
演讲者简介:
王睿航是新加坡南洋理工大学盘算机科学与工程学院的博士生。。。 在此之前,,,,他在中国天津大学细密仪器与光电工程学院获得工学学士、工程硕士学位。。。他的研究重点是将机械学习应用于能源麋集型的信息物理系统(例如数据中心),,,,致力于使用底层物理历程来提高机械学习算法的清静性和性能水平。。。他曾在Acm BuildSys、ACM/IEEE ICCPS等领域相关顶级聚会上揭晓和合著多篇论文。。。他的研究获得了 ICCPS 2022 最佳论文入围奖。。。
讲座摘要:
深度强化学习(DRL)在解决马尔可夫决议历程问题方面体现优异。。。由于 DRL优化了恒久累积回报的期望,,,,因此它是一种有远景的提高数据中心冷却能效的要领。。。然而,,,,在DRL的状态探索时代包管系统清静约束是一个主要挑战。。。现在,,,,当探索历程导致不清静时,,,,大多研究接纳负奖励的要领来处分学习历程。。。然而,,,,该类要领在学习怎样避免不清静之前,,,,往往需要履历足够多的不清静状态。。。本报告将先容一个用于数据中心冷却控制的清静探索DRL框架。。。本框架使用离线模拟学习和在线行动纠正来避免在线DRL时代温度过热导致的不清静问题。。。在线行动纠正旨在小幅度修正DRL推荐的潜在不清静行动,,,,以确保纠正后的行动不会导致系统过热。。。该纠正操作基于热状态转换模子设计,,,,该模子使用历史清静操作轨迹举行拟合,,,,并能够将转换外推到DRL探索的不清静状态。。。本报告进一步评估了该要领在两种天气条件下对冷冻水和直接膨胀冷却数据中心的控制优化,,,,与古板控制相比,,,,该要领可节约18%至26.6%的数据中心总能耗,,,,并且与具有负奖励塑形的古板DRL相比,,,,可显著镌汰温度方面的清静违规。。。
约请者:通讯与信息工程学院 曾丹教授
接待宽巨匠生加入!