排队网络系统的韧性控制:从强化学习到安全博弈

活动信息

  • 开始时间:2023-04-28 09:00:00
  • 活动地点:厚兴楼307会议室
  • 主讲人:金力

活动简介

排队网络模型在交通运输、生产物流、电子通信等领域广泛应用。现有方法普遍基于参数完整、观测正确的假设,但实际网络系统往往不完全符合这两项假设。针对上述问题,我们研究排队网络的自适应韧性控制方法,即设计具备自主学习适应、自主抗扰动能力的分流、限流策略。首先,我们提出具备稳定性保证的自适应学习控制方法。该方法分两步,第一步显式构造李雅普诺夫函数,获得镇定控制策略的集合;第二步在这个集合中,利用策略迭代法搜索近最优策略。接下来,我们考虑信息扰动扰动下的网络防御问题。我们将信息扰动描述为控制策略的随机失效,网络控制者可选择以一定成本开启或关闭防失效机制。针对随机型扰动,我们给出最有防御策略及其镇定性;针对策略型扰动,我们分析网络控制者与恶意攻击者之间的随机博弈及其完美马尔可夫均衡。

主讲人介绍

上海交通大学密西根学院电气与计算机工程专业副教授、博士生导师。2011年获上海交通大学本科学位、2012年获美国普渡大学硕士学位、2018年获美国麻省理工学院博士学位。2018-2020年任美国纽约大学助理教授,2021年加入上海交大密西根学院,并担任自动化系双聘教师,入选国家级青年人才计划。研究方向为智能网联运输系统(智能网联汽车、智慧交通系统)的控制及优化,侧重系统层面的机理描述、理论分析和仿真验证,重点关注系统在环境扰动和人为决策下的自适应性、信息物理故障和恶意攻击下的安全可靠性。累计发表论文30篇。主持多项国家自然科学基金及美国国家科学基金会课题。 主讲“应用数学方法”“随机控制与强化学习”“智慧城市中的决策问题”等课程。