主题:随机控制问题的连续策略与价值迭代及其收敛性
主讲人:伍斯特理工学院数学科学系 汪谷副教授
主持人:数学学院 马敬堂教授
时间:2025年11月26日(周三)16:00
地点:柳林校区通博楼B412会议室
主办单位:数学学院 科研处
主讲人简介:
汪谷,伍斯特理工学院数学科学系副教授,研究方向为随机控制及其在金融领域的应用。于2007年在北京大学取得数学与应用数学学士学位,2013年在波士顿大学取得数学博士学位。在2013年至2015年间,担任密歇根大学博士后助理教授。
内容提要:
本讲座介绍一种连续策略-价值迭代方法,该方法通过朗之万类型的动力学同时更新随机控制问题的价值函数近似值和最优控制策略。该框架适用于无限时间尺度的熵正则化松弛控制问题以及经典控制问题。我们建立了策略改进机制,并在哈密顿量的单调性条件下证明了算法向最优控制的收敛性。讲座将为凹与非凹示例均提供数值计算结果。本报告是与佛罗里达州立大学Qi Feng的合作研究成果。