logo

SWUFE数学讲坛223期:Pontryagin-Guided Direct Policy Optimization 庞特里亚金引导的直接策略优化

发布时间:2026年03月13日 16:54 发布人:

主题Pontryagin-Guided Direct Policy Optimization 庞特里亚金引导的直接策略优化

主讲人韩国亚洲大学商学院 Hyeng Keun Koo 教授

主持人数学学院 马敬堂教授

时间202632016:00

地点柳林校区通博楼B412会议室

主办单位:数学学院 科研处

主讲人简介:

Hyeng Keun Koo 是韩国亚洲大学(Ajou University)商学院金融工程学教授,长期从事金融理论与金融工程领域的研究与教学工作。目前的主要研究方向为agentic AI systems, optimal control with machine learning, long-term asset management 以及 history。他在亚洲大学任教多年,对学校金融学科的发展作出了重要贡献,并在退休后因其卓越的学术成就被授予荣休教授称号。他的研究兴趣涵盖金融市场、资产定价、风险管理等方向。

内容提要:

讲座主要关于Pontryagin-Guided Direct Policy Optimization(PGDPO)这一连续时间动态优化方法。PGDPO Pontryagin 最大值原理为理论核心,通过将前向财富路径模拟与反向自动微分(BPTT)结合,使神经网络能够直接学习最优控制策略,而无需求解高维 HJB 方程或 BSDE。相比传统动态规划、深度 BSDEPINN,PGDPO 能稳定恢复最优投资中的即时需求与跨期对冲需求,并在资产数量和状态维度极高的情况下保持可扩展性。讲座还将介绍其扩展版本 P-PGDPO。该框架不仅在高维投资组合选择中表现突出,也为时间不一致控制、均值场博弈、机器人控制与能源系统优化等领域提供了新的可行路径。