【储建论坛(第58期)】环境模型学习——让强化学习走出游戏

发布者:郑健发布时间:2021-07-12浏览次数:416

报告题目:环境模型学习——让强化学习走出游戏

报 告 人:俞扬

时  间:2021722上午9:00-11:00

地  点:工科D345 线上同步(腾讯会议号:774723776)

报告人简介:博士,南京大学教授,国家万人计划青年拔尖人才。主要研究领域为机器学习、强化学习,近期专注于开放环境强化学习的理论、技术、与落地应用。获2020 CCF-IEEE“青年科学家奖”,入选2018IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘“青年成就奖”,受邀在IJCAI’18作关于强化学习的“青年亮点”报告。获2013年全国优秀博士学位论文奖、2011CCF优秀博士学位论文奖。

报告摘要:强化学习研究大多被限制在游戏环境中,尚处于“好看不好用”的境地。基于环境模型的强化学习被认为是有望解救强化学习样本效率低下的主要途径。一旦有了良好环境模型,强化学习的大量试错可在环境模型中完成,从而极大的减少了在真实环境的试错采样的数量,使得强化学习更具可用性。然而,以往环境模型学习的理论与实验均难以支持这一想法,使得研究主流逐渐抛弃对学习良好环境模型的期待。报告人在实践需求中看到,环境模型具有难以替代的应用优势,并在环境模型学习上开展了研究。本次报告将汇报环境模型学习的研究进展,及其在真实强化学习应用中的效用。


                                                                       储运与建筑工程学院

                                                                                                                                                                                                                        2021712