可泛化符号逻辑与强化学习-计算机与大数据学院/软件学院

科研工作

首页 >
科研工作 >
学术活动 >
正文

可泛化符号逻辑与强化学习

来源：发布日期：2023-07-24 浏览次数：

报告时间：2023年7月26日（周三）15:00-16:30

报告地点：计算机与大数据学院2号楼219会议室

报告题目：可泛化符号逻辑与强化学习

报告人：郑岩，天津大学智能与计算学院副教授

报告简介：

尽管深度强化学习（DRL）在人类水平的控制问题上取得了出色的性能，但它缺乏高级智能，如逻辑推理和知识重用。因此，与人类相比，DRL在学习复杂问题方面表现出低效性。先前的研究试图直接合成一个白盒逻辑程序作为DRL策略，实现逻辑驱动的行为。然而，大多数合成方法基于命令式或声明式编程，各自都有明显的局限性。前者在合成过程中忽略了因果逻辑，导致跨任务的泛化能力较低。后者严格基于证明，因此无法合成具有复杂层次逻辑的程序。本报告将介绍我们的新型框架——通用逻辑合成（GALOIS），它利用程序草图，并定义了一种新的基于草图的混合程序语言，用于合成具有层次结构和严格因果逻辑的程序。此外，我们可以利用逻辑程序的可解释性来衡量不同任务之间的相似性，以指导迁移学习。在各种具有复杂逻辑的决策任务上进行的广泛评估显示出我们的方法在渐近性能、泛化能力和在不同环境中的知识重用方面优于主流基准方法。

报告人简介：

郑岩，天津大学副教授，天津大学深度强化学习实验室联合负责人，专注基于强化学习的决策智能前沿理论与应用研究。近五年在NeurIPS、ICML、ICLR、JAAMAS、IEEE TSG、IEEE Applied Energy等人工智能领域的知名国际期刊和顶级国际会议上发表（CCF A等）论文近40余篇，获批/申请国家（国防）专利20余项，获CCF A类会议ASE 2019杰出论文奖，NeurIPS 2022 SMART Driving自动驾驶比赛双Track冠军、PRICAI最佳论文奖。研究工作得到国家科技部科技创新2030-重大项目课题、KJW国防科技创新重点项目课题、国家自然科学基金青年项目，航天院所等多项国家和省部级科研项目的资助，其研究成果在国防军事领域的多个军事仿真场景中应用落地，拥有丰富的科研项目经验。此外郑岩博士还担任中国指挥与控制学会委员、曾获中国人工智能学会智能体与多智能体学组优秀博士论文奖，同时他还担任ICML、NeurIPS、ICLR、AAAI、IJCAI等多个国际人工智能顶级会议的（高级）程序委员会委员。