Alpha go的算法原理:深度强化学习与图神经网络(GNN)研究【大学组】

方向:理工

专业:人工智能

是否可以加论文:

项目时长及形式:英文

产出:

7周在线小组科研学习+5周论文辅导学习 共125课时

学术报告

优秀学员获主导师Reference Letter

EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表(可用于申请)

结业证书

成绩单

项目介绍:

项目内容涉及强化学习核心理论和技能,具体包括遗传算法、强化学习框架、Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程、优化控制、图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。学生通过项目了解如何开发基于强化学习的生产力软件,在结束时提交项目个性化研究课题报告,进行成果展示。

个性化研究课题参考:

强化学习在博弈论中的应用:类alpha算法开发

利用经验留存解决强化学习所需样本太多问题的可行性分析

强化学习中的机器奖励设置方法迭代

为强化学习过拟合的特定场景重新建模的自动过程研究

具有精确尺度估计的动作-评价网络结构与强化学习优势函数

Alpha go的算法原理:深度强化学习与图神经网络(GNN)研究【大学组】

更多留学问题欢迎咨询晨晟留学之家,电话(同微信) 18071732056

免费获取留学申请评估
咨询留学,请加微信
咨询留学,请加微信
顾问微信号
顾问微信号