首页 > 学生学习 > 学习方法 >

北京大学取得分布式多智能体合作方法专利通过强化学习进行训练

众鼎号分享 10636

众鼎号 分享

  金融界2023年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2023年5月

  金融界2023年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2023年5月。

  专利摘要显示,本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。

AD位1

相关推荐

AD位2

热门图文

AD3

上一篇:《恶魔学家》医院彩蛋触发办法

下一篇:状元谈初中学习经验:掌握这100条学习方法想不考高分都难!