摘要
本发明属于人工智能技术领域,具体涉及一种应用于分子设计的强化学习智能体,问题评估器对用户输入的分子设计相关问题进行评估和预处理,输出用户需求并传递至决策思维中枢模块;决策思维中枢模块基于用户需求,输出多条思维过程和匹配的执行动作,向动作执行模块推荐动作;动作执行模块根据决策思维中枢模块的推荐,执行动作;当决策思维中枢模块推荐的动作为总结回复时,回答评估器会评估回复的好坏通过或拒绝该回答;强化学习模块记录和采样多次思维过程与执行动作轨迹和运行结果,获得相对优势,利用最优的思维过程的持续优化决策思维中枢模块所采用模型的参数。本发明的强化学习智能体的决策路径简单、效率高、能够持续学习。
技术关键词
决策
模块
分子
强化学习算法
格式
代表
人工智能技术
轨迹
设计系统
策略
参数
资料
规划
数据
系统为您推荐了相关专利信息
算法配置方法
深度强化学习
强化学习策略
超参数
决策
断路器分合闸线圈
数据存储模块
人机交互模块
诊断模块
皮尔逊相关系数
压力调节系统
滚筒
压强
自行车车架管材
液压调节模块