摘要
本公开提供一种基于深度强化学习的无监督连续情绪脑电分析方法和装置,在原型学习阶段:获得各样本对象各自对应的时序信号的样本特征,并基于K‑Means算法对样本特征进行聚类处理,得到时序信号中情绪信息的全局分布信息,在强化学习阶段:根据全局分布信息确定分布‑原型奖励函数,并采用Actor‑Critic框架使用近端策略优化算法PPO,使得Actor基于当前策略针对给定时序信号执行当前动作,Critic根据环境反馈的分布‑原型奖励确定当前动作的当前评分,Actor基于当前评分进行策略学习,直至达到预设终止迭代条件,得到用于根据目标时序信号确定所述目标时序信号中的关键信号的模型。以提高最终获得的模型的准确性和可靠性。
技术关键词
原型
脑电分析方法
时序
深度强化学习
策略
信号
脑电分析装置
样本
阶段
聚类
启发式算法
计算机程序产品
对象
框架
处理器
误差
广义
系统为您推荐了相关专利信息
Stacking模型
长短期记忆网络
容错控制方法
序贯概率比检验
故障场景
序列生成方法
个性化药物
决策
强化学习算法
医学
高精度语音识别
对话策略
客户
多轮对话
深度卷积神经网络
零知识证明技术
同态加密算法
可信执行环境
节点
分片策略
BERT模型
样本
序列
计算机可执行指令
sigmoid函数