摘要
本发明涉及人工智能技术领域,可应用于智能体自主决策、金融科技及医疗健康等业务场景中,公开了一种动作策略安全增强方法、装置、设备及介质,包括:构建安全约束空间,获取多模态感知数据生成融合安全感知特征,基于任务目标和融合安全感知特征通过策略生成模块生成初始动作策略,将初始动作策略投影至安全约束空间得到安全动作策略,执行过程中监测受控对象状态数据并在状态数据触发监测阈值时执行干预措施,采集执行过程数据并基于执行过程数据更新策略生成模块。本发明通过多模态感知信息与任务目标融合生成初始动作策略,结合安全约束空间投影、状态监测及数据反馈更新策略生成模块,提升机器人在复杂环境中任务执行的安全性。
技术关键词
动作策略
感知特征
环境感知数据
参数
强化学习策略
多模态
异常事件
空间结构特征
空间分布信息
数据更新
模块
分布特征
拓扑特征
运动
特征关联分析
声纹特征
识别特征
物理
系统为您推荐了相关专利信息
人脸关键点检测
眼部关键点
摄像设备
畸变参数
电子设备
优化求解方式
标签
数据分类方法
神经网络结构
机器学习模型
胶囊神经网络
残差补偿方法
时钟同步方法
时间同步
分布式光伏系统
噪声语音
识别语音数据
编码器
语义标签
语音识别模型