一种基于情感驱动和人类专家反馈的机器行为学习方法

正文

推荐专利

申请号：CN202510451959

申请日期：2025-04-11

公开号：CN120318634A

公开日期：2025-07-15

类型：发明专利

摘要

本发明公开了一种基于情感驱动和人类专家反馈的机器行为学习方法，包括以下步骤：a)融合由BLIP‑2提取的环境图像特征和GPT‑4解析的文本指令语义特征，形成跨模态输入；b)利用人类专家遥控轨迹数据和跨模态输入，通过监督微调（SFT）训练基础VLA模型，得到基础行为策略；c)将情感识别模块与多头自注意力机制相结合，对基础策略融入情感交互依赖，生成高阶情感驱动行为表示；d)将高阶情感行为表示输入强化学习模块，利用Replay Buffer存储轨迹，通过人类专家反馈偏好学习进行优化，输出最终行为策略。本本发明相较于现有方法具有多模态特征提取能力强、情感融合程度高、专家反馈利用充分等优点，可在一定程度上提升机器对人类指令与情感的响应准确度和交互体验。

技术关键词

注意力机制人类模态特征学习方法轨迹自动情感识别策略跨模态语音情感识别图像视觉特征文本特征向量特征提取能力识别模块语义指令多模态情感特征大语言模型

系统为您推荐了相关专利信息

基于多组协同粒子群优化的车联网多车路径规划优化方法

路径规划优化方法路段信息模块群体智能模型群体智能系统

电力行业复杂场景下的文字数据的智能识别方法

智能识别方法构建知识图谱增量学习方法场景差分隐私方法

一种放疗机器人肿瘤运动估计预测系统及方法

动态变化数据放疗机器人肿瘤运动跟踪算法图像获取模块

缆索承重桥梁结构损伤识别方法、设备、存储介质及产品

缆索承重桥梁结构损伤识别方法损伤识别模型拉索加速度

基于多模态生物反馈的车辆控制方法

车辆控制方法方向盘握力指数场景多模态特征

一种基于情感驱动和人类专家反馈的机器行为学习方法

站点导航

APP 下载