摘要
本发明提供了一种基于特征融合的智能体关键行为检测方法,所述基于特征融合的智能体关键行为检测方法包括获取多模态训练样本集,所述训练样本集包括环境图像数据以及动作文本数据组成的序列数据;对所述智能体的环境图像数据使用基于Inception以及GRU神经网络的图像编码模块进行特征提取通过关键判断生成固定维度的图像编码向量;对所述智能体的行为动作文本数据textt使用基于ALBERT的文本编码模块得到动作文本编码向量;根据所述图像编码向量和所述动作文本编码向量进行融合并检测。通过进行标识的多模态训练样本集中行为动作文本数据进行标识,重新融合后进行关键行为的动作检测,有助于现有技术中缺乏一种加入专家的技术问题。
技术关键词
环境图像数据
图像编码
训练样本集
GRU神经网络
文本
编码向量
神经网络模型构建
生成检测模型
图像序列数据
图像特征编码
多模态
编码模块
GRU模型
序列特征
注意力机制
定义
标识
系统为您推荐了相关专利信息
语音识别文本
语音特征提取
自动语音识别方法
网络状态信息
编码模块
自查方法
历史交互信息
大语言模型
神经网络模型
可执行程序代码
商品推荐方法
图像
深度神经网络
商城
商品推荐装置
输出特征
数据分类
因子
局部特征提取
实时监测数据