摘要
本发明涉及一种基于多模态信息的任务执行方法及系统,属于人工智能技术领域,解决了现有对多模态信息挖掘不充分且处理复杂而导致任务执行结果不准确的问题。包括采集并预处理历史多模态信息,构建多模态样本集;构建模态协同变换器,模态协同变换器是在Transformer模型中构建多个模态嵌入层提取出多模态嵌入向量传给编码器,并增加模态感知层获取多模态信息的动态权重向量对编码器中的多头自注意力层的输出进行调整;利用多模态样本集,通过多任务自监督学习方式对模态协同变换器进行训练;利用训练好的模态协同变换器对实际任务中输入的多模态信息进行融合,输出任务执行结果。实现了多模态信息的深度融合和执行结果准确率的提升。
技术关键词
多模态信息
变换器
编码器
多任务
样本
注意力
拼接模块
输出模块
动态
数据
人工智能技术
矩阵
文本
语音
正确率
标志位
图像
信噪比
系统为您推荐了相关专利信息
医学图像处理技术
自动分割方法
心脏
形变配准技术
双线性插值
编码器主体
无轴承
光源组件
光电编码器技术
电机端盖
5GNR通信系统
检索算法
训练深度神经网络
序列
奠定理论基础
乳品饮料
多任务
多层前馈神经网络
参数
数据分析算法