摘要
本发明涉及人工智能技术领域,具体涉及一种基于人工智能驱动的多模态数据检索生成合成方法及系统,包括多模态特征提取、跨模态对齐、特征融合、多模态检索与排序和多模态生成,通过多模态特征提取,采用不同深度学习模型对多模态数据分别特征提取并转为向量,通过跨模态对齐,将不同模态特征向量映射到同一向量空间,并通过特征融合,用注意力机制计算相关性权重并加权求和融合特征,再通过多模态检索与排序,计算查询向量与候选数据相似度并排序,最后通过多模态生成,将检索知识作为外部知识融入生成模型,生成多模态合成答案,从而能够有效整合和利用多模态数据中的信息。
技术关键词
人工智能驱动
多模态
深度学习模型
特征提取模块
数据输入模块
对齐模块
生成对抗网络架构
查询意图
时间序列分析方法
大语言模型
跨模态
输出模块
注意力机制
度计算方法
文本编码器
答案
音频
系统为您推荐了相关专利信息
车道
地图构建方法
位置编码信息
大语言模型
图像特征提取
图像异常检测方法
医学
神经网络模型
适配器
样本