一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品

AITNT
正文
推荐专利
一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品
申请号:CN202511587749
申请日期:2025-11-03
公开号:CN121030696A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品,涉及信息提取技术领域,该方法先获取包括图像数据、文本数据、音频数据、传感器数据的待合成数据,经预处理得到对应各模态的序列数据;再基于序列数据提取全局语义因子、局部语义因子、细节三级语义因子,全局语义因子通过任务指令筛选候选模板并结合序列数据评分得到,局部语义因子由序列数据聚类后特征池化生成,细节语义因子依据序列数据的重建误差及其变化得到;将各模态序列数据与对应标识合成,并和三级语义因子拼接为合成序列数据;最后把合成序列数据输入同一transformer编码器完成多模态数据合成,实现多模态数据的高效协同与深度整合。
技术关键词
语义 因子 图像序列数据 重建误差 文本 音频 传感器 多模态 模板 标识 计算机程序产品 信息提取技术 指令 编码器 可读存储介质 存储计算机程序
系统为您推荐了相关专利信息
1
一种基于多模态特征融合的实体链接方法
实体链接方法 多模态特征融合 图像特征向量 文本特征向量 链接数据集
2
一种面向医学教学的智能病历分析与模拟诊疗系统
智能病历 诊疗系统 患者 记录单元 逻辑
3
基于无监督学习的医保异常数据检测方法及装置
网络模块 异常数据检测方法 重建误差 无监督学习 样本
4
海洋哺乳动物嘀嗒声信号语义分割检测方法、设备及介质
海洋哺乳动物 分割检测方法 图像语义分割网络 信号 解码器架构
5
一种基于图像识别的微塑料的快速检测方法
快速检测方法 信噪比 时域荧光寿命 量子优化算法 张量分解模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号