一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品

AITNT
未登录
正文
推荐专利
一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品
申请号:CN202511587749
申请日期:2025-11-03
公开号:CN121030696A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品,涉及信息提取技术领域,该方法先获取包括图像数据、文本数据、音频数据、传感器数据的待合成数据,经预处理得到对应各模态的序列数据;再基于序列数据提取全局语义因子、局部语义因子、细节三级语义因子,全局语义因子通过任务指令筛选候选模板并结合序列数据评分得到,局部语义因子由序列数据聚类后特征池化生成,细节语义因子依据序列数据的重建误差及其变化得到;将各模态序列数据与对应标识合成,并和三级语义因子拼接为合成序列数据;最后把合成序列数据输入同一transformer编码器完成多模态数据合成,实现多模态数据的高效协同与深度整合。
技术关键词
语义 因子 图像序列数据 重建误差 文本 音频 传感器 多模态 模板 标识 计算机程序产品 信息提取技术 指令 编码器 可读存储介质 存储计算机程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号