摘要
本发明涉及人工智能技术领域及医疗健康领域,公开了一种图像序列构建方法,包括:接收初始图像和文本信息,将初始图像划分为多个图像片段,通过第一网络结构提取图像特征向量,通过第二网络结构提取文本特征向量,将图像特征向量、文本特征向量与噪声信息融合生成初始融合向量,对初始融合向量执行去噪处理,得到去噪结果,通过解码处理去噪结果生成目标图像序列。本发明通过图像特征向量和文本特征向量的融合,实现了多模态信息的高效结合,同时利用迭代去噪优化细节表现,改善生成图像序列的保真度,结合解码模块的多层特征还原网络提高了生成视频的动态一致性和细节清晰度,有效提升了图像生成视频的质量与适用性。
技术关键词
文本特征向量
图像特征向量
序列构建方法
噪声信息
网络结构
模态特征
特征提取模块
解码模块
图像嵌入
信息熵
多模态
语义特征
多头注意力机制
计算机设备
特征提取单元
系统为您推荐了相关专利信息
元数据存储方法
数据存储模型
语义关联度
知识图谱数据
文本特征向量
无线通信网络调度
动态贝叶斯网络
节点
监测无线通信网络
资源分配