摘要
本发明涉及人工智能技术领域及医疗健康领域,公开了一种图像序列构建方法,包括:接收初始图像和文本信息,将初始图像划分为多个图像片段,通过第一网络结构提取图像特征向量,通过第二网络结构提取文本特征向量,将图像特征向量、文本特征向量与噪声信息融合生成初始融合向量,对初始融合向量执行去噪处理,得到去噪结果,通过解码处理去噪结果生成目标图像序列。本发明通过图像特征向量和文本特征向量的融合,实现了多模态信息的高效结合,同时利用迭代去噪优化细节表现,改善生成图像序列的保真度,结合解码模块的多层特征还原网络提高了生成视频的动态一致性和细节清晰度,有效提升了图像生成视频的质量与适用性。
技术关键词
文本特征向量
图像特征向量
序列构建方法
噪声信息
网络结构
模态特征
特征提取模块
解码模块
图像嵌入
信息熵
多模态
语义特征
多头注意力机制
计算机设备
特征提取单元
系统为您推荐了相关专利信息
屏幕
意图识别
多维尺度分析方法
分析模块
隐私保护技术
风电机组叶片
文本映射技术
大语言模型
故障检测
自然语言文本
网络拓扑生成方法
馈线结构
变量
串并联结构
生成算法
DOA估计
神经网络模型
神经网络结构
阵列天线
训练集数据