摘要
本发明提出一种基于数据反演的零样本跨域数据生成方法和系统,旨在解决目标域数据缺乏的问题。本发明通过域信息检索步骤将目标域的域文本转换为域文本特征向量;根据域文本特征向量在源域信息库中进行检索,计算域文本特征向量与源域信息库中已有域信息之间的相似度,并筛选出最接近的域信息;域信息反演步骤对检索到的域信息进行DDPM反演得到目标域的初始噪声;数据生成步骤将反演得到的初始噪声作为初始去噪数据,结合条件信息对初始去噪数据进行条件化去噪最终生成符合目标域需求的跨域数据。本发明能在新场景下的数据生成成为可能,仅依赖于目标域文本描述信息,提高了生成数据的质量。
技术关键词
文本特征向量
数据生成器
文本编码器
数据生成方法
数据生成系统
信息检索
随机噪声
解析单元
信息编码器
标记过
样本
度函数
跨模态
物理
语义
信号
系统为您推荐了相关专利信息
训练数据生成方法
文本
排版信息
语义特征
模型训练方法
文本编码器
模型构建方法
图像编码器
策略
注意力
泛化方法
图像特征提取
匹配模块
样本
文本特征向量
样本
时序
文本编码器
计算机执行指令
模型训练方法