摘要
本申请实施例提供了一种宠物视觉数据生成方法、装置、计算机设备及存储介质。方法包括接收数据生成请求,数据生成请求包括视觉提示文本和目标宠物的参考视觉数据;根据数据生成请求调用预训练的生成模型,其中,生成模型包括数据融合子模型和视觉处理子模型;调用数据融合子模型基于视觉提示文本和参考视觉数据进行数据融合,得到视觉潜在向量;调用视觉处理子模型基于视觉潜在向量进行视觉数据生成,得到与视觉提示文本对应的目标视觉数据,目标视觉数据包括目标宠物图像和/或目标宠物视频。该方法可以提高宠物视觉数据生成的一致性。
技术关键词
数据生成方法
样本
视频
分辨率
计算机设备
文本编码器
图像编码器
噪声
解码器
计算机程序产品
视觉特征提取
数据生成装置
语义特征提取
多模态
处理器
系统为您推荐了相关专利信息
干旱监测方法
作物生长监测设备
多层次
叶面积指数
空气温湿度传感器
蜕变关系
自然语言推理
测试用例集
大语言模型
样本
图像识别装置
嵌入式处理器
Retinex算法
水质传感器
LED补光灯