文本的图像生成方法、装置、电子设备及可读介质

正文

推荐专利

申请号：CN202510880798

申请日期：2025-06-27

公开号：CN120852559A

公开日期：2025-10-28

类型：发明专利

摘要

本申请涉及一种文本的图像生成方法、装置、电子设备及可读介质，其中，方法包括：获取待处理文本中的各个场景片段，并对各个场景片段进行解析，得到多个场景信息；从预设数据库中提取场景片段的目标对象的初始ID嵌入向量，其中，初始ID嵌入向量包括目标对象在多个特征维度的视觉特征；根据场景信息从多个特征维度对初始ID嵌入向量进行调整，得到与各个场景片段对应的目标ID嵌入向量；利用各个目标ID嵌入向量以及场景信息依次为各个场景片段生成场景关键帧；整合各个场景关键帧，得到与待处理文本对应的关键帧图像序列。解决了同一人物在同一故事文本的不同关键帧中难以保持形象一致性的问题。

技术关键词

关键帧视觉特征生成场景人物特征图像生成方法对象文本图像生成模型图像生成装置处理器通信接口电子设备风格体型面部存储器策略模块

系统为您推荐了相关专利信息

基于视觉识别的停车检测方法、装置、设备及存储介质

停车检测方法车辆停车线图像边缘检测算法

一种基于跨模态自适应交互的少样本工业异常检测方法

异常检测方法视觉特征语义注意力跨模态

一种矿山监控视频播放方法、装置及电子设备

三维场景模型关键帧点云模型像素点图像特征点

对象表征模型训练方法、对象表征方法及相关设备

对象图像数据编码特征样本语音识别文本交互网络

一种视频处理方法、装置、电子设备及存储介质

视频帧关键帧关键词序列实体识别模型

文本的图像生成方法、装置、电子设备及可读介质

站点导航

APP 下载