基于人工智能的图像生成方法、装置、计算机设备及介质

正文

推荐专利

申请号：CN202510697302

申请日期：2025-05-27

公开号：CN120833392A

公开日期：2025-10-24

类型：发明专利

摘要

本申请属于人工智能技术领域，涉及一种基于人工智能的图像生成方法、装置、计算机设备及存储介质，包括：获取用户输入的初始文本，以及获取输入图像；基于文本姿势编码器对初始文本进行特征提取得到文本姿势嵌入；基于视觉姿势编码器对输入图像进行特征提取得到视觉姿势嵌入；基于跨模态姿势对齐模块对文本姿势嵌入与视觉姿势嵌入进行对齐处理得到目标姿势表征；将目标姿势表征注入至预设的图像生成器中；基于图像生成器，根据目标姿势表征执行图像生成处理并得到目标图像；基于目标图像对用户进行反馈处理。此外，本申请的目标图像可存储于区块链中。本申请可应用于金融领域与医疗领域中的文生图场景，能够提高生成图像的质量和姿势控制精度。

技术关键词

图像生成方法图像生成器对齐模块文本编码器视觉计算机可读指令关键点跨模态注意力特征提取网络多层感知器计算机设备加权特征融合策略图像生成装置图像特征提取姿势矫正

系统为您推荐了相关专利信息

一种针对医药流程数据的合规校验方法和装置

数据依赖关系阶段校验规则医学影像数据医药

一种基于人工智能的社交游戏推荐方法及系统

社交游戏推荐方法游戏平台压力关键词

基于大语言模型与扩散模型的非常态交通态势生成方法

噪声预测大语言模型交通生成方法语义

一种面部图像的增强方法、装置及设备

掩膜面部图像重建纹理空洞

用户问答交互方法、装置、设备和存储介质

问答交互方法文本非暂时性机器可读存储介质大语言模型场景

基于人工智能的图像生成方法、装置、计算机设备及介质

站点导航

APP 下载