一种基于扩散模型的文本增强图像生成方法

正文

推荐专利

一种基于扩散模型的文本增强图像生成方法

申请号：CN202411961541

申请日期：2024-12-30

公开号：CN119379866B

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种基于扩散模型的文本增强图像生成方法，通过场景文本解析与关系建模机制，本框架通过深度整合大语言模型，显著提升了文本理解能力，实现了对复杂场景关系的精确解析和语义理解，创新性地设计了物体提取、关系提取和物体定位等核心模块，实现了对场景中物体位置、属性等细节的精确把控、通过巧妙集成外部搜索引擎和专业的文本生成模块，有效突破了传统模型在图像文字渲染和专有名词物体生成方面的局限性，显著提升了生成内容的准确性和真实性，通过整合知识图谱，将物体关系表示为图结构，并以入度最多的物体为核心锚点生成场景布局。本机制显著提升了场景布局的语义一致性与视觉美观性。

技术关键词

图像生成方法物体空间布局信息文本大语言模型锚点图谱核心语义三元组实体识别方法参数关系建模生成场景视觉画布尺寸

系统为您推荐了相关专利信息

一种激光气体探测仪监测目标定位预警并自动矫正的方法

气体探测仪激光探测器图片摄像机旋转齿轮

结合深度学习的非接触式红外温度测量方法

温度测量方法深度学习神经网络接触式红外温度传感器测温

知识框架自动生成方法、装置、计算机设备及存储介质

视频图像特征自动生成方法关键帧文本语音

外贸函电智能语义纠错与商业术语优化方法及装置

术语风险点国际商务条件随机场模型文本

一种文本数据库更新方法、装置、设备及存储介质

文本字词滑动时间窗口数据库更新方法语义

一种基于扩散模型的文本增强图像生成方法

站点导航

APP 下载