一种基于扩散模型的文本增强图像生成方法

AITNT
正文
推荐专利
一种基于扩散模型的文本增强图像生成方法
申请号:CN202411961541
申请日期:2024-12-30
公开号:CN119379866B
公开日期:2025-04-04
类型:发明专利
摘要
本发明公开了一种基于扩散模型的文本增强图像生成方法,通过场景文本解析与关系建模机制,本框架通过深度整合大语言模型,显著提升了文本理解能力,实现了对复杂场景关系的精确解析和语义理解,创新性地设计了物体提取、关系提取和物体定位等核心模块,实现了对场景中物体位置、属性等细节的精确把控、通过巧妙集成外部搜索引擎和专业的文本生成模块,有效突破了传统模型在图像文字渲染和专有名词物体生成方面的局限性,显著提升了生成内容的准确性和真实性,通过整合知识图谱,将物体关系表示为图结构,并以入度最多的物体为核心锚点生成场景布局。本机制显著提升了场景布局的语义一致性与视觉美观性。
技术关键词
图像生成方法 物体 空间布局信息 文本 大语言模型 锚点 图谱 核心 语义 三元组 实体识别方法 参数 关系建模 生成场景 视觉 画布 尺寸
系统为您推荐了相关专利信息
1
一种激光气体探测仪监测目标定位预警并自动矫正的方法
气体探测仪 激光探测器 图片 摄像机 旋转齿轮
2
结合深度学习的非接触式红外温度测量方法
温度测量方法 深度学习神经网络 接触式 红外温度传感器 测温
3
知识框架自动生成方法、装置、计算机设备及存储介质
视频图像特征 自动生成方法 关键帧 文本 语音
4
外贸函电智能语义纠错与商业术语优化方法及装置
术语 风险点 国际商务 条件随机场模型 文本
5
一种文本数据库更新方法、装置、设备及存储介质
文本 字词 滑动时间窗口 数据库更新方法 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号