基于语义关联建模的视觉生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510620689

申请日期：2025-05-14

公开号：CN120542428A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及语音语义技术领域，可应用于金融科技、医疗健康及海报设计等业务场景中，公开了一种基于语义关联建模的视觉生成方法、装置、设备及介质，包括：训练语言模型以理解语义扰动后的交互指令，生成包含主题和风格参数的需求文本；提取需求文本中的语义特征并构建语义关联权重，结合空间分布约束优化元素布局坐标；将布局信息编码为控制矩阵并与初始噪声融合，通过编解码网络调节降噪过程，生成对用户指令语义高度匹配的目标视觉内容。本发明通过构建布局优化函数并引导扩散模型在空间上聚焦语义显著区域，将语言模型输出与视觉生成过程紧密结合，实现对用户语义需求的结构化响应与空间映射，提升视觉内容生成的表达一致性与个性化适配能力。

技术关键词

布局编解码生成方法语义特征视觉矩阵预训练语言模型元素指令风格生成程序同义词库文本高斯核函数噪声预测坐标参数主题关键词网络

系统为您推荐了相关专利信息

一种基于数据的日用水量计算分析方法及系统

供水系统天气数据水文线性回归模型

一种基于神经网络快速生成高质量柱面全息图的方法

重建物体表面柱面全息图生成方法采样模块上采样

一种发酵厂房中酒醅取料机器人的路径规划方法

发酵厂房路径规划方法机器人栅格地图视觉里程计

基于图像识别的汽车制动器装配异常识别方法及系统

轮毂轴承螺母早期风险评估异常识别方法汽车制动器指纹特征

基于多特征自适应融合与主辅动态恢复的RGB-T目标跟踪方法

跟踪方法多层次特征提取模态特征动态多模态响应

基于语义关联建模的视觉生成方法、装置、设备及介质

站点导航

APP 下载