基于文生图模型的物体位置控制方法、装置、设备及介质

AITNT
正文
推荐专利
基于文生图模型的物体位置控制方法、装置、设备及介质
申请号:CN202510763027
申请日期:2025-06-09
公开号:CN120599042A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于文生图模型的物体位置控制方法、装置、设备及介质,所述方法包括:获取目标物体的初始图像和初始位置描述文本,对所述初始图像进行二值化处理,得到目标掩码图像;提取所述目标掩码图像中所述目标物体的几何特征,根据所述几何特征确定所述目标物体的物体位置数据;根据所述物体位置数据对所述初始位置描述文本进行文本增强处理,得到目标描述文本;对所述目标描述文本进行语义编码,得到语义特征向量,并根据所述语义特征向量生成对应的目标物体图像。本发明可以提高物体位置生成准确性以及提高图像生成效率。
技术关键词
物体位置数据 位置控制方法 文本 位置坐标参数 图像生成器 语义 缩略图 二值化阈值 编码向量 像素点 注意力 位置控制装置 图像检测技术 序列 处理器 分词 矩形
系统为您推荐了相关专利信息
1
交易信息核对方法、装置、设备、介质和程序产品
信息提取模型 交易信息核对方法 文本 分词模型 流水
2
一种基于对偶时序图的跨模态视频片段检索方法
视频片段检索方法 文本 语义特征 视觉特征 跨模态
3
一种基于大模型的港口知识摘要生成方法
知识摘要生成方法 数据 关键词 大语言模型 指令
4
训练数据生成方法、装置、设备、存储介质和程序产品
训练数据生成方法 字段 样本 分段 关键字
5
基于大模型的多模态异构知识融合构建与语义增强检索系统
查询意图 检索系统 语义向量 动态知识图谱 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号