摘要
本发明涉及图像检测技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了基于文生图模型的物体位置控制方法、装置、设备及介质,所述方法包括:获取目标物体的初始图像和初始位置描述文本,对所述初始图像进行二值化处理,得到目标掩码图像;提取所述目标掩码图像中所述目标物体的几何特征,根据所述几何特征确定所述目标物体的物体位置数据;根据所述物体位置数据对所述初始位置描述文本进行文本增强处理,得到目标描述文本;对所述目标描述文本进行语义编码,得到语义特征向量,并根据所述语义特征向量生成对应的目标物体图像。本发明可以提高物体位置生成准确性以及提高图像生成效率。
技术关键词
物体位置数据
位置控制方法
文本
位置坐标参数
图像生成器
语义
缩略图
二值化阈值
编码向量
像素点
注意力
位置控制装置
图像检测技术
序列
处理器
分词
矩形
系统为您推荐了相关专利信息
信息提取模型
交易信息核对方法
文本
分词模型
流水
视频片段检索方法
文本
语义特征
视觉特征
跨模态