摘要
本发明公开了一种基于语义感知的图像裁剪方法及装置,其有效弥补了传统方法仅依赖视觉特征的局限,通过引入概念词典丰富语义信息;同时,本发明通过语义相似性进一步挖掘潜在的语义关系,有助于充分挖掘和利用语义信息,从而在图像和语义标签之间建立了更为丰富和统一的概念空间,进一步提升裁剪结果的准确性和模型的鲁棒性;此外,本发明突破了传统方法角度固定的局限性,通过综合考虑每个实例的角度信息,动态调整裁剪框的方向,且通过综合考虑实例的几何属性、方向信息、密度分布等特征,自动选择合适的裁剪方式和构图比例,使得裁剪结果能够更灵活、精确地适应图像内容的布局和结构。
技术关键词
图像裁剪方法
结点
语义标签
局部视觉特征
图像裁剪装置
特征提取模块
裁剪模块
全局视觉特征
表达式
像素
加权无向图
拉普拉斯
矩形
文本编码器
图像编码器
模板
矩阵
系统为您推荐了相关专利信息
二进制代码程序
数据依赖关系
捕获方法
语义理解模型
指令模块
岩屑图像
分割方法
多尺度特征提取
路径特征
注意力
标注方法
真实图像数据
计算机设备
语义特征
图像分割模型