一种工业场景下的多模态语义分割方法、系统、装置及存储介质

AITNT
正文
推荐专利
一种工业场景下的多模态语义分割方法、系统、装置及存储介质
申请号:CN202410811465
申请日期:2024-06-21
公开号:CN118657942A
公开日期:2024-09-17
类型:发明专利
摘要
本申请涉及语义分割技术的领域,尤其涉及一种工业场景下的多模态语义分割方法、系统、装置及存储介质。其中,工业场景下的多模态语义分割方法包括获取包含待识别对象的RGB检测图像和待识别对象的文本数据;将所述RGB检测图像和所述文本数据输入语义分割模型,通过所述语义分割模型分别提取所述RGB检测图像的图像特征和所述文本数据的文本特征,将所述图像特征与所述文本特征进行对齐和融合得到处理后的语义特征,并基于所述语义特征评判所述RGB检测图像为目标对象的概率作为输出,得到对所述RGB检测图像的识别结果,能够提高复杂工业场景下待识别目标物体语义分割效果。
技术关键词
语义分割方法 语义分割模型 图像 文本 语义特征 交叉注意力机制 场景 工业 跨模态 文字特征 特征提取模块 样本 对象识别 语义分割系统 数据 语义分割技术 损失函数优化 感兴趣
系统为您推荐了相关专利信息
1
水池清洁机器人的回桩方法、装置和水池清洁机器人
清洁机器人 机器人控制器 参数 控制水池 神经网络模型
2
一种基于深度神经网络模型的论文图片比对方法
图片比对方法 深度神经网络模型 论文 深度卷积神经网络 图片比对系统
3
一种图像处理目标物品细节纹理缺陷检测方法、系统
网格 颜色直方图 缺陷检测方法 工件 图像处理
4
一种融合即时通讯和邮箱通讯的通讯方法
融合即时通讯 邮箱 通讯方法 混合通讯模式 邮件
5
一种健康数据的分享方法及系统
令牌 模式 指令 展示页面 图片
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号