一种耳廓指代分割方法和系统

AITNT
正文
推荐专利
一种耳廓指代分割方法和系统
申请号:CN202510140742
申请日期:2025-02-08
公开号:CN119579905B
公开日期:2025-05-30
类型:发明专利
摘要
本发明提供一种耳廓指代分割方法和系统,包括:将待分割人耳图像和文本描述输入耳廓指代分割模型,模型包括文本编码模块、文本引导的视觉编码模块和视觉解码模块、角度变换模块;文本编码模块得到文本特征;视觉编码模块通过组织成四阶段的结构实现文本特征与图像特征的融合,每个阶段的视觉编码器生成视觉特征,跨模态感知模块对齐与得到多模态特征,中的每个元素由注意力门控模块进行加权获得加权多模态特征,按元素与相加产生增强视觉特征,将输入视觉解码模块逐步恢复图像的空间分辨率,进一步融合文本和视觉特征输出多尺度特征;角度变换模块对多尺度特征进行角度变换,输出与文本描述相关区域的分割掩码。本发明可以对耳廓进行指代分割。
技术关键词
视觉特征 多模态特征 文本 解码模块 多尺度特征 人耳图像 阶段 编码模块 跨模态 注意力 双线性插值 分割方法 分辨率 上采样 冗余特征 非线性
系统为您推荐了相关专利信息
1
一种显示设备及语音检索方法
历史会话 语句 显示设备 语音检索方法 执行语音识别
2
实时语义分割视觉SLAM的方法和装置
SLAM系统 语义分割网络 动态场景 相机位姿估计 视觉
3
一种模型训练方法、装置、电子设备、芯片及介质
节点 模型训练方法 网络特征 长短期记忆网络 模型训练装置
4
一种基于深度学习的摄像头智慧运维方法及系统
历史故障数据 运维方法 关系 文本 智慧运维系统
5
一种基于差速分离的电力金具自动分拣系统及方法
电力金具 输送带组件 分拣系统 分拣执行机构 识别装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号