一种基于混合模型的指向性图像分割方法及系统

AITNT
正文
推荐专利
一种基于混合模型的指向性图像分割方法及系统
申请号:CN202510701029
申请日期:2025-05-28
公开号:CN120563842B
公开日期:2025-12-02
类型:发明专利
摘要
本发明提出了一种基于混合模型的指向性图像分割方法及系统,属于计算机视觉技术领域,包括:获取图像及文本描述数据集;构建双分支视觉‑语言编码架构对图像进行编码提取若干不同尺度的视觉特征,并同时对文本描述进行编码,提取文本特征;采用多尺度跨模态注意力模块对同一尺度的视觉特征和文本特征进行跨模态融合,生成多模态特征;对各个尺度的多模态特征分别采用分层特征融合模块进行融合得到第一融合特征;采用跨层级信息整合模块进行层间特征的融合得到最终融合特征;采用分割模块对最终融合特征进行预测得到分割后的图像。本发明结合CNN和Transformer架构的优势,以提升指向性图像分割任务的精度和泛化能力。
技术关键词
图像分割方法 融合特征 视觉特征 多模态特征 跨模态 文本 分层特征 多尺度 分支 注意力机制 编码 融合策略 模块 图像分割系统 表达式 计算机视觉技术 层级
系统为您推荐了相关专利信息
1
一种多注意力引导的医学图像分割方法
医学图像分割模型 医学图像分割方法 注意力 解码器 梯度下降优化算法
2
一种基于跨模态大模型的末端空调调控方法
空调调控方法 跨模态 文本 适配器技术 设备健康管理
3
面向特定领域多模态神经机器翻译的两阶段语义聚合方法
机器翻译 语义 阶段 图文 多层次
4
一种基于时空动态网络的交通预警方法及装置
交通预警方法 多源交通数据 依赖特征 语义特征 交通预警装置
5
一种基于文字-3D图像的多模态脑卒中预测方法
图像特征编码 BERT模型 自然语言 样本 跨模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号