一种基于Bounding Box和语义文本双提示的推理分割方法

AITNT
正文
推荐专利
一种基于Bounding Box和语义文本双提示的推理分割方法
申请号:CN202510596953
申请日期:2025-05-09
公开号:CN120525046A
公开日期:2025-08-22
类型:发明专利
摘要
一种基于Bounding Box和语义文本双提示的推理分割方法,属于大语言模型的具身感知领域。本发明构建了基于Bounding Box和语义文本提示的推理分割模型,并构建了有效的训练范式和数据集对推理分割模型进行两阶段训练,合并了语言模型损失和掩码损失,保证两种提示信息有效生成,在文本提示的基础上增加了Bounding Box位置提示,解决了现有技术的分割效果受到模型文本理解能力限制、给予SAM的提示单一的问题,提升了推理分割精度。
技术关键词
分割方法 文本 语义 两阶段 格式 线性 大语言模型 图像 数据 超参数 视觉 尺寸 图片 标签 像素 坐标 指令 精度
系统为您推荐了相关专利信息
1
基于封装大模型训练平台的自动学习引擎装置
并行计算框架 引擎装置 微调方法 超参数 注册事件
2
一种融合动态图卷积网络与Transformer的城市交通流预测方法
交叉注意力机制 时间卷积网络 编码器结构 时序特征 融入语义信息
3
一种按摩设备的音乐控制方法、装置、设备以及存储介质
按摩振子 音乐控制方法 按摩设备 大语言模型 参数
4
基于YOLO与Mamba协同优化的三维图像感知方法
融合策略 图像 融合特征 噪声 注意力机制
5
一种基于电力建设的造价数据管理系统
数据管理系统 曲线 造价 电力 清洗规则
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号