一种基于细粒度关系的开放词汇场景图生成方法

AITNT
正文
推荐专利
一种基于细粒度关系的开放词汇场景图生成方法
申请号:CN202510639406
申请日期:2025-05-19
公开号:CN120197617B
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及人工智能技术领域,提供一种基于细粒度关系的开放词汇场景图生成方法,包括对待处理图像进行图像标注和视觉特征提取,分别得到场景图标注信息和视觉特征;对提示文本进行拆解,得到子词单元;进行视觉特征映射得到映射特征,将映射特征和子词单元输入到大语言模型中得到结构化序列,并根据隐藏层位置状态得到归一化边界框坐标;获取隐藏层状态,确定目标类别并根据隐藏层状态和目标类别得到词汇类别得分,并通过词汇类别得分得到子词类别得分,对结构化序列进行词汇替换,得到目标结构化序列;进行特殊词汇分割和词汇提取,得到三元关系组,从而得到目标场景图。本发明可以对待处理图像进行高效标注。
技术关键词
生成方法 场景 视觉特征提取 序列 关系 多层感知机 图像 解码器 坐标 实体 文本 人工智能技术 分块 标记 标签 算法
系统为您推荐了相关专利信息
1
一种基于大语言模型微调的文本到SQL生成方法及系统
大语言模型 生成方法 三元组 文本 数据
2
一种考虑振动噪声的风力发电机剩余寿命预测方法
剩余寿命预测方法 振动噪声 概率密度函数 风力发电机 剩余寿命预测模型
3
一种基于微滴式数字PCR的法医多种体液年龄预测方法及应用
年龄预测方法 微滴式数字 引物探针组合物 多元线性回归模型 生物标志物
4
一种基于视觉经验检索的大脑刺激重建方法、介质及设备
线索 视觉 多层感知器 Sigmoid函数 模拟人类大脑
5
一种数据资产价格评估方法及系统
价格评估方法 业务系统 时间序列预测模型 收益预测方法 单周期
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号