使用生成式语言模型对图像的语义标记

AITNT
正文
推荐专利
使用生成式语言模型对图像的语义标记
申请号:CN202411616814
申请日期:2024-11-13
公开号:CN120014642A
公开日期:2025-05-16
类型:发明专利
摘要
本申请的实施例涉及使用生成式语言模型对图像的语义标记。一种计算系统包括被配置为接收图像的一个或多个处理设备。处理设备还被配置为计算标识图像中包括的关注区域的分割掩模。在特征提取器处,处理设备还被配置为基于图像来计算编码图像特征。处理设备还被配置为接收文本指令。在视觉重采样器处,处理设备还被配置为基于分割掩模、编码图像特征和文本指令来计算掩模查询。在生成式语言模型处,处理设备还被配置为接收包括掩模查询和文本指令的自然语言查询。基于自然语言查询,在生成式语言模型处,处理设备还被配置为生成并输出与关注区域相关联的语义标签。
技术关键词
上下文查询 训练语料库 采样器 自然语言 语义标签 分割掩模 图像 变换器 模式 文本 视觉 掩膜 注意力 基准 指令 编码 标识 符号
系统为您推荐了相关专利信息
1
一种基于问题匹配检索的增强生成方法
生成方法 相似性度量函数 数据组织形式 深度神经网络模型 智能排版
2
一种基于自适应图强化学习的谣言检测方法、装置及设备
谣言检测方法 神经网络模型 社交媒体平台 数据收集模块 可读存储介质
3
一种基于Python的批量提取PDF数据要素化高效方法
图形化用户界面 预览功能 计算机视觉技术 关系型数据库 支持跨平台
4
一种人工智能模型加速训练推理方法及装置
块对角矩阵 人工智能模型 叠层 矩阵分解技术 分块
5
一种基于自然语言大模型的企业管理制度问答系统
问答系统 自然语言 源节点 多层感知器 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号