基于语言表达的任意类别计数模型及其计数方法

AITNT
正文
推荐专利
基于语言表达的任意类别计数模型及其计数方法
申请号:CN202410948085
申请日期:2024-07-16
公开号:CN118965058A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开了一种基于语言表达的任意类别计数模型及其计数方法,计数模型包括指代表达理解模块和视觉计数回归模块,指代表达理解模块用来将输入的自然语言或文本描述进行特征标记嵌入、特征提取、特征融合等处理,预测出原始图像中的目标模板信息;视觉计数回归模块用来根据目标模板信息和原始图像进行特征提取和相似性学习,最终输出目标实例在原始图像场景中的预测数量。本发明通过指代表达理解模块来引导零样本计数,能够解析、理解人类自然语言并预测准确的目标模板,通过视觉计数回归模块对目标模板信息和原始图像进行特征提取和相似性学习,实现更一般化与智能化的计数功能,具有节省计算资源、快速识别位置、应用泛化性高的特点。
技术关键词
计数方法 语言编码器 模板特征 语义 交叉注意力机制 浅层特征提取 理解人类自然语言 视觉 图像编码 标记 文本 场景特征 代表 模块 多模态信息 分支 网络
系统为您推荐了相关专利信息
1
一种基于知识图谱的推荐方法、装置、介质和设备
三元组 推荐方法 项目 邻居 机制
2
基于状态空间模型的高光谱图像分类方法及装置
光谱图像分类方法 状态空间模型 空间模块 分段 扫描模块
3
模型架构生成方法及装置、电子设备、存储介质
生成方法 网络 策略 融合规则 图像处理
4
一种基于语义匹配提示的大模型数据库查询生成方法、系统、设备和介质
查询生成方法 数据库查询语句 语义向量 LSTM模型 大语言模型
5
基于AI的智能客户沟通辅助管控方法及系统
分段 管控方法 客户 可执行程序代码 订单
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号