基于语言表达的任意类别计数模型及其计数方法

正文

推荐专利

申请号：CN202410948085

申请日期：2024-07-16

公开号：CN118965058A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于语言表达的任意类别计数模型及其计数方法，计数模型包括指代表达理解模块和视觉计数回归模块，指代表达理解模块用来将输入的自然语言或文本描述进行特征标记嵌入、特征提取、特征融合等处理，预测出原始图像中的目标模板信息；视觉计数回归模块用来根据目标模板信息和原始图像进行特征提取和相似性学习，最终输出目标实例在原始图像场景中的预测数量。本发明通过指代表达理解模块来引导零样本计数，能够解析、理解人类自然语言并预测准确的目标模板，通过视觉计数回归模块对目标模板信息和原始图像进行特征提取和相似性学习，实现更一般化与智能化的计数功能，具有节省计算资源、快速识别位置、应用泛化性高的特点。

技术关键词

计数方法语言编码器模板特征语义交叉注意力机制浅层特征提取理解人类自然语言视觉图像编码标记文本场景特征代表模块多模态信息分支网络

系统为您推荐了相关专利信息

一种基于知识图谱的推荐方法、装置、介质和设备

三元组推荐方法项目邻居机制

基于状态空间模型的高光谱图像分类方法及装置

光谱图像分类方法状态空间模型空间模块分段扫描模块

模型架构生成方法及装置、电子设备、存储介质

生成方法网络策略融合规则图像处理

一种基于语义匹配提示的大模型数据库查询生成方法、系统、设备和介质

查询生成方法数据库查询语句语义向量 LSTM模型大语言模型

基于AI的智能客户沟通辅助管控方法及系统

分段管控方法客户可执行程序代码订单

基于语言表达的任意类别计数模型及其计数方法

站点导航

APP 下载