基于意图识别的结构化视觉定位方法、系统及设备

正文

推荐专利

申请号：CN202411861774

申请日期：2024-12-17

公开号：CN119848277A

公开日期：2025-04-18

类型：发明专利

摘要

本申请涉及视觉定位技术领域，公开了一种基于意图识别的结构化视觉定位方法、系统及设备，包括：获取待定位图像和用户的当前语音指令；将所述当前语音指令输入预先训练好的意图识别模型进行语义结构化处理，以构建语义拓扑图；其中，所述语义拓扑图用于描述所述当前语音指令对应的目标结构化数据；基于所述语义拓扑图进行推理，得到所述当前语音指令对应的语义指代；对所述语义指代和所述待定位图像进行特征对齐，以在所述待定位图像中定位与所述语义指代匹配的目标对象。本申请通过对语音指令的语义结构化处理，能够对含有口语化语言指令的语义进行精准推理，从而大大提高了视觉定位系统的鲁棒性，有利于提高日常对话场景中的视觉定位效果。

技术关键词

拓扑图意图识别模型视觉定位方法数据格式视觉定位系统图像特征向量因子三元组视觉定位技术语义特征提取图像特征提取样本对象对齐模块滑动窗口存储器

系统为您推荐了相关专利信息

一种基于5G的列车车地通信方法和系统

列车车地通信方法数字孪生模型通信节点受限历史运行数据

一种基于规则引擎的入海排污口信息监管方法及系统

信息监管方法时序融合算法生态敏感区挖掘算法

基于多台一机多用装置协调控制的台区电能质量治理方法和系统

分布式模型多用装置治理装置电力设备序列

基于多模态数据的诊疗交互系统及方法

交互系统意图识别模型多模态特征实时数据采集非暂态计算机可读介质

一种动态表单生成方法、装置、计算机设备及存储介质

动态表单生成方法意图类别意图识别模型查询关键词客户

基于意图识别的结构化视觉定位方法、系统及设备

站点导航

APP 下载