一种基于语音意图的跨模态数据检索方法

正文

推荐专利

一种基于语音意图的跨模态数据检索方法

申请号：CN202510774994

申请日期：2025-06-11

公开号：CN121009215A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于语音意图的跨模态数据检索方法，包括：步骤1、输入查询请求对应的语音，通过语音识别算法将语音转换为文本；步骤2、对文本进行意图解析输出结构化意图表示，对语音识别结果的关键词进行分词，并结合领域词库提取领域标签；步骤3，对本地的数据生成图像特征向量、视觉特征向量、生成文本特征向量和结构化特征；并将各特征及其领域标签存储到ES向量数据库中，每个向量关联对应的领域标签；步骤4，根据用户输入的查询信息开展两阶段匹配，进行多模态检索；步骤5，基于意图解析结果对搜索结果进行过滤，利用过滤条件，筛选得到最终查询结果；步骤6，基于用户反馈进行模型优化，通过在线学习模块实时维护更新向量库。

技术关键词

数据检索方法意图类别文本特征向量语音识别算法图像特征向量标签编码器关键词矩阵两阶段滑动窗口采样声学特征关键帧数据生成图像语义分词注意力

系统为您推荐了相关专利信息

一种用于智能设备的界面布局推荐方法

推荐方法智能设备页面控件元素过渡机制

一种基于Transformer的无监督细胞分割方法

细胞分割方法局部图像特征文本高维特征向量图像块

一种决策方法及基于类脑智能决策的预测模型

决策方法动态记忆体模块 TOPSIS算法矩阵

一种电力设施可视化监测系统及其方法

可视化监测系统多源异构数据处理可视化布局算法可视化界面风险评估模型

基于双向特征融合与混合决策机制的多模态虚假信息检测方法、装置、设备及存储介质

虚假信息检测方法特征融合网络图像特征提取信息检测模块特征提取模块

一种基于语音意图的跨模态数据检索方法

站点导航

APP 下载