一种基于检索增强的执法记录仪音频语义检索方法及系统

正文

推荐专利

申请号：CN202510437140

申请日期：2025-04-09

公开号：CN119961482B

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及语音识别与自然语言处理技术领域，具体公开了一种基于检索增强的执法记录仪音频语义检索方法及系统，系统包括：数据获取模块，用于获取音频数据和文本查询；语音适配器模块，用于将音频数据投影到文本嵌入空间，得到语音表示；跨模态检索器，用于对语音表示和文本查询进行跨模态检索，得到语音Tokens；语音语言模型，用于得到的文字假设；查询生成模块，用于提取可能包含实体名称的查询片段；实体检索模块，用于根据查询片段，检索实体数据库，得到相关实体名称；上下文构建模块，用于构建上下文信息；大语言模型，用于得到语义检索结果。本发明提高执法记录仪音频中实体名称和关键信息的识别与检索准确性。

技术关键词

执法记录仪语义检索系统语义检索方法语音适配器音频语音编码器大语言模型跨模态文本检索方法命名实体识别模型数据获取模块注意力层级采样器

系统为您推荐了相关专利信息

一种基于智能穿戴设备的智能音频动态控制方法

智能穿戴设备动态控制方法音频发声喇叭

事件测量方法和电子设备

超声信号音频编解码器接近传感器算法加速度

基于可穿戴设备的音频处理方法、装置、设备及存储介质

音频可穿戴设备信号回声消除波束成形算法

一种基于视觉计算的舞蹈姿态动作识别、交互方法及系统

轮廓信息交互终端比例模型音乐交互方法

一种基于唇部动作的政务场景多模态语音交互方法

多模态语音交互方法语音特征高灵敏度麦克风多模态信息融合

一种基于检索增强的执法记录仪音频语义检索方法及系统

站点导航

APP 下载