一种语音问答场景下的RAG召回率提升方法及装置

正文

推荐专利

申请号：CN202511040109

申请日期：2025-07-28

公开号：CN120913552A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种语音问答场景下的RAG召回率提升方法及装置，涉及数据处理的技术领域，方法包括：对包含语音识别结果的原始语料进行语义清洗处理，并对清洗后的原始语料进行语义压缩，并利用多个候选嵌入向量生成模型分别执行向量生成操作，输出词向量；针对每个词向量，计算语义保真度得分；对多个语义保真度得分进行评估，选择多个候选嵌入向量生成模型中，语义保真度得分最优的目标嵌入向量生成模型；针对数据输入计算每个词语的词频值与逆文档频率值，判别词语是否为专业热词，筛选出专业热词构建热词词表；将目标嵌入向量生成模型输出的嵌入向量与热词词表联合输入至问答模块，输出目标答案文本。本发明能够提高语音问答场景下的RAG召回率。

技术关键词

问答场景词语语音语义向量训练样本集数据专业分词频率网络接口机制输出模块电子设备答案可读存储介质算法设备通信文本

系统为您推荐了相关专利信息

基于机器学习的公路交通安全风险预警方法

交通安全风险预警模型交通事故数据训练样本集风险预警方法

一种智慧座舱系统及其生物信号异常检测方法、装置、设备、介质及产品

生命体征数据信号异常检测方法语音识别模块共享位置信息信号异常检测装置

基于多模态大模型与图RAG的机器人语义地图构建方法

语义数据库语义地图构建方法图片多模态语义向量

一种智能语音助手的个性化语言模型构建方法

语言模型构建方法智能语音助手数据采集机构深度学习算法内容智能推荐

一种自动驾驶营运车辆远程协助系统及方法

远程协助系统营运车辆车辆自动驾驶系统车辆运行状态平台

一种语音问答场景下的RAG召回率提升方法及装置

站点导航

APP 下载