基于RAG的领域化语音识别方法及系统

正文

推荐专利

基于RAG的领域化语音识别方法及系统

申请号：CN202411807582

申请日期：2024-12-10

公开号：CN119296516B

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种基于RAG的领域化语音识别方法及系统，该方法包括获取原始领域文档集，通过主题分类、段落切分和句子切分构建分层文档结构，执行向量化处理生成多粒度向量矩阵集，建立层次化知识向量索引结构；对实时音频流进行多尺度时频分析，提取并增强声学特征，生成多尺度特征张量；对特征张量执行自适应分块和递进式注意力处理，构建概率估计模型，生成候选文本序列；基于多维查询向量在知识索引中执行多层检索，生成相关知识片段；对特征进行空间映射和动态注意力处理，执行概率优化解码得到最终识别文本。本发明通过知识增强和多层次特征处理，提升了专业领域语音识别的准确性和鲁棒性。

技术关键词

矩阵语音识别方法频谱特征注意力生成主题序列索引文本 MFCC特征上下文特征分块动态规划算法融合特征多尺度特征事件特征层级语义声学特征

系统为您推荐了相关专利信息

基于条件嵌入融合扩散模型的稀疏视角CT重建方法

CT重建方法视角注意力随机噪声生成机制

配电网新用户用电时序负荷预测方法、系统、装置及介质

时序生成对抗网络卡尔曼滤波算法 SVM算法负荷预测方法

一种基于预生成token的星载大模型投机解码方法和装置

文本生成模型解码方法序列字典键值

一种基于机器视觉的动物踪迹监控方法及系统

图像特征描述子监控方法准确位置信息特征点集合动物

基于分区过滤网络的虚假新闻检测方法及系统

情感特征谣言文本 BERT模型事件特征

基于RAG的领域化语音识别方法及系统

站点导航

APP 下载