一种基于录音录像的ASR识别增强方法

正文

推荐专利

一种基于录音录像的ASR识别增强方法

申请号：CN202510844727

申请日期：2025-06-23

公开号：CN120783758A

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于录音录像的ASR识别增强方法。该方法通过融合银行业务双录场景中的音频和环境特征信息，提高金融服务交互过程中语音识别的准确性和合规性。首先，构建针对银行网点环境的声学模型，同时提取客户与工作人员对话的音频特征和交互场景信息。然后，设计金融领域专用词汇识别模块，根据不同业务类型的专业术语库和话语模式，动态调整语言模型参数，有效应对金融产品介绍、风险提示和客户确认等关键环节。与传统ASR系统相比，本发明显著提高了银行业务办理过程中的语音识别准确率，特别在关键术语识别和重要信息提取方面表现突出，为金融服务规范化管理和双录质检提供了更加可靠的技术支持。

技术关键词

银行柜台业务音频声学特征语义关联度文本识别频段场景分类录像标签语音特征映射关系表序列时序分类方法语音识别准确率梅尔频率倒谱系数金融语言模型得分

系统为您推荐了相关专利信息

视频理解方法、装置、电子设备及存储介质

视觉特征文本识别视频理解方法图像音频识别模块

一种移动终端的防盗保护方法和移动终端

防盗保护方法文本识别模型移动终端指数指令

一种基于跨模态数据的多业务承载教学视频分析方法及系统

跨模态数据知识点视频分析方法知识图谱构建数据采集模块

语音合成方法、装置、直播系统、电子设备及存储介质

音频编码音色特征大语言模型文本语音

自动获取用于多模态图像生成模型的专业类数据集的方法

多模态大语言模型图像生成模型专业图文

一种基于录音录像的ASR识别增强方法

站点导航

APP 下载