一种基于录音录像的ASR识别增强方法

AITNT
正文
推荐专利
一种基于录音录像的ASR识别增强方法
申请号:CN202510844727
申请日期:2025-06-23
公开号:CN120783758A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于录音录像的ASR识别增强方法。该方法通过融合银行业务双录场景中的音频和环境特征信息,提高金融服务交互过程中语音识别的准确性和合规性。首先,构建针对银行网点环境的声学模型,同时提取客户与工作人员对话的音频特征和交互场景信息。然后,设计金融领域专用词汇识别模块,根据不同业务类型的专业术语库和话语模式,动态调整语言模型参数,有效应对金融产品介绍、风险提示和客户确认等关键环节。与传统ASR系统相比,本发明显著提高了银行业务办理过程中的语音识别准确率,特别在关键术语识别和重要信息提取方面表现突出,为金融服务规范化管理和双录质检提供了更加可靠的技术支持。
技术关键词
银行柜台业务 音频 声学特征 语义关联度 文本识别 频段 场景分类 录像 标签 语音特征 映射关系表 序列 时序分类方法 语音识别准确率 梅尔频率倒谱系数 金融 语言模型得分
系统为您推荐了相关专利信息
1
视频理解方法、装置、电子设备及存储介质
视觉特征 文本识别 视频理解方法 图像 音频识别模块
2
一种移动终端的防盗保护方法和移动终端
防盗保护方法 文本识别模型 移动终端 指数 指令
3
一种基于跨模态数据的多业务承载教学视频分析方法及系统
跨模态数据 知识点 视频分析方法 知识图谱构建 数据采集模块
4
语音合成方法、装置、直播系统、电子设备及存储介质
音频编码 音色特征 大语言模型 文本 语音
5
自动获取用于多模态图像生成模型的专业类数据集的方法
多模态 大语言模型 图像生成模型 专业 图文
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号