摘要
本申请涉及语音处理技术领域,提供了一种语音分析方法、装置、计算机设备及可读存储介质,包括:获取预设的业务场景中待分析的对话语音,生成预处理后的语音数据;将预处理后的语音数据转化为文字信息,并提取语音数据的声学特征和文本特征;根据声学特征和文本特征获取基础语言理解和模式识别能力,根据业务场景对应的少量标注样本数据对基础语言理解和模式识别能力进行优化;根据优化后的声学特征和文本特征生成对话特征表示,并对特征表示进行分析,生成业务场景对应的智能决策,完成对对话语音的分析。通过声学与文本特征的深度耦合突破传统语音识别的浅层应用,为金融、医疗健康养老等领域提供了“小数据驱动精准决策”的通用技术路径。
技术关键词
声学特征
模式识别
语音分析方法
文本
频谱特征
韵律特征
数据
计算机设备
决策
深度神经网络架构
业务场景构建
回声消除技术
推荐算法
噪声抑制算法
语义分析方法
时序依赖关系
系统为您推荐了相关专利信息
自动识别方法
短时傅里叶变换
多模态
振动加速度信号
斜拉索
视频异常检测方法
词嵌入向量
编码特征
二分类器
图像编码器
多层感知机
自然语言
信息检索
文本
训练语言模型