摘要
本发明涉及人工智能技术领域,可应用于医疗健康、金融科技等业务系统平台中,公开了重音识别方法、装置、计算机设备及存储介质,其中,通过获取目标音频数据;对所述目标音频数据进行分析,提取所述目标音频数据的声纹特征、梅尔频谱和基频特征;将所述声纹特征、所述梅尔频谱和所述基频特征进行融合,得到融合特征;将所述融合特征输入预训练的重音检测模型,通过所述重音检测模型生成重音检测结果;基于所述重音检测结果,通过预设的检测阈值生成所述目标音频数据的重音识别结果;从而通过本发明可以有效提高重音识别的准确性和效率。
技术关键词
重音识别方法
声纹特征
融合特征
音频
数据
基频轮廓
格式
计算机设备
语音输入装置
短时傅里叶变换
可读存储介质
人工智能技术
医疗健康
处理器
业务系统
识别装置
分析模块
采样率
信号
系统为您推荐了相关专利信息
节点
温度监测系统
终端
配电线路状态监测
数传电台
画像分析方法
风险评估模型训练
指标
内容推荐算法
客户端