摘要
本发明涉及人工智能领域,可应用于金融科技、医疗健康等业务系统平台中,公开了基于强化学习的声纹模型优化方法、装置、设备及介质,包括:采集声纹模型的历史识别案例构建优化数据集;随机初始化策略网络,从优化数据集中采样音频数据输入到声纹模型中按初始化策略进行声纹识别,得到识别结果与奖励值;根据识别结果与奖励值计算优势函数,基于优势函数对策略网络进行参数更新;根据策略网络更新前后的参数对包含KL散度项的目标函数进行优化;循环执行上述过程直到获得最优的策略网络;基于最优的策略网络控制声纹模型按最优策略进行声纹识别,以优化识别结果。通过强化学习与KL散度约束实现对声纹模型的可靠优化,提高声纹模型的识别准确性。
技术关键词
声纹模型
策略更新
非易失性计算机可读存储介质
音频
计算机可执行指令
样本
参数
医疗健康
数据采集模块
网络控制
优化装置
处理器通信
业务系统
计算机设备
存储器
系统为您推荐了相关专利信息
远程拾音器
麦克风阵列采集
驻极体麦克风
电子线路板
电源管理芯片
语音特征
文本
语音生成模型
大语言模型
生成方法
语义向量
音频
数据降噪方法
傅里叶变换处理
注意力
机器学习模型
计算机可执行指令
时间段
模型更新
数据