说话人语音提取系统训练方法、电子设备、存储介质和程序产品

AITNT
正文
推荐专利
说话人语音提取系统训练方法、电子设备、存储介质和程序产品
申请号:CN202510376740
申请日期:2025-03-27
公开号:CN120089156A
公开日期:2025-06-03
类型:发明专利
摘要
本申请公开一种说话人语音提取系统训练方法、电子设备、存储介质和程序产品,所述系统包括,目标说话人提取骨干模块和关键词引导的目标说话人编码器;所述方法包括:将第一混叠语音样本和第一目标关键词输入至所述关键词引导的目标说话人编码器进行训练;将第二混叠语音样本和第二目标关键词输入至训练后的所述关键词引导的目标说话人编码器得到第二目标说话人嵌入;将所述第二混叠语音样本和所述第二目标说话人嵌入输入至所述目标说话人提取骨干模块进行训练。本申请训练得到的说话人语音提取系统能够在不进行预先注册用户音频的情况下,实现对目标说话人语音的提取。
技术关键词
关键词 系统训练方法 语音特征 样本 混合编码器 语音编码器 前馈神经网络 电子设备 特征提取器 指令 模块 计算机程序产品 处理器通信 可读存储介质 存储器 机制
系统为您推荐了相关专利信息
1
多模态知识图谱应用系统和计算机可读介质
三元组 图谱 实体关系数据 处理器 多模态
2
公路瓶颈区车道级可变限速控制方法
可变限速控制方法 车道 瓶颈 公路 交通状态信息
3
基于特征交互的视频推荐方法、装置、设备及存储介质
点击概率 视频推荐方法 多头注意力机制 交互特征 计算机可读指令
4
基于动态监测风味物质释放的白酒价位识别方法及装置
动态监测数据 风味物质 预测白酒 白酒品牌 训练神经网络模型
5
一种基于约束和优化的雷达非均衡目标类别识别方法
类别识别方法 雷达 引入权重因子 样本 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号