说话人语音分割聚类方法、装置及电子设备

正文

推荐专利

说话人语音分割聚类方法、装置及电子设备

申请号：CN202410992158

申请日期：2024-07-23

公开号：CN118737156A

公开日期：2024-10-01

类型：发明专利

摘要

本申请公开了一种说话人语音分割聚类方法、装置及电子设备，涉及语音处理技术领域。方法包括：对待检测语音进行预聚类处理，得到预聚类分割结果；将预聚类分割结果转化为文本，得到文本识别结果；基于文本识别结果，对初始语音跳变点进行动态调整，得到若干文本对数据；根据文本对数据，确定每一个文本对数据对应的跳变概率；基于跳变概率最大的文本对数据，对初始语音跳变点进行修正。通过预分割聚类结果并转文本处理，结合语义领域分析来确定语音跳变点，进而对语音分离方式确定的初始语音跳变点进行修正使其更加精确，解决目前的说话人跳变点的确定不够清晰，导致存在误差的问题。

技术关键词

语音文本识别分割聚类方法训练集数据字符电子设备处理器计算机程序产品动态语句可读存储介质处理单元语义误差

系统为您推荐了相关专利信息

一种基于光纤传感器的气象温度测量方法及系统

温度测量方法气象光纤传感器神经网络模型动态

代客泊车定位方法、装置和车辆

实时位置泊车定位方法 SLAM地图接入点车辆

一种用于主动脉夹层快速筛查与分诊的智能方法与系统

相关性分析技术主动脉血压监督机器学习患者

一种深度学习模型的保护方法

深度学习模型保护方法矩阵保护敏感数据序列

基于贝叶斯优化的钌、锡、铟掺杂富锂锰基电催化剂筛选方法及电子设备和存储介质

筛选方法训练机器学习模型电催化剂富锂锰基材料随机森林

说话人语音分割聚类方法、装置及电子设备

站点导航

APP 下载