摘要
本申请公开了一种说话人语音分割聚类方法、装置及电子设备,涉及语音处理技术领域。方法包括:对待检测语音进行预聚类处理,得到预聚类分割结果;将预聚类分割结果转化为文本,得到文本识别结果;基于文本识别结果,对初始语音跳变点进行动态调整,得到若干文本对数据;根据文本对数据,确定每一个文本对数据对应的跳变概率;基于跳变概率最大的文本对数据,对初始语音跳变点进行修正。通过预分割聚类结果并转文本处理,结合语义领域分析来确定语音跳变点,进而对语音分离方式确定的初始语音跳变点进行修正使其更加精确,解决目前的说话人跳变点的确定不够清晰,导致存在误差的问题。
技术关键词
语音
文本识别
分割聚类方法
训练集
数据
字符
电子设备
处理器
计算机程序产品
动态
语句
可读存储介质
处理单元
语义
误差
系统为您推荐了相关专利信息
温度测量方法
气象
光纤传感器
神经网络模型
动态
实时位置
泊车定位方法
SLAM地图
接入点
车辆
筛选方法
训练机器学习模型
电催化剂
富锂锰基材料
随机森林