说话人语音分割聚类方法、装置及电子设备

AITNT
正文
推荐专利
说话人语音分割聚类方法、装置及电子设备
申请号:CN202410992158
申请日期:2024-07-23
公开号:CN118737156A
公开日期:2024-10-01
类型:发明专利
摘要
本申请公开了一种说话人语音分割聚类方法、装置及电子设备,涉及语音处理技术领域。方法包括:对待检测语音进行预聚类处理,得到预聚类分割结果;将预聚类分割结果转化为文本,得到文本识别结果;基于文本识别结果,对初始语音跳变点进行动态调整,得到若干文本对数据;根据文本对数据,确定每一个文本对数据对应的跳变概率;基于跳变概率最大的文本对数据,对初始语音跳变点进行修正。通过预分割聚类结果并转文本处理,结合语义领域分析来确定语音跳变点,进而对语音分离方式确定的初始语音跳变点进行修正使其更加精确,解决目前的说话人跳变点的确定不够清晰,导致存在误差的问题。
技术关键词
语音 文本识别 分割聚类方法 训练集 数据 字符 电子设备 处理器 计算机程序产品 动态 语句 可读存储介质 处理单元 语义 误差
系统为您推荐了相关专利信息
1
一种基于光纤传感器的气象温度测量方法及系统
温度测量方法 气象 光纤传感器 神经网络模型 动态
2
代客泊车定位方法、装置和车辆
实时位置 泊车定位方法 SLAM地图 接入点 车辆
3
一种用于主动脉夹层快速筛查与分诊的智能方法与系统
相关性分析技术 主动脉 血压 监督机器学习 患者
4
一种深度学习模型的保护方法
深度学习模型 保护方法 矩阵 保护敏感数据 序列
5
基于贝叶斯优化的钌、锡、铟掺杂富锂锰基电催化剂筛选方法及电子设备和存储介质
筛选方法 训练机器学习模型 电催化剂 富锂锰基材料 随机森林
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号