摘要
本申请涉及一种混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品。通过语种文本识别模型识别语音中的各个语种对应的各个文本段,通过多个语种的文本段样本训练多个标点预测模型,由对应语种的各个标点预测模型根据输入的文本段输出对应的各个标点预测结果,根据各个标点预测结果,在对应的各个文本段中的添加对应的各个标点信息。相较于传统的按照固定语种进行标点添加的方式,本方案通过多个语种的文本段样本训练多个标点预测模型,对混合多个语种的语音进行对应语种的文本段识别,根据文本段的语种,通过对应的标点预测模型对文本段进行标点预测,提高了对混合多种语音的识别文本进行标点预测的准确度。
技术关键词
文本识别模型
字符
语音活动检测系统
混合语音识别
标点预测方法
文字词典
概率分布函数
条件随机场
序列
样本
计算机设备
可读存储介质
计算机程序产品
处理器
预测装置
模块
存储器
系统为您推荐了相关专利信息
生成会议纪要
会议纪要生成方法
主题
音频
专业词库
自定义事件
通信方法
JSON字符串
通信系统
异步方式
关键词
信息抽取模型
事件分类方法
计算机执行指令
纠错
钥匙管理方法
编码
核电站
编辑距离算法
钥匙管理系统