混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202411038721

申请日期：2024-07-31

公开号：CN119106658B

公开日期：2025-04-25

类型：发明专利

摘要

本申请涉及一种混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品。通过语种文本识别模型识别语音中的各个语种对应的各个文本段，通过多个语种的文本段样本训练多个标点预测模型，由对应语种的各个标点预测模型根据输入的文本段输出对应的各个标点预测结果，根据各个标点预测结果，在对应的各个文本段中的添加对应的各个标点信息。相较于传统的按照固定语种进行标点添加的方式，本方案通过多个语种的文本段样本训练多个标点预测模型，对混合多个语种的语音进行对应语种的文本段识别，根据文本段的语种，通过对应的标点预测模型对文本段进行标点预测，提高了对混合多种语音的识别文本进行标点预测的准确度。

技术关键词

文本识别模型字符语音活动检测系统混合语音识别标点预测方法文字词典概率分布函数条件随机场序列样本计算机设备可读存储介质计算机程序产品处理器预测装置模块存储器

系统为您推荐了相关专利信息

会议纪要生成方法、装置、电子设备及存储介质

生成会议纪要会议纪要生成方法主题音频专业词库

一种基于JavaScript环境与虚幻引擎5的通信方法及系统

自定义事件通信方法 JSON字符串通信系统异步方式

古籍数字的处理方法和装置

像素点符号尺寸数学重构

事件分类方法、设备及介质

关键词信息抽取模型事件分类方法计算机执行指令纠错

核电站的钥匙管理方法、系统及计算机可读存储介质

钥匙管理方法编码核电站编辑距离算法钥匙管理系统

混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载