摘要
本申请实施例提供了一种基于大模型的实时语音翻译方法及系统,属于自然语言技术领域。该方法包括:获取原始语音数据并进行特征提取,得到语音帧特征序列。将语音帧特征序列输入至韵律边界识别模型,得到边界置信度序列。根据边界置信度序列和切分阈值对原始语音数据进行语段切分,得到候选语段集合。根据候选语段集合进行语音识别,得到文本转写序列集合;其中,文本转写序列集合包括多个文本转写序列。根据语义密度评分函数对文本转写序列进行评分,得到语义密度评分。根据语义密度评分在文本转写序列集合中进行选取,得到输入文本序列集合。将输入文本序列集合输入至翻译模型,得到翻译结果,提高了实时语音翻译的准确性。
技术关键词
文本
序列
实时语音
翻译方法
翻译模型
语义
密度
自然语言技术
语音识别模块
数据
可读存储介质
翻译系统
电子设备
处理器
存储器
计算机
参数
系统为您推荐了相关专利信息
突变体
中枢神经系统疾病
重组蛋白
大鼠模型
序列
情感识别模型
情感识别方法
多模态
注意力
情感识别设备