基于大模型的实时语音翻译方法及系统

正文

推荐专利

基于大模型的实时语音翻译方法及系统

申请号：CN202510917992

申请日期：2025-07-03

公开号：CN120690199A

公开日期：2025-09-23

类型：发明专利

摘要

本申请实施例提供了一种基于大模型的实时语音翻译方法及系统，属于自然语言技术领域。该方法包括：获取原始语音数据并进行特征提取，得到语音帧特征序列。将语音帧特征序列输入至韵律边界识别模型，得到边界置信度序列。根据边界置信度序列和切分阈值对原始语音数据进行语段切分，得到候选语段集合。根据候选语段集合进行语音识别，得到文本转写序列集合；其中，文本转写序列集合包括多个文本转写序列。根据语义密度评分函数对文本转写序列进行评分，得到语义密度评分。根据语义密度评分在文本转写序列集合中进行选取，得到输入文本序列集合。将输入文本序列集合输入至翻译模型，得到翻译结果，提高了实时语音翻译的准确性。

技术关键词

文本序列实时语音翻译方法翻译模型语义密度自然语言技术语音识别模块数据可读存储介质翻译系统电子设备处理器存储器计算机参数

系统为您推荐了相关专利信息

一种基于偏好的付油路径规划方法、系统及存储介质

路径规划方法油泵节点原油储罐

伪距广义延拓外推方法、装置、计算机设备和介质

伪距观测量异常数据外推模型多普勒外推方法

一种CXCR-2突变体及其制备方法和应用

突变体中枢神经系统疾病重组蛋白大鼠模型序列

面向用户权限管控的大模型归因确权方法、装置和设备

归因度量确权方法模糊语义模糊逻辑

一种基于多模态大模型的对话情感识别方法及设备

情感识别模型情感识别方法多模态注意力情感识别设备

基于大模型的实时语音翻译方法及系统

站点导航

APP 下载