摘要
本申请公开了一种语音同传方法、装置、相关设备及计算机程序产品,方法包括:获取当前语音片段的声学特征、历史语音片段的翻译文本,当前语音片段为对输入语音流进行分割后得到的语音片段;将当前语音片段的声学特征、历史语音片段的翻译文本和设定任务指令送入语音同传大模型,得到当前语音片段的翻译文本,其中,设定任务指令用于指示大模型执行源语言到目标语言的翻译任务。本申请通过端到端的语音同传大模型实现语音同传,解决了传统级联式语音同传系统所存在的弊端。通过对输入语音流进行片段拆分,在翻译当前语音片段时,语音同传大模型能够参考历史语音片段的翻译文本,增强了上下文间的联系性,能够提升长语境场景下的同传翻译效果。
技术关键词
语音
声学特征
音频编码器
文本
计算机程序产品
语义
指令
神经网络结构
数据
处理器
级联式
模块
可读存储介质
存储器
参数
电子设备
解码
标签
样本
系统为您推荐了相关专利信息
测试用例排序方法
多臂赌博机
测试用例代码
覆盖率信息
开源项目
数据汇总表
计算机程序产品
预测装置
生成测试用例
构建预测模型
词向量构建方法
CRF模型
地理实体
地名识别
地理信息提取