摘要
本申请公开了一种音视频通话的同译同传方法及系统、计算机装置。其中方法包括:建立点对点语音通话通道;获取第一通话端的语音信息;对语音信息进行断句,获得N个会话语音段;将N个会话语音段按照时间顺序转化为N个文字文本段;基于第一通话端的目标语种,对N个文字文本段进行翻译,获取N个文字文本翻译信息;基于N个文字文本翻译信息获得N个目标语音段;基于点对点语音通话通道将N个目标语音段根据时间顺序发送至第二通话端;第二通话端根据时间顺序依次播放N个目标语音段。该方法能够实现进行音视频通话的同译同传,实时性强,同步率高,同译同传流畅度高,准确率高,此外,还能满足在多语言环境下的语音通话。
技术关键词
音视频
点对点
文本
计算机装置
发声
会话
流媒体转发服务器
通道
智能语音
样本
输入输出模块
生物识别技术
指令
处理器
机器学习算法
可读存储介质
分类器
计算机程序产品
系统为您推荐了相关专利信息
图像生成系统
大语言模型
意图识别
工程系统
训练样本集
生成方法
相似性度量函数
数据组织形式
深度神经网络模型
智能排版
序列
语义向量
装备维修保障
BiLSTM模型
分词
配电网拓扑
神经网络模型
电网故障定位
节点特征
梯度下降法
展示设备
多模态
数据处理模块
数据处理中心
感知哈希算法