摘要
本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备,包括:对跨语言语音数据进行分帧以及频谱分析,得到频谱序列;将所述频谱序列输入预先训练完成的AI大模型中;基于特征捕捉路径,通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装,得到封装特征;基于全局关联路径,通过图神经网络将所述频谱序列中的各频谱特征构建为图结构,挖掘出各频谱特征之间的全局语义关联特征;对所述不同频段的频谱特征对应的封装特征进行加权融合,得到融合封装特征,将融合封装特征与所述全局语义关联特征进行聚合,得到聚合特征;基于所述聚合特征,翻译得到目标语言的语音数据。在本发明中,提高了跨语言翻译的准确性。
技术关键词
频谱特征
语音翻译方法
胶囊网络
语义
序列
密钥生成器
频段
混沌系统
节点
多层感知机
语音翻译装置
数据
映射算法
封装单元
符号
非线性
分析单元
处理器
系统为您推荐了相关专利信息
隐私泄露检测方法
上下文感知解析
模式检测
高风险
多模态
实验室管理系统
样本
条码自动识别
生化免疫检测设备
机器学习方法
非道路移动机械
数据处理模块
数据校正
时间序列分析方法
温度校正