基于AI大模型的跨语言语音翻译方法、装置以及设备

正文

推荐专利

申请号：CN202411958846

申请日期：2024-12-30

公开号：CN119378571B

公开日期：2025-04-18

类型：发明专利

摘要

本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备，包括：对跨语言语音数据进行分帧以及频谱分析，得到频谱序列；将所述频谱序列输入预先训练完成的AI大模型中；基于特征捕捉路径，通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装，得到封装特征；基于全局关联路径，通过图神经网络将所述频谱序列中的各频谱特征构建为图结构，挖掘出各频谱特征之间的全局语义关联特征；对所述不同频段的频谱特征对应的封装特征进行加权融合，得到融合封装特征，将融合封装特征与所述全局语义关联特征进行聚合，得到聚合特征；基于所述聚合特征，翻译得到目标语言的语音数据。在本发明中，提高了跨语言翻译的准确性。

技术关键词

频谱特征语音翻译方法胶囊网络语义序列密钥生成器频段混沌系统节点多层感知机语音翻译装置数据映射算法封装单元符号非线性分析单元处理器

系统为您推荐了相关专利信息

基于大模型的深度隐私泄露检测方法

隐私泄露检测方法上下文感知解析模式检测高风险多模态

一种基于深度学习目标检测的动态环境SLAM方法

SLAM方法特征点静态特征像素点动态物体

一种无人值守的实验室管理系统

实验室管理系统样本条码自动识别生化免疫检测设备机器学习方法

一种用于非道路移动机械的快速精准NOx检测系统

非道路移动机械数据处理模块数据校正时间序列分析方法温度校正

基于多关系深度检索文本匹配的人名消歧方法

语义向量地理信息数据企业文本注意力

基于AI大模型的跨语言语音翻译方法、装置以及设备

站点导航

APP 下载