基于AI大模型的跨语言语音翻译方法、装置以及设备

AITNT
正文
推荐专利
基于AI大模型的跨语言语音翻译方法、装置以及设备
申请号:CN202411958846
申请日期:2024-12-30
公开号:CN119378571B
公开日期:2025-04-18
类型:发明专利
摘要
本发明提供了一种基于AI大模型的跨语言语音翻译方法、装置以及设备,包括:对跨语言语音数据进行分帧以及频谱分析,得到频谱序列;将所述频谱序列输入预先训练完成的AI大模型中;基于特征捕捉路径,通过胶囊网络对所述频谱序列中不同频段的频谱特征进行向量封装,得到封装特征;基于全局关联路径,通过图神经网络将所述频谱序列中的各频谱特征构建为图结构,挖掘出各频谱特征之间的全局语义关联特征;对所述不同频段的频谱特征对应的封装特征进行加权融合,得到融合封装特征,将融合封装特征与所述全局语义关联特征进行聚合,得到聚合特征;基于所述聚合特征,翻译得到目标语言的语音数据。在本发明中,提高了跨语言翻译的准确性。
技术关键词
频谱特征 语音翻译方法 胶囊网络 语义 序列 密钥生成器 频段 混沌系统 节点 多层感知机 语音翻译装置 数据 映射算法 封装单元 符号 非线性 分析单元 处理器
系统为您推荐了相关专利信息
1
基于大模型的深度隐私泄露检测方法
隐私泄露检测方法 上下文感知解析 模式检测 高风险 多模态
2
一种基于深度学习目标检测的动态环境SLAM方法
SLAM方法 特征点 静态特征 像素点 动态物体
3
一种无人值守的实验室管理系统
实验室管理系统 样本 条码自动识别 生化免疫检测设备 机器学习方法
4
一种用于非道路移动机械的快速精准NOx检测系统
非道路移动机械 数据处理模块 数据校正 时间序列分析方法 温度校正
5
基于多关系深度检索文本匹配的人名消歧方法
语义向量 地理信息数据 企业 文本 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号