摘要
本发明公开了一种基于Transformer的医学语音翻译模型训练方法及医学语音翻译方法,训练方法包括构建语音数据库、建立医学语音翻译模型步骤,翻译方法包括实时语音信号预处理、提取语音信号特征、优化语音信号特征、翻译语音信号、优化翻译结果步骤。本发明基于Transformer网络,通过对实时语音流的特征分析进行实时翻译;建立了融合语音文本双模态特征的医学领域翻译模型,提高了语音翻译准确率;采用Transformer微调模块,通过翻译结果进行参数微调,保证实时翻译文本质量。
技术关键词
翻译模型训练方法
优化语音信号
实时语音
文本
语音翻译方法
语音信号特征
医学专业
音频特征
频谱特征提取
交叉注意力机制
局部感受野
跨模态
语音识别模块
采样率
系统为您推荐了相关专利信息
问答方法
物体
指令
文本
非暂态计算机可读存储介质
视频监控平台
语音对讲方法
标识特征
场景
融合特征