医疗辅助用字幕生成模型的构建方法、装置、设备及介质

正文

推荐专利

申请号：CN202411731897

申请日期：2024-11-27

公开号：CN119676389B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及数字医疗技术领域，尤其涉及一种医疗辅助用字幕生成模型的构建方法、装置、设备及介质。该方法使用编码器提取听障测试音频的音频特征，将音频特征和噪声信息融合，使用解码器解码融合结果，得到初始生成字幕，使用自然性鉴别器对初始生成字幕的自然性预测，得到第一预测值，使用语义鉴别器对初始生成字幕和听障测试音频的语义相关性预测，得到第二预测值，计算初始生成字幕和标签字幕的相似度，根据第一预测值、第二预测值和相似度，更新编码器和解码器，由更新好的编码器和解码器形成字幕生成模型，通过多维度监督，提高了神经网络进行生成字幕的仿真程度，通过加噪方式令生成字幕具备多样化特点，提高听障患者获取音频信息的体验。

技术关键词

生成字幕解码器音频特征语义特征噪声信息门控循环单元标签数字医疗技术参数更新模块计算机设备音频编码器序列可读存储介质特征提取模块

系统为您推荐了相关专利信息

基于Transformer的医学语音翻译模型训练方法及医学语音翻译方法

翻译模型训练方法优化语音信号实时语音文本语音翻译方法

一种基于深度学习的图像生成方法及装置

图像生成装置图像生成方法生成多尺度自然语言动态更新

基于深浅层时空特征的屏幕内容视频质量评价方法及装置

自然场景统计关键帧特征提取模块视频空间特征提取

一种基于广度视角的虚假新闻检测方法

帖子视角快照语义特征预训练模型

一种基于深度学习与多模态融合的溶栓预测方法

组学特征图像配准多模态分支线性时间复杂度

医疗辅助用字幕生成模型的构建方法、装置、设备及介质

站点导航

APP 下载