摘要
本发明提出了一种联合音视频处理的喉麻痹诊断辅助方法,包括以下步骤:获取带有音频信息和视频信息的原始喉镜视频;通过关键词识别模型对所述音频信息进行预测,以提取出有效发声片段,根据音频信息和视频信息的匹配关系从所述原始喉镜视频分割获取有效发声片段对应的第一喉镜片段;检测并识别出所述第一喉镜片段中的声门区域,从所述第一喉镜片段中分割出所述声门区域;对所述声门区域进行标注并计算所述声门区域的物理属性,所述物理属性包括声门区域面积、声带开合角度、声带宽度中的一种或多种。本发明通过利用音视频联合的多模态分析方法,对喉镜视频切分,提取出关键视频片段,并提供多种客观评估指标供医生参考,从而提高诊断效率和质量。
技术关键词
喉镜
诊断辅助方法
音频
关键词
发声
标记置信度
音视频
模态分析方法
分割算法
坐标
顶点
图片
标签
连线
变量
残差模块
注意力机制
列表
滑动窗口
系统为您推荐了相关专利信息
自然语言文本
智能问答方法
知识图谱数据库
命名实体识别
电网设备运行数据
缺陷预测方法
设备缺陷评估
标签
机器学习算法
参数
自然语音
声纹特征
韵律特征
数据生成输出
关键点