一种联合音视频处理的喉麻痹诊断辅助方法

AITNT
正文
推荐专利
一种联合音视频处理的喉麻痹诊断辅助方法
申请号:CN202410849050
申请日期:2024-06-27
公开号:CN118743534B
公开日期:2025-06-06
类型:发明专利
摘要
本发明提出了一种联合音视频处理的喉麻痹诊断辅助方法,包括以下步骤:获取带有音频信息和视频信息的原始喉镜视频;通过关键词识别模型对所述音频信息进行预测,以提取出有效发声片段,根据音频信息和视频信息的匹配关系从所述原始喉镜视频分割获取有效发声片段对应的第一喉镜片段;检测并识别出所述第一喉镜片段中的声门区域,从所述第一喉镜片段中分割出所述声门区域;对所述声门区域进行标注并计算所述声门区域的物理属性,所述物理属性包括声门区域面积、声带开合角度、声带宽度中的一种或多种。本发明通过利用音视频联合的多模态分析方法,对喉镜视频切分,提取出关键视频片段,并提供多种客观评估指标供医生参考,从而提高诊断效率和质量。
技术关键词
喉镜 诊断辅助方法 音频 关键词 发声 标记置信度 音视频 模态分析方法 分割算法 坐标 顶点 图片 标签 连线 变量 残差模块 注意力机制 列表 滑动窗口
系统为您推荐了相关专利信息
1
面向多说话人环境的语音识别方法、装置与电子设备
音频 文本 语音识别方法 自动语音识别技术 数据
2
一种实时语音翻译合成的音画字幕对齐方法及系统
实时语音 对齐方法 分片 字幕 翻译语言
3
基于语音激活的知识图谱数据智能问答方法及系统
自然语言文本 智能问答方法 知识图谱数据库 命名实体识别 电网设备运行数据
4
一种基于机器学习的设备缺陷预测方法及系统
缺陷预测方法 设备缺陷评估 标签 机器学习算法 参数
5
基于AI语音克隆与口型同步的视频生成方法及系统
自然语音 声纹特征 韵律特征 数据生成输出 关键点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号