摘要
本发明公开了听诊音数据挖掘方法以及装置,其方法实现包括:获取训练数据集,训练数据集包括标注训练数据以及未标注训练数据;基于标注训练数据对主模型以及辅模型进行迭代训练,以得到模型池,模型池包括初步训练完成的主模型以及辅模型;将未标注训练数据分别输入至初步训练完成的主模型以及辅模型中进行分类处理,得到分类结果;对分类结果进行数据筛选,得到高价值数据;将高价值数据进行标注后,与标注训练数据进行合并,以作为新的标注训练数据;基于新的标注训练数据对所述初步训练完成的主模型以及辅模型进行迭代训练,直至符合预设收敛条件为止。有效减少了无效标注,提升了数据标注效率,降低了人力、时间与资金等方面的标注成本。
技术关键词
数据挖掘方法
声学特征
音频特征
数据挖掘装置
数据获取单元
柔性
序列
资金
参数
模块
曲线
矩阵
人力
系统为您推荐了相关专利信息
线性回归模型
文本
评价方法
存储程序代码
关键词
森林模型
网络流量信息
训练样本集
特征值
网络流量数据
语义向量
车辆运行数据
智能诊断方法
大语言模型
标准化工具
问诊系统
声学特征
实体
模式切换单元
电子病历数据库