摘要
本发明公开了一种海量文本关键业务词抽取方法及系统、电子设备、存储介质,该方法考虑到在海量文本抽取关键业务词的任务中,数据标注需要专业知识支撑,且因为文本格式的多样化,深度学习模型要达到较好的准确率和召回率需要大量的训练数据训练,而人工标注训练数据的成本十分高昂,因此,本发明通过制定启发式规则来校正深度学习模型的关键业务词抽取结果,再使用修正后的关键业务词抽取结果作为训练数据重新训练模型,经过多次规则修正、模型迭代后,最终模型在较低成本的条件下能以较高的准确率、召回率快速完成海量文本关键业务词抽取的任务。
技术关键词
文本
深度学习模型
小规模
数据
启发式规则
电子设备
抽取系统
校正模块
存储器
计算机
处理器
低成本
字符
关系
系统为您推荐了相关专利信息
深度学习网络
二维卷积神经网络
一维卷积神经网络
证据推理理论
辐射源识别方法
异常检测方法
子系统
时间片
动态有向无环图
构建系统
数据库服务器
数据清洗工具
处理器
通道
调节控制模块
生态修复方法
池塘底泥
信息熵
复合微生物菌剂
序列