海量文本关键业务词抽取方法及系统、电子设备、存储介质

AITNT
正文
推荐专利
海量文本关键业务词抽取方法及系统、电子设备、存储介质
申请号:CN202510092259
申请日期:2025-01-21
公开号:CN120123513A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种海量文本关键业务词抽取方法及系统、电子设备、存储介质,该方法考虑到在海量文本抽取关键业务词的任务中,数据标注需要专业知识支撑,且因为文本格式的多样化,深度学习模型要达到较好的准确率和召回率需要大量的训练数据训练,而人工标注训练数据的成本十分高昂,因此,本发明通过制定启发式规则来校正深度学习模型的关键业务词抽取结果,再使用修正后的关键业务词抽取结果作为训练数据重新训练模型,经过多次规则修正、模型迭代后,最终模型在较低成本的条件下能以较高的准确率、召回率快速完成海量文本关键业务词抽取的任务。
技术关键词
文本 深度学习模型 小规模 数据 启发式规则 电子设备 抽取系统 校正模块 存储器 计算机 处理器 低成本 字符 关系
系统为您推荐了相关专利信息
1
基于深度学习与DS证据理论融合的辐射源识别方法
深度学习网络 二维卷积神经网络 一维卷积神经网络 证据推理理论 辐射源识别方法
2
基于多层动态因果关系网络的通航设备故障异常检测方法
异常检测方法 子系统 时间片 动态有向无环图 构建系统
3
药品分销数据的清洗处理方法、系统、电子设备及介质
数据库服务器 数据清洗工具 处理器 通道 调节控制模块
4
基于多模态数据的交通状态预测及溯源方法、装置和设备
拓扑图 交通状态预测 节点 序列 数据
5
一种基于微生物的池塘底泥生态修复方法
生态修复方法 池塘底泥 信息熵 复合微生物菌剂 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号