摘要
本发明公开了一种业务产品词库的构建方法及系统,涉及词库构建领域,包括以下步骤:S1、获取初始数据进行筛选:通过多种途径获取初始数据,对初始数据进行预处理,数据预处理包括数据清洗、数据集成、数据变换和数据规约。本发明通过关键词提取算法,对关键词进行提取,将分类至不同行业的数据生成文本文档,去除文档中的噪声词,减少噪声的影响,根据词典和专业领域中的专有名词查找分词语句中的子语义,获取多个独立分词,得到初始关键词,对多个初始关键词进行处理,从而提取出最终的关键词,通过随机抽查的方式,定期对关键词提取优化算法进行优化更新,不断提高关键词优化算法的准确性,构建更个性化的词库。
技术关键词
关键词提取算法
分词
生成关键词
构建系统
鉴别模块
数据分类
数据获取模块
文本
同义词
语义
专业名词
语句
词典
企业
噪声
论坛
系统为您推荐了相关专利信息
GNSS数据
地震波形反演
断层结构
梯度算法
地震数据处理技术
无人机监控
编队控制方法
深度确定性策略梯度
火灾场景
能量消耗
连续投影算法
连续小波变换
模型构建方法
数据融合算法
计算机存储介质
大语言模型
文本识别方法
文本识别装置
通信接口
电子设备