摘要
本发明提供了一种词库的生成方法、装置、设备及介质,包括:针对不包含标点符号的待处理文本信息,确定所述待处理文本信息的字符长度是否介于设定的字符阈值区间内;当所述待处理文本信息的字符长度介于设定的字符阈值区间内时,将所述待处理文本信息确定为目标短语,与已有词库进行匹配,根据匹配结果进行相应的词库更新操作;当所述待处理文本信息的长度大于所述字符阈值区间的最大值时,按照分词算法对所述待处理文本信息进行短语划分,并将长度大于所述字符阈值区间的最小值的短语确定为目标短语,与已有词库进行匹配,根据匹配结果进行相应的词库更新操作,以解决目前的信息检索的效率低和准确性差的问题。
技术关键词
字符
文本
分词算法
关键词联想方法
词库生成方法
词库生成装置
可读存储介质
组装模块
处理器
信息检索
输出模块
存储器
计算机
电子设备
系统为您推荐了相关专利信息
消息
联合信源信道编码
分析模块
神经网络参数
差错保护
智能控制方法
构建知识图谱
进程运行状态
指令
日志级别