摘要
本发明提供了搜索引擎分词技术领域的一种商品搜索词库生成方法及系统,方法包括:步骤S1、获取大量的历史搜索语句,对各历史搜索语句进行预处理以及标注后构建数据集;步骤S2、创建一分词模型,设定分词模型的损失函数;步骤S3、通过数据集对分词模型进行训练;步骤S4、预设若干个初始搜索词,基于各初始搜索词创建一商品搜索词库;步骤S5、获取输入的实时搜索语句,通过分词模型对实时搜索语句执行分词操作,得到若干个实时搜索词,将各实时搜索词存储至商品搜索词库;步骤S6、实时采集实时搜索语句对应的实时搜索行为,基于实时搜索行为对商品搜索词库进行动态更新。本发明的优点在于:极大的提升了搜索词分词的准确性。
技术关键词
分词模型
搜索词
词库生成方法
语句
商品特征
场景特征
生成系统
动态更新
输入模块
输出模块
画像
可视化界面
扩充模块
分类器
训练集
实体
数据
系统为您推荐了相关专利信息
楼宇自动化系统
楼宇控制方法
自然语言
大语言模型
标签
数据虚拟化系统
虚拟化方法
元数据管理模块
语句
网络通信模块
自助收银设备
商品特征信息
手势识别模型
扫码
识别模型构建方法