摘要
本发明实施例提供一种新词的发现方法、系统及计算机可读存储介质,该方法包括:获取网络平台中发布的话题物料,所述话题物料包括话题标签和物料内容;基于所述话题物料构建对应的引导模版;将构建的引导模版输入预先训练的大语言模型,得到所述大语言模型输出的实体词以及实体词的类型;其中,所述大语言模型通过训练样本对原始大语言模型进行微调训练得到;将所述大语言模型输出的实体词确定为所述网络平台中待推荐的新词,并进行新词上线。用预先训练的大语言模型,不需要积累物料,产生一条话题物料即可识别其是否包含新词,使得新词发现非常及时且准确率高,大幅度缩短新词上线时间,还能够节约人工审核成本。
技术关键词
话题
大语言模型
网络平台
模版
样本
标签
可读存储介质
文本
发布者
新词识别
计算机设备
白名单
发现系统
字段
指令
格式
模板
下线
系统为您推荐了相关专利信息
深度信念网络模型
润滑油
样本
工况环境
随机森林模型
图像分割方法
多尺度
空间特征提取
语义特征
特征提取模块
多项式拟合算法
计算机终端
样本
辐射源
处理器通信
肿瘤免疫药物
评价方法
客户数据筛选方法
样本
采集切片图像