摘要
本发明实施例中提供了一种基于预训练模型的关键词拓展方法、装置及电子设备,属于数据处理技术领域,该方法包括:利用停用词集合S对词汇集合W中的每个词汇w执行停用词清除操作,得到第二词汇集合;对第二词汇集合W'中的每个词汇执行词性标注,得到词性标注结果P;通过预训练模型编码器将第二词汇集合W'关键词k映射为语义向量Vk,得到第二词汇集合W'所对应的语义矩阵M;计算第二词汇集合W'中每个关键词k与其他词语之间的相似度,得到相似度向量S;基于所述词性标注结果P、所述上下文集合C、语义矩阵M以及相似度向量S,生成输入文本T所对应的拓展词集合T’=Fg(T|P,C,M,S)。本发明提高了关键词拓展的准确性。
技术关键词
关键词拓展方法
预训练模型
语义向量
文本
分词词典
矩阵
编码器
标注工具
电子设备
拓展装置
词语
数据处理技术
处理器通信
标签
模块
存储器
系统为您推荐了相关专利信息
智能分析方法
AI算法
因果关系模型
线性预测系数
多模态特征融合
事理图谱
BERT模型
铁路
语义角色标注
辅助决策方法