基于预训练模型的关键词拓展方法及装置

AITNT
正文
推荐专利
基于预训练模型的关键词拓展方法及装置
申请号:CN202411620313
申请日期:2024-11-14
公开号:CN119150881B
公开日期:2025-03-11
类型:发明专利
摘要
本发明实施例中提供了一种基于预训练模型的关键词拓展方法、装置及电子设备,属于数据处理技术领域,该方法包括:利用停用词集合S对词汇集合W中的每个词汇w执行停用词清除操作,得到第二词汇集合;对第二词汇集合W'中的每个词汇执行词性标注,得到词性标注结果P;通过预训练模型编码器将第二词汇集合W'关键词k映射为语义向量Vk,得到第二词汇集合W'所对应的语义矩阵M;计算第二词汇集合W'中每个关键词k与其他词语之间的相似度,得到相似度向量S;基于所述词性标注结果P、所述上下文集合C、语义矩阵M以及相似度向量S,生成输入文本T所对应的拓展词集合T’=Fg(T|P,C,M,S)。本发明提高了关键词拓展的准确性。
技术关键词
关键词拓展方法 预训练模型 语义向量 文本 分词词典 矩阵 编码器 标注工具 电子设备 拓展装置 词语 数据处理技术 处理器通信 标签 模块 存储器
系统为您推荐了相关专利信息
1
基于图像和多模态数据的肠息肉识别方法
多模态特征融合 文本 图像 识别方法 分类网络
2
一种面向结构化文本识别的快速反绎学习方法及装置
文本识别 学习方法 机器学习模型 符号 序列
3
一种基于AI算法的数据处理智能分析方法
智能分析方法 AI算法 因果关系模型 线性预测系数 多模态特征融合
4
编目方法、装置、电子设备及可读存储介质
文本 编目方法 编目系统 目录 树形结构
5
一种铁路应急辅助决策方法及系统
事理图谱 BERT模型 铁路 语义角色标注 辅助决策方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号