摘要
本申请公开了一种简历标签生成方法方法、设备及介质,涉及自然语言处理领域,方法包括:对原始简历文本进行预处理,将原始简历数据分词为多个文本词语;统计文本词语对应的词语频率,根据词语频率对文本词语赋予对应的重要性权重;对文本词语进行向量化,得到对应的词语向量,根据重要性权重,对词语向量进行聚合,得到原始简历文本对应的简历文本向量;基于预设分层标签库,通过非线性分类算法对文本语义向量进行多标签分类,输出原始简历文本的预测标签;基于预设阈值对标签预测值进行筛选,得到最终简历标签集合。通过融合词频加权语义表征与非线性分类算法,显著提升了简历标签生成的准确性与适应性。
技术关键词
标签生成方法
词语
文本
支持向量机模型
标签预测值
语义向量
非易失性计算机存储介质
计算机可执行指令
多标签
分词
非线性
频率
拉格朗日
算法
分层
处理器通信
自然语言
系统为您推荐了相关专利信息
大语言模型
巡检方法
声学特征
模板查找方法
风险
文件访问权限
神经网络模型识别
权限管理模块
文本校正
管理系统
文本特征向量
标签
大语言模型
网络流量检测方法
语义向量