摘要
本发明涉及数据处理领域,更具体地,本发明涉及基于大数据的职业技能评估方法及系统。所述方法包括:对作答文本和语料库进行分词处理获得若干字词,对所有字词进行词性标注并聚类,计算词性影响值;对字词进行分组,计算目标字词组在作答文本中的文本影响度,计算目标字词组在语料库中的语料影响度;计算目标字词的文本影响度和语料影响度的词意相似度,计算目标字词在作答文本中的位置信息与目标字词在语料库中的位置信息的距离相似度,计算TF‑IDF修正值,完成职业技能评估。通过本发明的技术方案,能够提高TF‑IDF值的准确性,为企业提供更准确的评估依据,提升评估的准确性。
技术关键词
字词
职业技能评估方法
大数据
文本生成模型
分词
词嵌入模型
评估系统
聚类算法
自然语言
存储器
计算机
处理器
编码
企业
频率
指令
字符
系统为您推荐了相关专利信息
短信识别方法
关键词
耦合结构
TextRank算法
节点
数据收集模块
文本
输出模块
电力通信管理系统
模型训练模块
BERT模型
自动生成系统
工程勘察数据
专业
命名实体识别