摘要
本申请涉及一种电网企业科技项目申请资料的查重方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:接收电网企业账户发送的针对科技项目的申请请求,解析申请请求,得到申请资料文本;基于条件随机场算法对申请资料文本进行分词处理,得到申请资料文本对应的文本序列;基于预训练的词向量模型对文本序列进行特征提取,得到申请资料文本对应的数值化特征向量;其中,预训练的词向量模型为基于电网领域语料训练得到的;基于数值化特征向量,确定申请资料文本的查重结果;查重结果与申请请求的请求结果相关联。采用本方法能够提高电网企业科技项目申请资料的查重效率和准确性。
技术关键词
文本
资料
条件随机场算法
数值
项目
语法结构
计算机设备
科技
计算机程序产品
企业
可读存储介质
分词
序列
特征提取模块
账户
处理器
存储器
终端
系统为您推荐了相关专利信息
文本生成模型
报告
图像编码器
标记
图像特征向量
三维虚拟模型
地应力场反演方法
像素
生成学习数据
数据验证
接口
数据
校验方法
计算机程序产品
文本识别模型