摘要
本发明提供一种基于多维度的前沿技术识别模型训练方法、识别方法及装置,属于文献数据处理技术领域,引入多维度的统计元信息和文本数据信息构建训练样本集,并融合引用强度和团队成员贡献水平来量化技术文献前沿性以精准添加标签。模型引入多层感知机提取统计元信息的高维特征,引入预训练的嵌入式大语言模型提取科技文件标题和摘要的语义特征,通过潜在交叉自注意力模块进行特征融合后进行前沿技术识别,实现了多模态信息的深度整合,使模型能够全面、准确地把握科技文献的特征,在应用过程中显著提升了前沿技术识别的准确性和时效性。
技术关键词
识别模型训练方法
大语言模型
训练样本集
科技
信息编码器
文本
文献数据处理
摘要
指数
识别方法
多层感知机
神经网络模型
检测离群值
交叉注意力机制
语义
更新模型参数
前馈神经网络
系统为您推荐了相关专利信息
水下图像增强方法
特征随机采样
多尺度
水下图像数据
校准特征
图像特征向量
图像生成方法
生成预测图像
图像生成模型
文本特征向量