摘要
本发明涉及数字员工数据处理技术领域,具体涉及一种基于云边协同的社保数字员工数据处理与模型搭建方法,具体如下:采集多源社保数据,抓取政策文本;基于采集的多源社保数据和政策文本构造训练样本,并按比例划分为训练集、验证集和测试集;采用基于编码器和解码器的神经网络架构构建社保数字员工问答模型,将训练集输入至模型中经过编码器和解码器的处理,生成答案序列;对模型进行训练,模型进行多次迭代训练,直至满足预设的迭代停止条件时模型结束训练,通过验证集选择性能最好的模型最为最优模型;将测试集输入至最优模型中,生成答案序列。本发明通过构建建社保数字员工问答模型,可以提升处理效率,增强数据处理的准确性,降低运营成本。
技术关键词
逻辑
多任务损失函数
编码器
解码器
序列
员工
生成答案
文本
Softmax函数
字符
术语
问答模型
多头注意力机制
神经网络架构
语义
层级
掩码矩阵