摘要
本发明公开了一种训练样本生成方法、装置、设备及存储介质。该方法包括:获取指令数据,并对每条所述指令数据进行拆分,以得到指令模板和所述指令数据中的自赋值数据;确定所述指令模板的第一语义编码和所述自赋值数据的第二语义编码,并对所述第一语义编码和所述第二语义编码进行特征拼接,以得到指令编码;对所述指令编码进行扩增,以得到待处理编码,并基于预设聚类簇中心对所述待处理编码进行聚类处理,以得到目标指令样本。本发明实施例的技术方案,生成了高质量且语义一致的训练样本,从而在数据检测模型训练时,可以有效增强数据信息提升模型性能。
技术关键词
训练样本生成方法
指令
编码
注意力
数据
检测模型训练
模板
聚类
可读存储介质
模块
计算机
电子设备
处理器通信
生成装置
存储器
语义
系统为您推荐了相关专利信息
在线控制方法
时序特征
工艺特征
卷积特征提取
注意力
并行文件系统
监控设备
服务器节点
预测误差
数据服务器
细胞检测方法
卷积模块
检测网络模型
注意力机制
通道
客户端
联邦学习模型
医院
智能监测系统
多模态数据库