负样本构建、模型训练方法及设备

正文

推荐专利

负样本构建、模型训练方法及设备

申请号：CN202510115808

申请日期：2025-01-23

公开号：CN120011551A

公开日期：2025-05-16

类型：发明专利

摘要

本申请实施例提供一种负样本构建、模型训练方法及设备。该方法包括：获取正样本集合，其中，正样本集合包括多个正样本，每一正样本包括查询语句和查询语句的关联文本；将正样本集合中的任一正样本作为目标正样本，对于每一其余正样本，计算目标正样本的目标查询语句和目标关联文本中至少一个与该其余正样本的查询语句和关联文本各自的相似度；将相似度大于等于预设阈值的至少一个其余正样本作为候选样本，提取每一候选样本中的关联文本作为第一文本，构建包括第一文本与目标查询语句的第一负样本，得到第一负样本集合。上述第一负样本与正样本之间的区分度较小，使用上述负样本训练后的模型具有更高的检测精度和更好的泛化能力。

技术关键词

样本文本语句计算机执行指令三元组阶段模型训练方法自然语言模型微调单元处理器模型训练设备存储器模型训练装置可读存储介质计算机程序产品精度

系统为您推荐了相关专利信息

高分辨质谱-深度学习驱动的代谢组学数据自动分析方法

代谢组学数据自动分析方法质谱联用技术深度学习模型数据科学技术

一种基于层次化提示引导对齐的多视图聚类方法及装置

标签聚类方法语义特征融合语义样本

一种基于数据库的分布式训练方法、装置、介质及设备

分布式数据库系统负载均衡器数据库服务器分布式训练方法参数

一种针对目标对象的风险信息识别方法、装置

风险信息识别方法专用模型训练样本集计算机存储介质模型更新

基于多模态数据图结构的肿瘤基因分型预测方法及系统

肿瘤多模态样本基因图谱

负样本构建、模型训练方法及设备

站点导航

APP 下载