负样本构建、模型训练方法及设备

AITNT
正文
推荐专利
负样本构建、模型训练方法及设备
申请号:CN202510115808
申请日期:2025-01-23
公开号:CN120011551A
公开日期:2025-05-16
类型:发明专利
摘要
本申请实施例提供一种负样本构建、模型训练方法及设备。该方法包括:获取正样本集合,其中,正样本集合包括多个正样本,每一正样本包括查询语句和查询语句的关联文本;将正样本集合中的任一正样本作为目标正样本,对于每一其余正样本,计算目标正样本的目标查询语句和目标关联文本中至少一个与该其余正样本的查询语句和关联文本各自的相似度;将相似度大于等于预设阈值的至少一个其余正样本作为候选样本,提取每一候选样本中的关联文本作为第一文本,构建包括第一文本与目标查询语句的第一负样本,得到第一负样本集合。上述第一负样本与正样本之间的区分度较小,使用上述负样本训练后的模型具有更高的检测精度和更好的泛化能力。
技术关键词
样本 文本 语句 计算机执行指令 三元组 阶段 模型训练方法 自然语言模型 微调单元 处理器 模型训练设备 存储器 模型训练装置 可读存储介质 计算机程序产品 精度
系统为您推荐了相关专利信息
1
高分辨质谱-深度学习驱动的代谢组学数据自动分析方法
代谢组学数据 自动分析方法 质谱联用技术 深度学习模型 数据科学技术
2
一种基于层次化提示引导对齐的多视图聚类方法及装置
标签 聚类方法 语义特征 融合语义 样本
3
一种基于数据库的分布式训练方法、装置、介质及设备
分布式数据库系统 负载均衡器 数据库服务器 分布式训练方法 参数
4
一种针对目标对象的风险信息识别方法、装置
风险信息识别方法 专用模型 训练样本集 计算机存储介质 模型更新
5
基于多模态数据图结构的肿瘤基因分型预测方法及系统
肿瘤 多模态 样本 基因 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号