基于大语言模型的正负样本生成方法、系统、设备及介质

AITNT
正文
推荐专利
基于大语言模型的正负样本生成方法、系统、设备及介质
申请号:CN202510287110
申请日期:2025-03-12
公开号:CN120162431A
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种基于大语言模型的正负样本生成方法、系统、设备及介质,所述方法包括以下步骤:获取用户行为数据,调用数据分析技术根据用户行为数据生成初步正样本和初步负样本;基于词表生成技术以及初步正样本,生成与初步正样本语义相关关键含义非相关的困难负样本;将困难负样本输入大语言模型中进行推理优化;本发明能够通过结合用户行为数据分析和词表技术,有效提升语义相似度检索中正负样本的构造质量,特别是困难负样本的生成,显著增强了模型的检索性能和准确性,降低了成本,生成了更加灵活、多样化、准确和可控的对比学习数据,增强了模型的泛化能力,提升了搜索的准确性和效率。
技术关键词
大语言模型 样本生成方法 数据分析技术 点击率 生成技术 语义 替换算法 核心 通信接口 可读存储介质 存储器 处理器 生成系统 计算机设备 有效性 指标
系统为您推荐了相关专利信息
1
智能问答系统及方法
智能问答方法 大语言模型 智能问答系统 计划 解题思路
2
基于数据驱动正则的问答大语言模型的问答方法及产品
大语言模型 通道剪枝 矩阵 问答方法 答案
3
基于知识引导的伪装目标检测方法和系统
多层次 大语言模型 语义 输出特征 多层感知机
4
基于大语言模型的用药咨询方法及装置
大语言模型 深度语义分析 文本语义分析 关键词 咨询设备
5
一种数据分析方法、装置、电子设备及存储介质
异常数据 数据分析方法 指标 风险 资产
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号