摘要
本发明公开了一种基于大语言模型的正负样本生成方法、系统、设备及介质,所述方法包括以下步骤:获取用户行为数据,调用数据分析技术根据用户行为数据生成初步正样本和初步负样本;基于词表生成技术以及初步正样本,生成与初步正样本语义相关关键含义非相关的困难负样本;将困难负样本输入大语言模型中进行推理优化;本发明能够通过结合用户行为数据分析和词表技术,有效提升语义相似度检索中正负样本的构造质量,特别是困难负样本的生成,显著增强了模型的检索性能和准确性,降低了成本,生成了更加灵活、多样化、准确和可控的对比学习数据,增强了模型的泛化能力,提升了搜索的准确性和效率。
技术关键词
大语言模型
样本生成方法
数据分析技术
点击率
生成技术
语义
替换算法
核心
通信接口
可读存储介质
存储器
处理器
生成系统
计算机设备
有效性
指标
系统为您推荐了相关专利信息
智能问答方法
大语言模型
智能问答系统
计划
解题思路
大语言模型
深度语义分析
文本语义分析
关键词
咨询设备