基于大语言模型的正负样本生成方法、系统、设备及介质

正文

推荐专利

申请号：CN202510287110

申请日期：2025-03-12

公开号：CN120162431A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于大语言模型的正负样本生成方法、系统、设备及介质，所述方法包括以下步骤：获取用户行为数据，调用数据分析技术根据用户行为数据生成初步正样本和初步负样本；基于词表生成技术以及初步正样本，生成与初步正样本语义相关关键含义非相关的困难负样本；将困难负样本输入大语言模型中进行推理优化；本发明能够通过结合用户行为数据分析和词表技术，有效提升语义相似度检索中正负样本的构造质量，特别是困难负样本的生成，显著增强了模型的检索性能和准确性，降低了成本，生成了更加灵活、多样化、准确和可控的对比学习数据，增强了模型的泛化能力，提升了搜索的准确性和效率。

技术关键词

大语言模型样本生成方法数据分析技术点击率生成技术语义替换算法核心通信接口可读存储介质存储器处理器生成系统计算机设备有效性指标

系统为您推荐了相关专利信息

智能问答系统及方法

智能问答方法大语言模型智能问答系统计划解题思路

基于数据驱动正则的问答大语言模型的问答方法及产品

大语言模型通道剪枝矩阵问答方法答案

基于知识引导的伪装目标检测方法和系统

多层次大语言模型语义输出特征多层感知机

基于大语言模型的用药咨询方法及装置

大语言模型深度语义分析文本语义分析关键词咨询设备

一种数据分析方法、装置、电子设备及存储介质

异常数据数据分析方法指标风险资产

基于大语言模型的正负样本生成方法、系统、设备及介质

站点导航

APP 下载