基于困惑度驱动大语言模型的电网营销数据标注方法

正文

推荐专利

申请号：CN202411690138

申请日期：2024-11-25

公开号：CN119669403A

公开日期：2025-03-21

类型：发明专利

摘要

本发明属于自然语言处理技术领域，具体涉及一种基于困惑度驱动大语言模型的电网营销数据标注方法、平台和设备。该方法过程如下：S1：针对电网营销领域的具体需求，收集相关的数据，预处理后构成所需的样本数据集；S2：收集与电网营销业务相关的问题，并由大语言模型进行回答构建初始问答对；S3：结合样本数据集对初始问答对进行困惑度检测，并筛选出存在准确性风险的初始问答对；S4：由技术人员对存在准确性风险的初始问答对进行人工审查和修正后构成标注数据，采集大量经人工审查标注的数据，构成于对商用的大语言模型进行重新监督训练的知识库。本发明解决了电网营销的大模型存在模型幻觉，导致工作人员数据标注任务量过大的问题。

技术关键词

电网营销数据大语言模型标注方法答案调用API接口身份验证功能风险度检测方法正则化技术样本自动编码器业扩报装互动设备平台随机森林自然语言处理器格式化文本

基于困惑度驱动大语言模型的电网营销数据标注方法

站点导航

APP 下载