大语言模型训练方法、训练数据获取方法和意图识别方法

正文

推荐专利

申请号：CN202411376525

申请日期：2024-09-29

公开号：CN120429382A

公开日期：2025-08-05

类型：发明专利

摘要

本申请公开了一种大语言模型训练方法、训练数据获取方法和意图识别方法，涉及人工智能技术领域，包括：电子设备获取原始数据集。原始数据集包括多个对话数据。电子设备基于预设的数据维度，对原始数据集中的对话数据进行组别划分，得到多个分组。电子设备分别从多个分组中进行数据采样，将采样后的对话数据的合集作为训练数据集。电子设备将训练数据集作为大语言模型的输入进行模型训练，获取训练后的大语言模型。基于不同的数据维度对原始数据集进行分组和采样等数据处理，得到的各个训练数据集在各个数据维度分布比较均衡，基于该训练数据集训练得到的大语言模型具有较高的准确率。

技术关键词

大语言模型电子设备人机对话场景训练数据获取方法复杂度意图识别方法语句单轮多轮对话人工智能技术计算机程序产品处理器指令可读存储介质存储器

系统为您推荐了相关专利信息

一种基于深度学习的管线浅剖图像自动识别系统

图像自动识别系统特征金字塔网络数据采集模块光照识别模型训练

用于权限验证的声纹识别方法、模型构建方法及系统

声学特征声纹识别装置声纹识别方法模型构建方法声纹识别系统

车辆NVH分区控制方法、系统、电子设备及存储介质

工作点分区控制方法噪声数据增程器整车

EPC项目工程信息抽取方法、装置、设备及介质

文本段落信息抽取方法项目索引机器阅读理解技术

一种知识检索增强的制造业多价值链协同知识抽取方法

知识抽取方法自然语言大语言模型多智能体动态摘要

大语言模型训练方法、训练数据获取方法和意图识别方法

站点导航

APP 下载