生成多轮对话语料以及训练、测试大语言模型的方法

正文

推荐专利

申请号：CN202510285984

申请日期：2025-03-11

公开号：CN120216640A

公开日期：2025-06-27

类型：发明专利

摘要

本申请提供一种生成多轮对话语料以及训练、测试大语言模型的方法、装置、设备，其中所述生成多轮对话语料的方法包括：获取第一提问信息；对第一提问信息进行向量化处理，得到第一提问向量；从存储有多组数据对的向量数据库中查询与第一提问向量的相似度满足预设相似度条件的目标上文向量；任一组数据对，均包括根据用户在与语言模型的历史交互过程中的提问上文生成的上文向量，以及历史交互过程中的提问下文；基于目标上文向量对应的提问下文，得到问题生成约束信息；调用大语言模型以问题生成约束信息作为约束条件生成第一提问信息之后的第二提问信息；基于第一提问信息和所述第二提问信息，生成多轮对话语料。

技术关键词

多轮对话大语言模型序列字符生成提示信息处理器通信存储器数据模型训练模块指令表达式测试模块分词

系统为您推荐了相关专利信息

程控模拟设备教学训练模拟用多目标跟踪方法

像素点模拟设备跟踪方法特征值教学

基于标注质量和奖励偏差的视频描述方法、系统及介质

视频编码偏差强化学习算法语句模块

视频数据处理方法、装置、电子设备和存储介质

媒体标识视频数据处理方法字幕大语言模型视频帧

一种充电方舱的控制方法及系统

充电站电力需求预测包络分析方法大数据分析技术物联网技术

一种基于大语言模型的财政领域智能数据分析平台

数据分析平台大语言模型关键词检索策略自然语言

生成多轮对话语料以及训练、测试大语言模型的方法

站点导航

APP 下载