摘要
本申请提供一种生成多轮对话语料以及训练、测试大语言模型的方法、装置、设备,其中所述生成多轮对话语料的方法包括:获取第一提问信息;对第一提问信息进行向量化处理,得到第一提问向量;从存储有多组数据对的向量数据库中查询与第一提问向量的相似度满足预设相似度条件的目标上文向量;任一组数据对,均包括根据用户在与语言模型的历史交互过程中的提问上文生成的上文向量,以及历史交互过程中的提问下文;基于目标上文向量对应的提问下文,得到问题生成约束信息;调用大语言模型以问题生成约束信息作为约束条件生成第一提问信息之后的第二提问信息;基于第一提问信息和所述第二提问信息,生成多轮对话语料。
技术关键词
多轮对话
大语言模型
序列
字符
生成提示信息
处理器通信
存储器
数据
模型训练模块
指令
表达式
测试模块
分词
系统为您推荐了相关专利信息
媒体标识
视频数据处理方法
字幕
大语言模型
视频帧
充电站
电力需求预测
包络分析方法
大数据分析技术
物联网技术
数据分析平台
大语言模型
关键词
检索策略
自然语言