生成多轮对话语料以及训练、测试大语言模型的方法

AITNT
正文
推荐专利
生成多轮对话语料以及训练、测试大语言模型的方法
申请号:CN202510285984
申请日期:2025-03-11
公开号:CN120216640A
公开日期:2025-06-27
类型:发明专利
摘要
本申请提供一种生成多轮对话语料以及训练、测试大语言模型的方法、装置、设备,其中所述生成多轮对话语料的方法包括:获取第一提问信息;对第一提问信息进行向量化处理,得到第一提问向量;从存储有多组数据对的向量数据库中查询与第一提问向量的相似度满足预设相似度条件的目标上文向量;任一组数据对,均包括根据用户在与语言模型的历史交互过程中的提问上文生成的上文向量,以及历史交互过程中的提问下文;基于目标上文向量对应的提问下文,得到问题生成约束信息;调用大语言模型以问题生成约束信息作为约束条件生成第一提问信息之后的第二提问信息;基于第一提问信息和所述第二提问信息,生成多轮对话语料。
技术关键词
多轮对话 大语言模型 序列 字符 生成提示信息 处理器通信 存储器 数据 模型训练模块 指令 表达式 测试模块 分词
系统为您推荐了相关专利信息
1
程控模拟设备教学训练模拟用多目标跟踪方法
像素点 模拟设备 跟踪方法 特征值 教学
2
基于标注质量和奖励偏差的视频描述方法、系统及介质
视频编码 偏差 强化学习算法 语句 模块
3
视频数据处理方法、装置、电子设备和存储介质
媒体标识 视频数据处理方法 字幕 大语言模型 视频帧
4
一种充电方舱的控制方法及系统
充电站 电力需求预测 包络分析方法 大数据分析技术 物联网技术
5
一种基于大语言模型的财政领域智能数据分析平台
数据分析平台 大语言模型 关键词 检索策略 自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号