用于多轮对话query改写任务的训练方法、系统、设备及产品

正文

推荐专利

申请号：CN202511240323

申请日期：2025-09-02

公开号：CN120724162A

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了用于多轮对话query改写任务的训练方法、系统、设备及产品，其属于人工智能技术领域，包括获取历史对话数据，并进行实体标注，得到实体数据，基于历史对话数据和实体数据，得到第一数据集，基于历史数据集，得到query集合，基于第一数据集和query集合，得到第二数据集，计算第二数据集中query集合的向量聚集度，对query集合进行筛选，基于筛选结果，得到第三数据集，对第三数据集进行采样组合，得到第四数据集，将第四数据集输入LLM‑Chat模型进行SFT训练，得到训练后的LLM‑Chat模型。本发明针对多轮对话的场景下，能降低数据获取成本，减少信息丢失情况的发生，提升query改写的准确性。

技术关键词

多轮对话数据实体编码样本三元组存储计算机程序文本人工智能技术收发器计算机程序产品聚类训练系统计算机设备模块存储器处理器指令消息

系统为您推荐了相关专利信息

一种水电站计算机监控操作员站融合系统

操作员工作站融合系统计算机监控系统水电站人机接口模块

一种电动汽车倒车控制系统及方法

倒车控制系统距离信息实时图像信息生成语音实时监测数据

一种基于BIM的工程全生命周期协同管理方法

协同管理方法阶段建筑信息模型数据一致性验证关系

一种沥青混合料路面表面抗滑性能跟踪评估方法及系统

沥青混合料试件沥青混合料路面纹理二值化图像扫描装置

基于神经网络的污水处理过程控制系统及方法

污水处理装置神经网络模型神经网络结构粒子群算法控制系统

用于多轮对话query改写任务的训练方法、系统、设备及产品

站点导航

APP 下载