对话模型训练方法、对话方法、系统、设备及介质

正文

推荐专利

申请号：CN202510345245

申请日期：2025-03-24

公开号：CN119862964A

公开日期：2025-04-22

类型：发明专利

摘要

本发明提供一种对话模型训练方法、对话方法、系统、设备及介质，涉及人机交互技术领域，该方法包括：根据样本对话中的当前样本用户输入信息和历史样本对话信息，生成当前样本对话状态信息；基于待训练策略网络和待训练价值网络进行树搜索，得到当前样本回复动作信息，以及当前样本回复动作信息对应的对话轨迹的全局奖励值；根据当前样本回复动作信息模拟生成的下一样本对话状态信息、当前样本对话状态信息、当前样本回复动作信息和全局奖励值，构建样本数据；根据样本数据，对待训练策略网络和待训练价值网络进行联合训练，以构建对话模型。本发明实现在对话时综合考虑长期回报和策略优化，由此提升多轮对话的生成质量、交互能力和用户体验感。

技术关键词

模型训练方法样本对话方法网络策略轨迹模型训练系统人机交互技术对话系统多轮对话处理器生成用户数据存储器节点电子设备介质标签

系统为您推荐了相关专利信息

一种机械式压力表监测系统及方法

机械式压力表接口端压力表接口数据特征提取模型训练模块

一种双履带机器人的循迹控制方法

循迹控制方法履带机器人 PID调节器偏差控制策略

一种基于线损预测的配电网供电分区优化方法及系统

分区优化方法融合特征分支线损电压

一种水电站水库水位预测分析方法、系统及存储介质

水电站水库水位预测分析方法神经网络模型网格水文

基于AI的新能源汽车压铸件工艺参数智能优化方法及系统

参数智能优化方法压铸设备压铸件新能源汽车数字孪生模型

对话模型训练方法、对话方法、系统、设备及介质

站点导航

APP 下载