摘要
本发明公开了一种基于联合策略驱动的目标引导对话生成方法,具体通过方向策略网络、引导策略网络以及强化学习方法引导系统对话模型输出语料;本发明既能保证对话的方向性,又能关注特定上下文环境中的细粒度引导,提高了对话系统的目标导向性和达成效率。
技术关键词
对话生成方法
策略
关键词
网络
基础
数据
强化学习方法
强化学习算法
对话系统
引导系统
表达式
参数
系统为您推荐了相关专利信息
动力电池热失控
热失控风险
单体
神经网络模型
风险评估方法
模态传感器
多智能体强化学习
网络
故障诊断方法
分层强化学习
联合优化方法
动态
无人机
融合历史数据
长短期记忆网络
智能监测设备
数据处理模块
数据采集模块
传感器阵列
输出模块