摘要
本发明属于人工智能技术领域,具体公开了基于强化学习的电力业务场景问答方法及系统,通过获取排序标注的电力问答训练数据组集合来对预先配置的各奖励函数进行训练,根据各奖励函数的损失值情况选取表现较好的奖励函数来加权组合,构建多维动态奖励模型,然后利用多维动态奖励模型模拟人类排序思路,并结合相应的强化策略对用于电力客服问答的大模型进行优化,驱动大模型在电力业务问答场景下实现精准参数调整,提升其电力客服问答表现。本发明通过动态组合相应问答质量评估维度的奖励模型,并引入动态权重机制,可使大模型电力业务问答结果更符合用户需求,提升其问答准确率和用户交互体验。
技术关键词
问答方法
电力
样本
数据获取单元
动态
Sigmoid函数
问答系统
问答场景
权重机制
人工智能技术
客服
策略
三元组
指令
存储器
算法
思路
参数
系统为您推荐了相关专利信息
水力压裂
动态调控方法
信号接收器
压裂液储罐
动态调控装置
漏洞风险评估方法
图谱
实体
计算机程序产品
关系
存储表
分布式协同
大数据分析系统
备份
TensorFlow框架
矿用运输设备
安全监控系统
卷筒装置
调节设备
仿真模型