基于强化学习的电力业务场景问答方法及系统

正文

推荐专利

申请号：CN202510770916

申请日期：2025-06-10

公开号：CN120653741A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于人工智能技术领域，具体公开了基于强化学习的电力业务场景问答方法及系统，通过获取排序标注的电力问答训练数据组集合来对预先配置的各奖励函数进行训练，根据各奖励函数的损失值情况选取表现较好的奖励函数来加权组合，构建多维动态奖励模型，然后利用多维动态奖励模型模拟人类排序思路，并结合相应的强化策略对用于电力客服问答的大模型进行优化，驱动大模型在电力业务问答场景下实现精准参数调整，提升其电力客服问答表现。本发明通过动态组合相应问答质量评估维度的奖励模型，并引入动态权重机制，可使大模型电力业务问答结果更符合用户需求，提升其问答准确率和用户交互体验。

技术关键词

问答方法电力样本数据获取单元动态 Sigmoid函数问答系统问答场景权重机制人工智能技术客服策略三元组指令存储器算法思路参数

系统为您推荐了相关专利信息

一种用于真三轴水力压裂实验的压裂液黏度动态调控装置及方法

水力压裂动态调控方法信号接收器压裂液储罐动态调控装置

一种电网稳控方法、装置、终端设备和存储介质

稳控方法储能设备动作策略发电机决策

车联网漏洞风险评估方法、计算机程序产品、设备和介质

漏洞风险评估方法图谱实体计算机程序产品关系

一种预聚合存储表创建方法

存储表分布式协同大数据分析系统备份 TensorFlow框架

一种基于物联网的矿用运输设备安全监控系统

矿用运输设备安全监控系统卷筒装置调节设备仿真模型

基于强化学习的电力业务场景问答方法及系统

站点导航

APP 下载