摘要
本发明属于人工智能技术领域,具体公开了基于人工智能的电力客服模型优化方法及系统,通过获取用于大模型小样本学习的支持集和查询集,利用支持集和查询集对大模型进行元训练,再调取辅助集对预训练大模型进行电力业务场景问题实例的推理测试,然后根据测试得到的推理步骤和推理结果对预训练大模型进行基于综合策略奖励值的强化学习,以得到策略优化大模型进行实际应用中的电力业务场景问题推理优化解答。本发明利用小样本学习技术实现大模型推理能力的微调,并利用综合策略反馈进行强化学习,提高了大模型推理过程的可解释性与推理结果的准确性,为大模型的电力客服问答提供了更高效的决策支持。
技术关键词
模型优化方法
电力
客服
策略
场景
样本
模型优化系统
特征提取单元
数据获取单元
人工智能技术
指令
存储器
算法
参数
决策
处理器