面向语言模型智能问答系统的多目标优化方法

正文

推荐专利

申请号：CN202411438427

申请日期：2024-10-15

公开号：CN119323271B

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开一种面向语言模型智能问答系统的多目标优化方法，使语言模型能够在不完备信息下，同时最大化用户体验和最小化交互次数以进行在线学习与决策任务。语言模型智能问答系统由多个语言生成模型和一个决策模型组成，语言生成模型负责生成若干个备选回答，决策模型负责选取其中两个回答作为反馈。首先设计初始策略以探索语言生成模型性能，使用用户反馈对语言生成模型进行简单排序。对于决策模型的设计，使用一种自适应于动态排序的决策方法，辅以逐对淘汰的方式，逐渐排除不符合用户需求的语言生成模型。与现有的问答模型优化技术相比，本发明不仅能够同时保证尽可能利用最符合用户需求的语言生成模型来提供答案，以最大化用户体验，还能够额外保证最小化寻得该语言生成模型所需的交互次数。

技术关键词

智能问答系统模型更新计算机设备问答模型决策方法处理器可读存储介质存储器答案指令在线策略矩阵动态

面向语言模型智能问答系统的多目标优化方法

站点导航

APP 下载