摘要
本发明提出了一种基于动态预算分配的大模型提示词压缩方法。旨在优化大语言模型的提示词长度,以提高模型的计算效率并降低计算成本。通过动态预算分配器和词汇选择器的协同工作,能够在保证语义完整性的前提下,对提示词进行压缩。首先,动态预算分配器基于每个句子与问题的相关性,动态分配每个句子的词汇保留预算;然后,词汇选择器通过策略网络计算每个词汇的保留概率,优先保留关键词汇。通过奖励函数模块评估压缩提示的忠诚度和相似度,指导策略梯度更新网络参数。该方法显著提升大语言模型的性能,适用于多轮对话、长文本分析等场景中的提示优化。
技术关键词
大语言模型
线性分类器
策略
忠诚度
答案
动态
字符
sigmoid函数
注意力机制
分配器
更新网络参数
前馈神经网络
编码器
语义
多轮对话
迭代算法
轨迹
训练集
系统为您推荐了相关专利信息
衰老模型
子宫
细胞周期抑制蛋白
生物模型技术
抗衰老药物
简历筛选方法
简历推荐系统
文本
文档解析技术
筛选系统
知识点
信息检测方法
信息检测设备
计算机程序产品
信息检测装置