一种基于动态预算分配的大模型提示词压缩方法

正文

推荐专利

申请号：CN202411587457

申请日期：2024-11-08

公开号：CN119538917B

公开日期：2025-10-10

类型：发明专利

摘要

本发明提出了一种基于动态预算分配的大模型提示词压缩方法。旨在优化大语言模型的提示词长度，以提高模型的计算效率并降低计算成本。通过动态预算分配器和词汇选择器的协同工作，能够在保证语义完整性的前提下，对提示词进行压缩。首先，动态预算分配器基于每个句子与问题的相关性，动态分配每个句子的词汇保留预算；然后，词汇选择器通过策略网络计算每个词汇的保留概率，优先保留关键词汇。通过奖励函数模块评估压缩提示的忠诚度和相似度，指导策略梯度更新网络参数。该方法显著提升大语言模型的性能，适用于多轮对话、长文本分析等场景中的提示优化。

技术关键词

大语言模型线性分类器策略忠诚度答案动态字符 sigmoid函数注意力机制分配器更新网络参数前馈神经网络编码器语义多轮对话迭代算法轨迹训练集

系统为您推荐了相关专利信息

一种人源子宫内膜类器官衰老模型的构建方法

衰老模型子宫细胞周期抑制蛋白生物模型技术抗衰老药物

一种基于LLM和知识库检索的招聘行业简历筛选方法及系统

简历筛选方法简历推荐系统文本文档解析技术筛选系统

信息采集处理方法、装置、设备及存储介质

策略捕获机制错误日志报告信息采集技术

信息检测方法、装置、设备、存储介质及产品

知识点信息检测方法信息检测设备计算机程序产品信息检测装置

一种降低风力发电机组自身损耗的控制方法

风力发电机组损耗控制风电机组功率控制策略

一种基于动态预算分配的大模型提示词压缩方法

站点导航

APP 下载