一种基于动态预算分配的大模型提示词压缩方法

AITNT
正文
推荐专利
一种基于动态预算分配的大模型提示词压缩方法
申请号:CN202411587457
申请日期:2024-11-08
公开号:CN119538917B
公开日期:2025-10-10
类型:发明专利
摘要
本发明提出了一种基于动态预算分配的大模型提示词压缩方法。旨在优化大语言模型的提示词长度,以提高模型的计算效率并降低计算成本。通过动态预算分配器和词汇选择器的协同工作,能够在保证语义完整性的前提下,对提示词进行压缩。首先,动态预算分配器基于每个句子与问题的相关性,动态分配每个句子的词汇保留预算;然后,词汇选择器通过策略网络计算每个词汇的保留概率,优先保留关键词汇。通过奖励函数模块评估压缩提示的忠诚度和相似度,指导策略梯度更新网络参数。该方法显著提升大语言模型的性能,适用于多轮对话、长文本分析等场景中的提示优化。
技术关键词
大语言模型 线性分类器 策略 忠诚度 答案 动态 字符 sigmoid函数 注意力机制 分配器 更新网络参数 前馈神经网络 编码器 语义 多轮对话 迭代算法 轨迹 训练集
系统为您推荐了相关专利信息
1
一种人源子宫内膜类器官衰老模型的构建方法
衰老模型 子宫 细胞周期抑制蛋白 生物模型技术 抗衰老药物
2
一种基于LLM和知识库检索的招聘行业简历筛选方法及系统
简历筛选方法 简历推荐系统 文本 文档解析技术 筛选系统
3
信息采集处理方法、装置、设备及存储介质
策略 捕获机制 错误日志 报告 信息采集技术
4
信息检测方法、装置、设备、存储介质及产品
知识点 信息检测方法 信息检测设备 计算机程序产品 信息检测装置
5
一种降低风力发电机组自身损耗的控制方法
风力发电机组 损耗 控制风电机组 功率 控制策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号