一种大语言模型动态分级提示压缩方法、系统、装置和存储介质

正文

推荐专利

申请号：CN202510795084

申请日期：2025-06-14

公开号：CN120633874A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种大语言模型动态分级提示压缩方法、系统、装置和存储介质，属于深度学习、强化学习和大语言模型等技术领域。其中方法包括：构建提示压缩的马尔可夫决策过程；训练语言模型对齐目标大模型输出分布；综合设计压缩比、输出对齐和信息保留的奖励函数；根据近端策略优化的强化学习算法和课程学习训练压缩智能体；使用压缩智能体对输入提示进行动态压缩。本发明通过基于强化学习的动态分级提示压缩方法，旨在解决当前提示压缩技术中压缩比与关键信息保留之间难以平衡、方法泛化性不足、缺乏自适应调整机制等问题。

技术关键词

大语言模型强化学习算法训练语言模型策略动态训练智能体处理器压缩系统压缩装置决策程序网络模块可读存储介质阶段度量语义文本存储器计算机

系统为您推荐了相关专利信息

基于动态功能胞体耦合的智能交通预测控制方法及系统

智能交通预测动态基础设施规划强度 LSTM模型

基于上下文融合思维链的中文文本纠错方法、装置及设备

中文文本纠错字符多粒度特征语言知识库预训练语言模型

矿井通风事件捕捉与动作推理智能问答方法

智能问答方法三元组实体语义标签图谱

一种基于双CPU和DPRAM的双坐标系异步加工控制方法

分块坐标系图像数据分割分割图像数据策略

驱动方法、驱动装置和摄像头模组

致动装置驱动信号摄像头模组供电装置电压驱动方式

一种大语言模型动态分级提示压缩方法、系统、装置和存储介质

站点导航

APP 下载