摘要
本发明公开了一种基于TF‑IDF与交叉熵的提示词压缩方法及系统,属于大模型提示词压缩技术领域,针对长提示词引入冗余信息、降低模型效率及增加成本的问题,本发明采用三层渐进压缩:首先划分提示词并保留问题部分;在句子层级将待压缩内容分句后转化为嵌入向量,结合问题向量计算欧氏距离以筛选相关句子;在词语层级通过词频和逆文档频率计算TF‑IDF值提取关键词并重组句子;在Token层级选取参考模型与基础模型,基于交叉熵损失差值识别关键Token并按序拼接生成压缩提示词。该方法避免复杂计算结构,维持语义完整性的同时提升推理效率、降低资源消耗。
技术关键词
词语
关键词
计算机终端设备
语义
基础
处理器
压缩系统
层级
答案
分析模块
可读存储介质
频率
高性能
程序
冗余
系列
文本
存储器
系统为您推荐了相关专利信息
行人重识别模型
图像张量数据
重识别方法
空间特征提取
点云特征提取
人机交互输入
机器学习训练模型
节点
意图识别
定义