摘要
本申请公开了一种基于大语言模型的代码生成方法、装置、设备及存储介质,涉及大模型技术领域,包括:基于模型的用于代码生成的初始推理路径生成当前标记,缓存当前标记的查询向量,基于若干待处理标记的查询向量构建选择窗口;利用基于选择窗口获取的目标模型层和目标注意力头的滑动窗口注意力处理历史标记得到重要性评分结果与段落生成结果,利用基于重要性评分结果和各段落生成结果的语义稀疏性结果确定的语义块划分策略划分待压缩标记序列为语义块,基于各语义块的重要性得分并利用基于模型特性和推理需求确定的压缩控制参数生成目标压缩策略,利用目标压缩策略压缩初始推理路径得到目标推理路径以生成代码。这样能够提高代码生成的效率。
技术关键词
大语言模型
代码生成方法
标记
语义
注意力
滑动窗口
策略
生成代码
序列
键值
代码生成装置
聚类算法
机制
指标
模块
可读存储介质
标签
处理器
电子设备
日志
系统为您推荐了相关专利信息
无损检测方法
种子
低场核磁共振
样品管
三维成像