摘要
本发明涉及人工智能与自然语言处理技术领域,公开了一种使用双视图嵌入向量的检索增强代码生成方法和系统;方法包括对知识库中的每个Bash文档生成两个互补的嵌入向量;计算用户查询的嵌入与知识库中各Bash文档的双视图语义相似度得分,同时基于BM25算法计算Bash文档的BM25词法相似度得分;融合双视图语义相似度得分和BM25词法相似度得分,按得到的最终得分排序Bash文档;将最终得分最高的N个Bash文档与用户查询输入大语言模型,生成目标Bash代码。本发明通过使用双重嵌入策略增强检索阶段,并结合BM25算法和语义相似性,为生成器提供了更准确和上下文相关的信息,能够提高生成代码的准确率。
技术关键词
代码生成方法
代码生成系统
文本
语义
大语言模型
编码器
生成代码
算法
自然语言
模块
模式
策略
阶段
系统为您推荐了相关专利信息
大语言模型
客服管理平台
数据
自然语言文本
问答知识库
结构化查询语句
模型压缩
融合策略
集群
语义特征提取
卷积神经网络模型
代码生成方法
代码生成系统
解析设备
变量