摘要
本说明书实施例涉及一种构建语料库的方法及装置,所述方法包括:获取第一语料库,其中包含多个无标签语料,然后,获取目标语料及其对应的目标类别标签,将目标语料与第一语料库中的各个语料进行相似度匹配,得到相似度排名靠前的多个检索结果语料。接下来,根据目标语料、目标类别标签以及多个检索结果语料,确定提示文本;提示文本指示大语言模型以提示文本中的各个语料为示例,生成目标类别标签所指示的类别的语料。在得到提示文本后,将提示文本输入到大语言模型中,得到多个生成结果语料。最后,根据多个检索结果语料、多个生成结果语料以及目标类别标签,构建有标签的第二语料库。
技术关键词
标签
文本编码器
大语言模型
意图识别模型
计算机
平台
可读存储介质
存储器
处理器
索引
系统为您推荐了相关专利信息
实时数据采集装置
业务系统
灰度发布方法
索引机制
历史运行数据
人形机器人
协调控制方法
非线性模型预测控制器
关节模组
运动控制算法
医学成像
数字扫描仪
执行机器学习模型
细丝
非暂态计算机
软件漏洞检测方法
漏洞数据库
大语言模型
识别工具
超文本传输协议请求
熔化极气体保护焊接
熔池动态特征
在线预测方法
缺陷位置信息
机器学习模型