一种构建语料库的方法及装置

AITNT
正文
推荐专利
一种构建语料库的方法及装置
申请号:CN202410768227
申请日期:2024-06-13
公开号:CN118569272A
公开日期:2024-08-30
类型:发明专利
摘要
本说明书实施例涉及一种构建语料库的方法及装置,所述方法包括:获取第一语料库,其中包含多个无标签语料,然后,获取目标语料及其对应的目标类别标签,将目标语料与第一语料库中的各个语料进行相似度匹配,得到相似度排名靠前的多个检索结果语料。接下来,根据目标语料、目标类别标签以及多个检索结果语料,确定提示文本;提示文本指示大语言模型以提示文本中的各个语料为示例,生成目标类别标签所指示的类别的语料。在得到提示文本后,将提示文本输入到大语言模型中,得到多个生成结果语料。最后,根据多个检索结果语料、多个生成结果语料以及目标类别标签,构建有标签的第二语料库。
技术关键词
标签 文本编码器 大语言模型 意图识别模型 计算机 平台 可读存储介质 存储器 处理器 索引
系统为您推荐了相关专利信息
1
一种智能灰度发布方法、系统及计算机设备
实时数据采集装置 业务系统 灰度发布方法 索引机制 历史运行数据
2
一种全尺度人形机器人协调控制方法及系统
人形机器人 协调控制方法 非线性模型预测控制器 关节模组 运动控制算法
3
医学成像扫描仪的智能干预分配
医学成像 数字扫描仪 执行机器学习模型 细丝 非暂态计算机
4
一种软件漏洞检测方法、装置、设备以及存储介质
软件漏洞检测方法 漏洞数据库 大语言模型 识别工具 超文本传输协议请求
5
基于熔池动态特征的熔化极气体保护焊接未熔合缺陷在线预测方法
熔化极气体保护焊接 熔池动态特征 在线预测方法 缺陷位置信息 机器学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号