摘要
本申请提供了一种基于大语言模型的开放域标签体系构建方法及装置,涉及数据处理技术领域。该方法根据在第一时间段内的不同待标注内容与利用第一大语言模型对各待标注内容进行标注输出的初始标签,构建标签关联池;基于各初始标签的标签出现频次确定初始标签体系和任一初始标签的标签聚类簇;基于预设的语义理解任务描述,利用第二大语言模型的零样本能力确定各初始标签的归一化标签;构建标签有向图集;若检测到第一标签有向图中的第一标签是该有向图中第二标签的归一化标签,且在第二标签有向图中第一标签的归一化标签为第三标签,构建目标标签体系。该方法缩短了从新兴话题出现到标签体系响应时间,提升了标签体系的语义精准性。
技术关键词
标签有向图
大语言模型
标签体系构建方法
语义
定义规则
覆盖率
时间段
同义标签
通信接口
关系
可读存储介质
样本
数据处理技术
存储器
处理器
电子设备
模板
企业
系统为您推荐了相关专利信息
蛋白质功能域
大语言模型
序列
注释方法
命名实体识别模型
无线打印方法
无线通信链路
解码控制
文本
无损压缩算法
卷积神经网络模型
多层次特征
图像分类网络
图像分类方法
样本
大语言模型
分析工具
计算机程序指令
报告
查询机制