摘要
本发明提供了一种数字内容标识体系的构建方法,包括:利用预训练的大语言模型,生成模型训练所需的训练数据;根据所述训练数据从不同维度构建初始的树状结构,形成初始标识体系;从所述初始标识体系提取标识数据,构建正负样本对,并利用所述正负样本对将语义嵌入模型进行微调;利用微调后的所述语义嵌入模型,将新出现的数字内容标识与标识体系里的标识进行语义比较,确定所述新数字内容标识在所述树状结构中的内容关联的同级结点,并将所述新数字内容标识定位到所述同级结点处。本发明还提供一种数字内容标识体系的构建系统、存储介质及电子设备。借此,本发明在无需大量基础数据情况下,能够构建一个准确捕捉词语深层语义关系的标识体系,使得标识集结构化和关系化,便于分析、展示和持续更新。
技术关键词
标识
词语
树状结构
语义
结点
样本
节点
数据
构建系统
迭代优化算法
大语言模型
处理器
计算机设备
关系
模块
电子设备
主题
标志
存储器
基础
系统为您推荐了相关专利信息
文件获取方法
存储器
多媒体播放器
文件获取装置
电子装置
调度优化方法
Kriging模型
混合流水车间调度
订单
样本
虚拟网卡管理方法
虚拟网桥
网卡管理系统
关系
KVM虚拟化