摘要
本申请涉及数据管理技术领域,公开一种用于元数据提取的方法,包括:获取待提取文档数据;获取所述待提取文档数据的文本块数据;获取所述文本块数据的特征向量;根据所述特征向量,获取候选元数据;根据所述候选元数据,获取所述待提取文档数据的目标元数据。该方法能够适应不同格式以及专业术语不统一的文档数据进行元数据提取,并且根据候选元数据进一步获取目标元数据,使得获得的目标元数据的准确率更高。本申请还公开一种用于元数据提取的装置及电子设备、存储介质。
技术关键词
文本
数据获取模块
上下文特征
数据管理技术
电子设备
大语言模型
程序
处理器
指令
关键词
语义
格式
存储器
动态
系统为您推荐了相关专利信息
摘要
预警方法
社交媒体平台
数据存储模块
文本分类模型
矩阵
家庭成员画像
模糊综合评价模型
家庭画像
决策方法