摘要
本申请公开了一种企业管理信息结构化数据处理方法及系统,涉及数据处理技术,包括:基于预设模板文件,将结构化数据转为文本数据;对转换获得的文本数据进行数据清洗与标注;对经过数据清洗与标注的文本数据,采用动态长度切片方法,基于最优检索文本长度,按照语义关系完整、标记完整的方式进行切片,以获得数据处理结果。本申请实施例通过对结构化数据进行语义化、清洗、标注以及切片处理,从而为后续构建语义网络,便于大语言模型通过增强检索技术对文档做向量化处理,优化文档检索的效率和精度提供基础。
技术关键词
企业管理信息
文本
切片方法
模板
语义
数据处理系统
标记
检索技术
元素
大语言模型
数据处理技术
键值
格式
资源库
关系
动态
布局
系统为您推荐了相关专利信息
情感分析方法
多头注意力机制
音频特征
编码器
多模态特征融合
文本
模型训练方法
计算机可执行指令
自然语言模型
字符