基于深度语义与上下文自适应的表头列识别方法

正文

推荐专利

申请号：CN202510686107

申请日期：2025-05-27

公开号：CN120197611B

公开日期：2025-09-09

类型：发明专利

摘要

本发明公开了基于深度语义与上下文自适应的表头列识别方法，包括：利用表格解析工具对目标表格文件进行结构化解析，获取目标表格文件对应的目标表头文本、目标表格主体文本和目标表格结构；对目标表头文本进行特征编码，获得目标表头特征；对目标表格主体文本和目标表格结构进行特征提取，获得目标场景上下文特征；将目标表头特征和目标场景上下文特征进行融合，生成目标综合特征；将目标综合特征输入至表头语义分类模型中，输出目标表格文件对应的每个类别的概率，取概率最大的类别作为最终表头语义分类结果。该方法不仅能够自动提取和理解表头的深层语义，还能充分利用表格内容和业务场景的上下文信息，准确判别表头在不同任务下的实际含义。

技术关键词

表头场景上下文表格语义识别方法标签样本文本编码器解析工具大语言模型生成同义词训练语言模型学习方法聚类算法条目数据格式

系统为您推荐了相关专利信息

一种基于多维风险特征的灵活就业身份识别方法及系统

时序预测模型身份识别方法风险时间序列特征身份识别系统

用于基础软件测试的大模型构建方法、装置

样本模型构建方法系统测试用例单元测试用例数据

基于语义编码模型的产品信息问答方法及系统

意图识别模型实体信息问答方法三元组文本

基于数字档案的敏感信息泄露预测方法及系统

实体数据关联规则档案库因子 PageRank算法

实体对表征方法及采用其的少样本文档级关系抽取方法

关系抽取方法注意力原型三元组表征方法

基于深度语义与上下文自适应的表头列识别方法

站点导航

APP 下载