摘要
本发明提供基于词典的政企非结构化数据要素解析组件实现方法,涉及数据处理技术领域,包括对非结构化数据分词,构建特征矩阵;在纵向建立字符前缀树,横向构建属性关联表,设置交叉引用指针及属性继承机制;将属性增强实体词划分为子词典分片,根据语义关联强度分配至多个要素解析通道并行处理;最后合并解析结果生成结构化数据要素集合。本发明提高了政企数据要素解析的准确性和效率。
技术关键词
词典
分片
生成结构化数据
节点
字符
哈希算法
指针
多维特征向量
通道
计算机程序指令
深度优先搜索算法
双向注意力机制
属性匹配
拓扑特征
语义依存分析
关系网络
矩阵
信息熵
系统为您推荐了相关专利信息
网络通信状态
公有云
数据
模型更新
机器人自动化控制
工作周期
非线性
年龄
数据协同传输方法
面向工业互联网
设计优化方法
样本
序列
多学科设计优化
多学科设计技术
协同管理方法
粮仓
贝叶斯网络模型
动态知识图谱
策略
交易管理方法
区块链技术
分布式账本
交易系统
数字签名验证