摘要
本发明公开了一种基于发票内商品详情数据提取标准化产品单元的方法,属于大数据处理领域,具体包括:首先,定义产业链,确定产业链范围;并初建基于知识的产业链结构;然后,在产业链上中下游各商品/服务环节中确定各环节的基础SPU,即该商品环节的通用名称;接着,编写商品/服务环节的策略语句,并确定发票编码;在superset内部系统平台,通过MySQL语句查找与商品/服务环节相关的发票详情数据,剔除杂质发票数据后提取发票详情数据标准化产品单元,最后,为发票详情数据标注SPU标签;本发明具有快速提取、批量获得的优势,以及提高数据分析效率,增加数据应用领域的意义。
技术关键词
发票
语句
策略
基础
同义词
数据分析效率
企业
链条式
编码
代表
定义
语义
批量
形态
标签
核心
平台
关系
系统为您推荐了相关专利信息
深度强化学习
动态路径规划方法
车辆路径规划技术
因子
策略
视频解码方法
视频解码系统
机顶盒硬件
低功耗
任务分配算法
调控方法
模糊逻辑
动态
光谱分析技术
遗传算法优化
大语言模型
机器可读指令
数据
处理器
可读存储介质