摘要
本发明涉及大数据技术领域,具体涉及一种融合RPA与AI技术的电力营销售电数据收集方法。售电数据收集方法包括如下过程:RPA收集结构化售电量数据;RPA收集非结构化国民经济数据,并对提取的网页文本进行全面的数据清洗;文本数据标注;将标注好的数据集输入BERT模型;利用训练好的BERT模型对标注后的数据集进行信息抽取;将其与从营销系统中提取的结构化售电量数据相结合,生成统一的结构化数据格式,为后续的数据分析和决策提供高质量的数据支撑。本发明具有以下显著优点:通过RPA自动化实现数据的高效提取和清洗,极大减少了人工干预,显著提升整体数据处理速度。
技术关键词
数据收集方法
BERT模型
结构化数据格式
文本
电力
标签
营销系统
数据发布
实体
页面
标注策略
三元组
读取工作
报表
列表
大数据技术
标记
服务系统
关系