摘要
本发明涉及一种商业信息的自动收集方法、系统、设备以及介质,其方法包括:根据用户对商业信息的需求,确定商业信息的采集对象;控制自动化工具从采集对象的每一信息详细页面中抓取商业信息;对商业信息进行结构化处理和数据格式转换,获得商业信息的多字段结构化数据;根据多字段结构化数据,对选定的底座模型进行迭代训练,得到SQL处理增强模型,该SQL处理增强模型能够基于用户输入的查询要求推送对应的结构化商业信息到用户端。本发明可以定向抓取行业内的商业信息和通过询问的方式得到用户想要的商业领域的维度信息,使得商业信息无需专人就能自动进行收集整理,降低成本的同时也提高了商业信息收集的及时性、全面性和准确性。
技术关键词
自动化工具
自动收集方法
验证码图像
页面
数据格式
自然语言文本
关键词
对象
大语言模型
自动收集系统
列表
字段
语句
计算机可执行指令
信息处理模块
模型训练模块
深度学习模型
抓取模块