摘要
本发明公开了一种基于大语言模型的数据处理管线方法、系统、设备及存储介质,包括采集数据;对数据进行处理;使用大模型结合语义分析、文本聚类及分类策略对数据分析,获得分层数据;基于分层数据建立智能数据处理管线;对智能数据处理管线的数据进行信息提取及转换,获得标注数据集。本发明弥补了现有企业大模型数据处理的不足及痛点,提升数据处理及合成效率,能够智能、高效地实现数据处理。
技术关键词
智能数据处理
大语言模型
分类策略
分层
处理单元
存储单元
电子设备
管线系统
语义
文本
分析模块
程序
格式
标签
企业
系统为您推荐了相关专利信息
监护设备
身份识别模组
历史生理数据
语音处理单元
神经网络模型
检查方法
数字芯片设计
黑盒模型
模式
EDA工具
机器人装置
紫外分光光度计
混合组件
半导体温控模块
电解水模块
动态知识图谱
实体
大语言模型
故障原因分析方法
对象