摘要
本发明提供一种基于大规模语言模型的数据分析方法,属于数据分析技术领域;步骤包括:步骤1:选择目标数据源,利用接口API调用目标数据源获取原始语句,预处理后得到第一文本序列;步骤2:根据历史库的历史语句,筛选重要提示词构建提示词模板;步骤3:利用提示词模板提取第一文本序列的所有特征,对第一文本序列的所有特征筛选得到重要特征;步骤4:将重要特征作为测试集,历史语句作为训练集,对初始语言模型进行训练,得到大规模语言模型;步骤5:将大规模语言模型配置到生产环境,大规模语言模型分析并处理生产环境的实际语句得到执行结果,判断执行结果和预期结果的误差。使数据分析方法完全通过自然语言实现,提高分析准确性。
技术关键词
数据分析方法
语句
文本
序列
分词
训练集
误差来源
模板结构
LDA算法
生成提示词
HTTP请求
自然语言
数据分析技术
接口
参数
主题
数据格式
系统为您推荐了相关专利信息
语料库构建方法
文本行
字符
图像分割
OSTU算法
大语言模型
文本
代码生成方法
生成前端代码
图像
数据异常监测
聚类算法
计算机可读指令
告警方式
指标
字符识别模型
时序神经网络
手写识别方法
表面肌电信号
训练集