一种基于大规模语言模型的数据分析方法

AITNT
正文
推荐专利
一种基于大规模语言模型的数据分析方法
申请号:CN202411896741
申请日期:2024-12-23
公开号:CN119358682A
公开日期:2025-01-24
类型:发明专利
摘要
本发明提供一种基于大规模语言模型的数据分析方法,属于数据分析技术领域;步骤包括:步骤1:选择目标数据源,利用接口API调用目标数据源获取原始语句,预处理后得到第一文本序列;步骤2:根据历史库的历史语句,筛选重要提示词构建提示词模板;步骤3:利用提示词模板提取第一文本序列的所有特征,对第一文本序列的所有特征筛选得到重要特征;步骤4:将重要特征作为测试集,历史语句作为训练集,对初始语言模型进行训练,得到大规模语言模型;步骤5:将大规模语言模型配置到生产环境,大规模语言模型分析并处理生产环境的实际语句得到执行结果,判断执行结果和预期结果的误差。使数据分析方法完全通过自然语言实现,提高分析准确性。
技术关键词
数据分析方法 语句 文本 序列 分词 训练集 误差来源 模板结构 LDA算法 生成提示词 HTTP请求 自然语言 数据分析技术 接口 参数 主题 数据格式
系统为您推荐了相关专利信息
1
一种基于文本行识别的蒙古文文本行和词对齐语料库构建方法
语料库构建方法 文本行 字符 图像分割 OSTU算法
2
一种法律文本小样本增强训练的智能处理系统
文本 术语 法律知识图谱 法律专业 裁判文书
3
代码生成方法、装置、电子设备、以及介质
大语言模型 文本 代码生成方法 生成前端代码 图像
4
数据异常监测方法、装置、计算机设备及存储介质
数据异常监测 聚类算法 计算机可读指令 告警方式 指标
5
基于肌电信号的小样本手写识别模型的构建方法及应用
字符识别模型 时序神经网络 手写识别方法 表面肌电信号 训练集
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号