摘要
本发明公开了一种基于大语言模型的自动化特征工程方法和装置。其方法包括:S1,获取原始表格数据集并划分为训练数据集和预测数据集;S2,对原始表格数据集进行提示词设计,并指定一个适用于预测的机器学习模型和对应的评估指标;S3,将S1和S2获取的数据输入一个具有通用领域知识的大语言模型;S4,引导大语言模型自动构造出新特征和对应代码,并自动运行代码评估新特征,如果提高了评估指标的性能则保留,将当前表格数据集替换为增加新特征的表格数据集,否则丢弃掉;S5,重复步骤S4,直到达到评估指标的性能目标或达到指定的迭代次数停止迭代输出迭代结果。本发明的方案可以挖掘出传统方法难以发现的潜在特征,优化提升特征构造的效果。
技术关键词
大语言模型
机器学习模型
自动化特征工程
表格
数据
指标
项目特征
生成代码
生成特征
可读存储介质
模板
处理器通信
计算机
记忆
语义
存储器
电子设备
系统为您推荐了相关专利信息
地表形变检测
训练卷积神经网络
干涉合成孔径雷达技术
合成孔径雷达SAR图像
分类方法
停机方法
停机方式
三相桥式整流电路
关断时间
无位置传感器控制
等离子体控制系统
交互式可视化
测试平台
客户端
文档生成模块