摘要
本发明公开了一种基于历史经验的强化学习买卖点预测模型训练方法,用于金融领域,包括以下步骤:获取金融交易数据,预处理后得到精简分时图;基于精简分时图,利用波段理论分析框架,构建监督微调数据集;根据监督微调数据集对大模型进行预微调,得到强化后的大模型;利用奖励模型和强化学习近端策略优化,对强化后的大模型进行评分与重排,并对监督微调数据集进行微调;根据微调后的监督微调数据集,对初始大模型进行训练,得到买卖点预测模型。本发明提出一个应用强化学习从历史经验反馈技术学习金融知识和交易经验的训练框架,提升模型的波段分析和买点预测能力,能在快速变化的金融市场中实现更具竞争力的交易策略。
技术关键词
预测模型训练方法
金融交易数据
极值
数据编码
线性
视觉
多模态
理论
框架
策略
反馈技术
排序模型
图片
文本
算法
表达式
答案
系统为您推荐了相关专利信息
等效电路模型
无迹卡尔曼滤波算法
协方差矩阵
计算机存储介质
预测误差
轮胎载荷估计方法
流固耦合模型
轮胎充气压力
非线性动力学特性
工况特征
模仿机器人
人形机器人
编码器
模仿学习方法
解码器模型
燃料电池余热
温度感测光缆
循环利用装置
随机森林模型
高温电缆
核磁共振T2谱
表征方法
动态时间规整算法
数据
储层孔隙结构