金融数据驱动的多模态大模型强化学习训练方法及装置

正文

推荐专利

申请号：CN202511005145

申请日期：2025-07-21

公开号：CN120893512A

公开日期：2025-11-04

类型：发明专利

摘要

本发明属于金融科技与人工智能交叉技术领域，公开了金融数据驱动的多模态大模型强化学习训练方法及装置。本发明利用GRPO实现了多模态模型对股票图具体准确的分析；设计动态奖励函数，通过匹配格式标签、文本语义相似度和分段奖励机制三重反馈优化模型输出，解决了传统方法因模态割裂导致的股票图表解读准确性不足的问题；利用专家知识引导的GRPO策略优化，在训练过程中通过动态调整策略更新的阈值范围，使模型在训练过程中既能充分学习历史数据中的技术形态规律，又能适应市场突发变化特征，从而提升模型在未见数据上的泛化性能。

技术关键词

学习训练方法金融技术分析人工智能交叉技术标签文本学习训练装置大语言模型格式学习历史数据语义向量样本强化学习模型更新模型参数分段评分机制策略更新

系统为您推荐了相关专利信息

一种基于多模态对比学习的医学图像预测方法

图像预测方法肺结节图像多模态肺结节良恶性预测分类特征

一种NL2SQL大语言模型的自增强微调方法和装置

指令自然语言种子数据库访问编码向量

一种高惯量同步调相机

同步调相机故障监测系统分布式传感器故障诊断系统融合神经网络

基于大语言模型的交通多智能体仿真决策方法及系统

大语言模型通信桥接装置决策系统决策方法蒙特卡洛树搜索

一种多标签文本分类方法、装置、芯片及终端

注意力矩阵多标签文本分类文本分类技术处理器

金融数据驱动的多模态大模型强化学习训练方法及装置

站点导航

APP 下载