基于文本相关性的大模型金融数据合成方法及系统

正文

推荐专利

申请号：CN202411442099

申请日期：2024-10-16

公开号：CN119474896A

公开日期：2025-02-18

类型：发明专利

摘要

本发明提出基于文本相关性的大模型金融数据合成方法及系统。首先将金融领域文档结合金融特性深度优化向量生成过程进行去重，转化为低维向量表示并构建语料图，然后依据金融数据独特性重新定义语料图的节点和边精心构建语料图，再然后利用基于定义的节点优先级和利用贪心算法串联文档，引入金融风险评估和市场趋势分析因素，根据金融数据的相关性和重要性动态调整路径搜索策略，优先串联最相关的文档，形成语义高度连贯流畅的上下文作为大模型金融预训练语料。

技术关键词

金融大语言模型大规模文本数据风险评估值贪心算法术语指标数据分布语义样本搜索模块概念定义遗传算法矩阵节点多任务关系

系统为您推荐了相关专利信息

一种层次化语义网构建的智能课件自动分类方法及系统

层次化语义自动分类方法构建知识图谱语义特征大语言模型

数据处理方法、装置、设备、介质和产品

交换机阶段数据处理方法单层数据处理装置

一种基于智能体的口语化对话数据处理方法

对话数据处理方法韵律特征节点人工智能大数据处理技术加权有向图

智能语音交互与情感分析系统

情感分析系统智能语音交互多模态情感识别情感特征验证机制

一种文本数据的生成与评估方法及系统

大语言模型数据意图非结构化文本评估系统

基于文本相关性的大模型金融数据合成方法及系统

站点导航

APP 下载