摘要
本发明公开了一种基于双重反馈机制的金融领域训练数据构建方法,涉及自然语言处理技术领域,该方法包括以下步骤:基于预先获取的初始信息,利用检索增强生成技术检索得到外部知识,结合思维链提示词形成综合信息,并对综合信息进行筛选;通过对话基座模型,将筛选后的综合信息作为对话基座模型的输入,生成逻辑信息,并将逻辑信息通过思维蒸馏生成简洁信息;利用AI教师模型,对简洁信息进行多维度评分,并根据评分结果筛选简洁信息,构建训练数据集。本发明通过输入端的RAG技术和思维链提示词,模型能够获取丰富的金融领域知识;在输出端,利用AI教师模型对生成的答案进行多维度的自动化评分,确保了训练数据集的高质量。
技术关键词
数据构建方法
生成技术
金融
转换器架构
逻辑
注意力机制
教师
前馈神经网络
基座
度计算方法
语义
蒸馏
序列
答案
自然语言
非线性
文本
系统为您推荐了相关专利信息
存储芯片
控制电路
存储控制器
存储电路
逻辑电路
微服务架构
管控平台
子模块
业务逻辑模型
钢结构
车灯系统
动态电源管理
模糊逻辑
综合性
系统响应速度