摘要
本发明公开了一种基于Deepseek强化学习的铁路行业问答方法及系统,涉及自然语言处理技术领域。该方法包括:构建铁路行业指令数据集和铁路问答模型;所述铁路问答模型是以大语言模型为基座模型,并通过铁路行业指令数据集对基座模型进行多阶段微调获得的;收集铁路行业文本数据整合向量化,形成知识向量库;利用Railway‑Embedding模型对用户问题文本向量进行向量检索,同时用BM25算法进行全文检索,将两种检索结果排序得目标检索结果;把用户问题和目标检索结果输入铁路问答模型,输出问题的思考过程和回答内容。本发明充分利用了deepseek强化学习技术对大模型进行微调,提升对行业专业术语的理解及长篇询问的应对能力,同时让模型具有思考能力,从而使模型回答逻辑更加清晰。
技术关键词
铁路
问答模型
问答方法
数据
基座
指令
答案
大语言模型
多阶段
强化学习技术
负面文本
自然语言
蒸馏
问答系统
搭建模块
格式
策略
参数
系统为您推荐了相关专利信息
参数优化方法
拉铆设备
材料横截面
材料弹性模量
报告
智能家居监控系统
室内定位数据
热成像
控制模组
摄像模块