摘要
本发明公开了一种基于大模型的铁路全过程咨询文档数字化及检索方法,包括:S1,铁路全过程咨询文档分类分级;S2,构建大模型部署所需的虚拟环境;S3,构建数字化检索数据库;S4,为分类分级后的铁路全过程咨询文档构建数字化提取标准;S5,文档检索;根据S5的检索结果确定保留的段落隶属于哪一类文档,并根据S4构建的数字化提取标准提取相应内容;S7,将S6提取的内容与S5检索的文档段落进行融合,实现对用户检索需求的精准回答。该方法既提炼了原文档内容,又保留了重点内容,避免了大模型在总结过程中将关键信息遗漏和传统分段方式的内容割裂性,实现了工程进度的实时分析与整体把控,提升了全过程咨询的精准性。
技术关键词
检索方法
铁路
文档分类
文件夹
分段
大语言模型
文本
编码
项目
关键词
语义
打标签
生成方法
自然语言
格式
目录
字段
日期
编程
模块
系统为您推荐了相关专利信息
融合特征
图文检索方法
文本特征向量
图像特征向量
阵列
多通道信号转换器
信号采样方法
模拟信号源
信号采集模块
校准
PWM整流器
模型预测控制方法
编码算法
曲线
时间段
诊断系统
多模态
舌苔图像
融合特征
置信度评估方法