摘要
本发明适用于档案管理查询技术领域,尤其涉及基于双参数稀疏正则化参数微调的大模型档案问答系统,所述系统包括:查询生成模块,用于通过自然语言处理将用户输入的问题转化为语义查询数据,生成语义向量;知识库检索模块,用于筛选出与用户查询档案内容;生成增强模块,用于输出答案;优化模块,用于扩展知识库的语义覆盖范围、解析图片内容、对OCR文档进行预处理以及对大模型进行微调。本发明提供的基于双参数稀疏正则化参数微调的大模型档案问答系统,针对OCR文档中常见的乱码、信息缺失和结构混乱问题,采用了qwen2‑7b‑instruct模型进行智能化预处理,通过该模型,系统能够自动清理冗余换行符,重构段落结构,从而提升文本的逻辑性和连续性。
技术关键词
正则化参数
问答系统
矩阵
图片
自然语言
语义向量
生成同义词
文本
段落结构
同义词库
查询技术
阶段
模块
元素
答案
数学模型
图谱
系统为您推荐了相关专利信息
复合材料结构
感知控制方法
疲劳损伤状态
虚拟仿真平台
压电陶瓷片
地震波场
矩阵变换算法
地震检波器
叠前深度偏移
裂缝检测方法
网络资源管理方法
路由器接口
网络接口
网络资源管理装置
云平台环境