摘要
本专利提出了一种本地qwen模型从长合同文本内容提取自定义字段的方法。首先,选择Qwen1.5‑7B‑Chat作为本地大模型进行长文本合同字段抽取,从开源社区下载Qwen1.5‑7B‑Chat模型到本地进行部署,下载并配置了Langchain‑Chatchat项目,使其能够使用Qwen1.5‑7B‑Chat模型;其次,由于合同文本通常较长,我们采用长文本分片的方式进行处理;接下来,我们通过调用Langchain‑Chatchat的API进行字段抽取,将合同文本和所需的字段组成prompt,并将其传入API中;最后,将字段结果转换为业务所需的格式并进行数据清洗和校验,利用自定义的agent对结果进行评估和校准。该方法可以应用于于多个领域,不仅提高了合同管理的效率和质量,降低了人工审核和录入的错误率,还为企业提供了更可靠的决策支持。随着人工智能技术的不断发展,该方法将在未来具有更广阔的应用前景。
技术关键词
开源社区
文本
字段
分片
校准
人工智能技术
格式
项目
逻辑
数据
错误率
基础
决策
企业
定义