摘要
本发明提供了一种基于大语言模型的招投标文件自动信息提取方法及系统,该方法通过对招投标文件进行预处理,适用于多种文件格式;构建招投标文件领域的数据集,基于该数据集对BERT模型进行微调,实现对招投标文件的粗略标注;进一步对生成式大语言模型进行微调,利用其上下文理解能力对粗略标签进行细化;将微调后的BERT模型和生成式大语言模型整合为双阶段信息提取模型,实现自动化的信息提取,从而有效提升了从招投标文件提取关键信息的准确性和效率。此外,还通过高亮显示和结构化输出关键信息,使提取结果直观呈现给用户,确保了信息的实用性。
技术关键词
大语言模型
信息提取方法
序列标注模型
粗略
文本
优化器
Softmax函数
信息提取系统
格式
信息提取模型
传播算法
数据
BERT模型
标签类别
处理器
生成方式
词语
分块
系统为您推荐了相关专利信息
深度神经网络模型
监督系统
语音采集模块
文本
录音设备
搜索词
无监督学习
联想方法
监督学习方法
BERT模型
自动测试方法
脚本
属性匹配
测试用例匹配
计算机程序产品
强化学习模型
加密方法
交叉注意力机制
加密策略
节点