摘要
基于大语言模型提示微调的招标文件半结构自动生成方法和装置,其方法包括:步骤1,基于利用有向无环词图、隐马尔可夫模型,对招标文件数据预处理;步骤2,基于TextRank无监督关键短语提取方法,从经过预处理的招标文件数据中提取关键短语,对招标文件的重点内容进行标注提示;步骤3,基于P‑tuning提示微调方法,利用大语言模型对招标文件数据和关键短语进行建模,设置不同初始化参数;对招标文件数据进行二次MASK机制消除模型微调过程中的学习偏差同时提高特征提取准确性,关键短语仍使用传统方式进行特征提取;步骤5,构建过滤注意力机制,对特征向量嵌入结果进行一定的过滤:去除无用的干扰信息,保留关键信息;步骤6,基于最大边缘相关性算法,将经过半结构化处理的基础招标文件与提取的招标文件中关键信息进行结合,输出得到最终的招标文件。
技术关键词
自动生成方法
大语言模型
隐马尔可夫模型
微调方法
关键短语提取方法
注意力机制
预训练语言模型
文本
精确地识别
噪声数据
学习方法
生成装置
处理器
偏差
算法
可读存储介质