摘要
本发明涉及一种开源软件许可证法律条款信息提取方法及装置,属于计算机技术领域,该方法包括:获取开源软件许可证的包含完整条款相关语义信息的许可证文本;将许可证文本输入到预先训练得到的法律条款信息提取模型,输出开源软件许可证的法律条款信息;其中,法律条款信息提取模型是通过对于基于大型语言模型的学生模型进行知识蒸馏训练得到的,知识蒸馏训练的训练数据包括通过将开源软件许可证训练样本和预设的Prompt模板输入到基于大型语言模型的至少一个教师模型输出的软标签。本发明提供的开源软件许可证法律条款信息提取方法及装置,提高了软件许可证法律条款提取的准确性和完整性,并提高了泛化能力。
技术关键词
信息提取模型
信息提取方法
软件
教师
标签
蒸馏
学生
文本
模板
信息提取装置
语义
格式
输出模块
数据