摘要
本发明涉及生成式人工智能,提供了一种生成式的法律文本自动化摘要方法、装置及存储介质。本发明旨在解决中文法律文本自动化摘要中存在的语义失真、专业术语处理不足及生成效率低下问题,主要方案包括首先对原始中文法律文本进行字符、标点、句子三个层级的扰动增强,构建语义一致的正例对;将增强文本分别输入BYOL框架的online端和target端编码器,通过多层感知机对编码结果进行维度映射;在online端设置预测器,对归一化后的映射向量计算余弦相似度作为对比损失;采用EMA机制更新target端参数,仅对mBART编码器进行梯度更新并冻结解码器;保存优化后的编码器,结合分层学习率策略在法律文本上微调完整mBART模型,最终生成保留法律要素的高质量摘要。
技术关键词
文本
摘要方法
多层感知机
编码器结构
解码器
字符
梯度下降法
语言模型概率
层级
参数更新模块
联合损失函数
编码器参数
机制
符号
序列
数据
系统为您推荐了相关专利信息
人机语言
交互方法
梅尔频率倒谱系数
深度学习方法
燃油
情感分析模型
广告发布方法
情感类别
更新模型参数
多层感知机
标签提取方法
打分器
随机森林模型
深度信念网络
分布式爬虫集群
前端代码生成方法
非易失性存储介质
数据
前端代码生成装置
静态页面