摘要
本发明公开了一种案件检索方法,首先通过一种基于堆栈的编码方法对企业案件文档进行编码,该方法在Transformer编码器的基础上,引入了堆栈模拟层来建模长文本的递归状态。然后提出了一种基于结构化信息保留的案件文档向量的降维算法,使用一个基于变分自编码器和随机四重损失的深度学习模型,对案件文档向量进行降维表示,有效地保留了案件文档结构化信息。同时,设计了面向结构保留的向量降维评估方案。最后,为了提高用户检索的精确度,提出了一种基于案件文档与检索匹配得分的重排方法,该方法将已排序的其他候选文档的上下文信息考虑在内,利用上下文的轻量级重排序框架显著增强检索模型的效果。
技术关键词
案件检索方法
检索装置
预训练语言模型
重排方法
sigmoid函数
编码算法
企业
深度学习模型
文档结构化信息
邻域
编码器
降维方法
标识符
曲线
语句
超参数
标签
系统为您推荐了相关专利信息
商标图像检索方法
检索商标
元素
文本
语义分割网络
路径分析方法
网络
级联失效模型
拓扑分析方法
负荷
预训练语言模型
数据匹配方法
数据匹配系统
实体
标签
大语言模型
数据
检索方法
识别用户检索意图
文本