摘要
本发明公开了一种针对法律文件的自动化分块标注方法,采用混合分块策略将法律文档分割成多个的文本块,并根据嵌入模型生成各文本块对应的向量形式,将所有的向量存入向量数据库。本发明的针对法律文件的自动化分块标注方法,采用混合分块策略将法律文档分割成多个的文本块,保证块内语义完整性和连贯性的基础上,充分利用文档的结构特点,提高分块的效率和准确性;并将法律文件分块后转换成向量形式,并存入向量数据库,为大语言模型分析法律文件提供合适的向量数据库,以备后续实现近似匹配查找。
技术关键词
标注方法
分块策略
文档分割方法
语义分割方法
字符分割方法
文本
分词技术
语法结构
语义特征
键值
基础
层级
资料
列表
格式
系统为您推荐了相关专利信息
语义分割方法
多尺度特征融合
交叉注意力机制
融合特征
解码器
表型检测方法
图像分割
关键点
模块
半监督语义分割方法
描述符
编译优化方法
神经网络加速器
多核并行
字典
语义特征
半监督训练
分支
多尺度特征提取
监督深度学习