一种针对法律文件的自动化分块标注方法

AITNT
正文
推荐专利
一种针对法律文件的自动化分块标注方法
申请号:CN202510687725
申请日期:2025-05-27
公开号:CN120596620A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种针对法律文件的自动化分块标注方法,采用混合分块策略将法律文档分割成多个的文本块,并根据嵌入模型生成各文本块对应的向量形式,将所有的向量存入向量数据库。本发明的针对法律文件的自动化分块标注方法,采用混合分块策略将法律文档分割成多个的文本块,保证块内语义完整性和连贯性的基础上,充分利用文档的结构特点,提高分块的效率和准确性;并将法律文件分块后转换成向量形式,并存入向量数据库,为大语言模型分析法律文件提供合适的向量数据库,以备后续实现近似匹配查找。
技术关键词
标注方法 分块策略 文档分割方法 语义分割方法 字符分割方法 文本 分词技术 语法结构 语义特征 键值 基础 层级 资料 列表 格式
系统为您推荐了相关专利信息
1
数据标注方法和装置、评分系统、电子设备及计算机介质
主动学习策略 数据标注方法 标记 标签 样本
2
基于特征协同与多尺度特征融合的RGB-D语义分割方法
语义分割方法 多尺度特征融合 交叉注意力机制 融合特征 解码器
3
一种基于关键点检测和图像分割的小龙虾表型检测方法及系统
表型检测方法 图像分割 关键点 模块 半监督语义分割方法
4
面向多核并行体系结构的卷积算子编译优化方法及装置
描述符 编译优化方法 神经网络加速器 多核并行 字典
5
一种基于双网络协同的半监督深度学习图像复原增强方法
语义特征 半监督训练 分支 多尺度特征提取 监督深度学习
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号