一种基于大语言模型的古籍文本校勘方法和系统

正文

推荐专利

申请号：CN202411870675

申请日期：2024-12-18

公开号：CN119719343A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了一种基于大语言模型的古籍文本校勘方法和系统，涉及文本处理技术领域，方法包括：获取带有掩码标记的待勘校古籍文本；对待勘校古籍文本按照标题进行向量转换，确定各标题的多个向量文本句；通过预训练大语言模型基于中文通用词表对带有掩码标记的向量文本句进行掩码预测，输出各掩码标记的掩码预测词概率分布；采用各掩码预测词概率分布对关联的带有掩码标记的向量文本句进行校勘，输出对应的第一已校勘向量文本句；若任一第一已校勘向量文本句的校勘正确率均大于或等于预设正确率阈值，则根据各第一已校勘向量文本句生成已勘校古籍文本。利用大语言模型强大的上下文理解与文本预测能力对待校勘文本进行智能化校正，提高校勘效率。

技术关键词

大语言模型正确率标记文本处理技术处理器计算机程序产品指令计算机设备模块可读存储介质存储器分词字符校正

系统为您推荐了相关专利信息

一种通过人类语音匹配数字鱼偶形象水面游动动作的算法

情绪特征大语言模型强度水面深度学习算法

一种基于大语言模型认知增强的虚假新闻检测方法

大语言模型交叉注意力机制画像模型构建用户画像多视角

一种车辆投影灯的控制方法、装置、车辆和存储介质

灯效投影灯语音特征信息文本数据

车辆事故处理方法、装置、设备及存储介质

车载摄像装置动画单车车辆碰撞事故车辆管理技术

一种数据治理的过程优化及监控的实现方法

识别异常数据动态规则引擎机器学习算法可视化工具告警机制

一种基于大语言模型的古籍文本校勘方法和系统

站点导航

APP 下载