摘要
本发明公开了一种语文辞书书证中词目检查方法、系统、设备及介质,所述方法包括:从预处理的文献数据中获取词目、拼音、文献原文及切分后的书证内容;通过替换和/或清除冗余符号,标准化朝代名、作者名及文献名;在书证内容中检索词目,标记未匹配结果;根据辞书类型对词目进行繁体或简体形式的多版本检索;基于预定义的关键词筛选非书证文本,清除误报结果;将剩余未匹配的词目及关联数据作为审稿结果输出。本发明实施例解决了人工校对低效性与高错误率的问题。
技术关键词
检查方法
简体
关键词
数据
字符串匹配算法
执行存储器存储
冗余
符号
拼音
检查系统
处理器
标记单元
文本
错误率
程序
电子设备
介质
系统为您推荐了相关专利信息
光纤缺陷检测
PID控制器参数
时间序列预测模型
识别表面缺陷
卡尔曼滤波
安防监控机器人
变电站作业
视频
监控方法
防护监控装置