摘要
一种基于大模型的文档校对处理方法,其包括如下步骤:步骤1,对文档预处理识别为文本;步骤2,将文本切分为单独的文本块;步骤3,对文本块进行向量化处理;步骤4,使用任度大模型对文本块进行润色,得到新文本块;步骤5,对新文本块进行向量化处理;步骤6,对比文本块和新文本块的向量相似度,若相似度高,则进入下一步,若相似度低,则重复步骤4至6;步骤7,对比文本块和新文本块的文本,成对的标记差异字符;步骤8,对照文档校对文本块和新文本块并整合输出。本发明能够提供更为准确和全面的文档校对服务,还能够适应语言的动态变化和多样化的文档需求,显著提高文档的专业性和可信度。
技术关键词
文本
字符
标记
词袋模型
格式
分词
报告
数值
参数