摘要
本发明涉及自然语言处理技术领域,公开了语文作文的处理方法及装置,包括以下步骤S1、获取学生提交的作文数据,通过光学字符识别技术从纸质和图像文件生成的数字文本;S2、对数字文本进行预处理,包括段落划分、句群拆解、去除噪声字符、标准化标点符号及文本分句处理;S3、将句群输入至语义编码模型,获取对应的语义向量,并构建由多个语义向量组成的语义向量场。通过采用构建语义向量场并基于深层语义关系进行评分建模的技术路径,达到了动态捕捉作文逻辑结构、真实反映语义连贯性的技术效果。相较于传统依赖静态词频或词库比对的评分方法,解决了对上下文理解力弱、评分片面的问题。
技术关键词
语义向量
光学字符识别技术
文本
数据获取模块
长短期记忆网络
深度学习算法
分析模块
评分方法
噪声
学生
自然语言
计算方法
风格
冗余
符号
分段