摘要
本申请公开了一种针对内容缺失的邮件解析方法及设备,涉及电子邮件技术领域,该方法包括:对邮件文本进行文本内容提取和分类,得到所述文本内容的类别;所述类别包括纯文本格式、网页格式和附件;将类别为所述纯文本格式和所述网页格式的文本内容作为待解码文本;对所述待解码文本按照对应编码方式进行解码,得到解码字符串;按照设定字节长度对所述解码字符串进行分片段字符集检测,将符合设定条件的字符集检测结果对应的字符集添加到字符集列表中;通过遍历所述字符集列表中字符集对所述解码字符串进行字符转换,直到解码结果通过语义连贯性判断,得到邮件文本原文。本申请实现了对有内容缺失的邮件的有效解析。
技术关键词
邮件解析方法
文本
解码
列表
阶梯
语义
元素
序列
校正
电子邮件技术
字符
格式
ReLU函数
长短期记忆网络
机器学习模型
编码特征
附件
处理器
计算机设备