摘要
本发明公开了一种信息的处理方法,包括从订阅的各终端数据流中获取原始信息文本数据,进行预处理输出;采用双层BiLSTM‑CRF神经网络结构识别多样化时间表达,提取显式时间表达;通过多头自注意力机制捕获隐含时间信息,结合上下文理解模型提取隐含时间信息;采用时序图谱推理将相对时间转换为绝对时间;基于时间紧迫度和信息重要性双维度评分,动态调整提醒频率和方式;对过期信息进行自动分类归档,释放存储空间;同步采用轻量级架构进行离线识别,与现有生成各消息的终端进行集成,本发明方法能够更进一步处理文本信息存在上下文歧义影响且依赖日期的问题,不能解决模糊表达,还能提升包括嵌套时间实体等复杂表达下的时间提取精度。
技术关键词
表达式
神经网络结构
轻量级架构
时间偏移量
Viterbi算法
朴素贝叶斯分类器
关键词
预训练语言模型
注意力机制
跨节点
序列
多层注意力
生成特征向量
文本分类模型
时序
分词
终端