摘要
本发明公开了一种基于深度学习辅助规则的时间表达式提取方法,依构建时间词、时间修饰词以及连接词形成规则集,使用正则表达式匹配特定格式,识别文本中的时间表达式;利用预训练模型与Bi‑LSTM融合上下文信息,借助位置编码、引入词汇特征及词性特征计算特征函数,通过CRF层最大似然估计学习权重,最后使用维特比算法解码,以实现对时间表达式的最优及结果提取;整合提取的时间表达式,根据提取结果是否一致,采取不同的处理策略。本发明不仅解决了单纯依靠规则在特定时间表达识别上的不足,而且深度学习部分的加入显著提高了时间表达式的提取效率和准确性。
技术关键词
表达式
融合上下文信息
维特比算法
规则集
Word2Vec模型
训练SVM分类器
梯度下降优化算法
预训练模型
深度学习识别
编码向量
注意力机制
标签
交叉验证方法
文本
序列
解码
标记
格式
系统为您推荐了相关专利信息
协同控制方法
六自由度动力学模型
编队系统
推力
速度
特征描述符
合金设计方法
机器学习模型
皮尔逊相关系数
数据
城市信息系统
城市信息模型
抢修工程车
路段
数据获取模块
ARMA模型
传感器噪声
多项式
估计方法
传感器阵列