一种基于多任务学习的词性标注与标点恢复方法及模型

AITNT
正文
推荐专利
一种基于多任务学习的词性标注与标点恢复方法及模型
申请号:CN202410763406
申请日期:2024-06-13
公开号:CN118643823A
公开日期:2024-09-13
类型:发明专利
摘要
本发明涉及基于多任务学习的词性标注与标点恢复方法及模型,属自然语言处理领域。通过采用多任务学习策略,同时处理标点恢复和词性标注,从而允许模型在学习过程中共享相关的表征。这种融合词性特征的方法使得模型能更深入地理解文本的句法结构,更准确地预测标点符号位置。本发明模型包括:编码层、词性标注层和标点恢复层。这种多任务学习框架允许模型在不同的语言学层面上进行联合训练,从而在词性标注和标点恢复两个任务上都取得更好性能。这种多任务学习方法不仅提高模型的预测精度,还增强其对复杂语言现象的处理能力。本发明能显著提升缅甸语音转录文本中标点恢复的整体性能,证明多任务学习方法在提升缅甸语标点恢复准确性方面的有效性。
技术关键词
恢复方法 多任务学习方法 前馈神经网络 多任务学习策略 预训练语言模型 编码器 非线性 序列 条件随机场 句法结构 文本 注意力机制 自然语言 指标 数据 有效性
系统为您推荐了相关专利信息
1
一种基于交通场景的单目场景流估计方法及系统
场景流估计方法 单目深度估计 生成场景 图像 数据
2
环境扰动下非塔台航路轨迹预测方法、系统、设备及介质
蒙特卡洛 风速 轨迹预测方法 子模块 轨迹预测模型
3
一种基于频谱重构神经网络的鼓风机轴承温度预测方法
编码模块 矩阵 可编程逻辑控制器模块 温度预测模型 鼓风机
4
一种基于无人机平台的无标靶式结构振动信号采集方法
振动信号采集方法 无人机平台 视频 图像 基础设施结构
5
基于执法记录仪的煤矿生产控制方法、系统、电子设备及存储介质
三维语义分割 执法记录仪 采煤机状态 控制策略 视频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号