一种基于多任务学习的词性标注与标点恢复方法及模型

正文

推荐专利

申请号：CN202410763406

申请日期：2024-06-13

公开号：CN118643823A

公开日期：2024-09-13

类型：发明专利

摘要

本发明涉及基于多任务学习的词性标注与标点恢复方法及模型，属自然语言处理领域。通过采用多任务学习策略，同时处理标点恢复和词性标注，从而允许模型在学习过程中共享相关的表征。这种融合词性特征的方法使得模型能更深入地理解文本的句法结构，更准确地预测标点符号位置。本发明模型包括：编码层、词性标注层和标点恢复层。这种多任务学习框架允许模型在不同的语言学层面上进行联合训练，从而在词性标注和标点恢复两个任务上都取得更好性能。这种多任务学习方法不仅提高模型的预测精度，还增强其对复杂语言现象的处理能力。本发明能显著提升缅甸语音转录文本中标点恢复的整体性能，证明多任务学习方法在提升缅甸语标点恢复准确性方面的有效性。

技术关键词

恢复方法多任务学习方法前馈神经网络多任务学习策略预训练语言模型编码器非线性序列条件随机场句法结构文本注意力机制自然语言指标数据有效性

系统为您推荐了相关专利信息

一种基于交通场景的单目场景流估计方法及系统

场景流估计方法单目深度估计生成场景图像数据

环境扰动下非塔台航路轨迹预测方法、系统、设备及介质

蒙特卡洛风速轨迹预测方法子模块轨迹预测模型

一种基于频谱重构神经网络的鼓风机轴承温度预测方法

编码模块矩阵可编程逻辑控制器模块温度预测模型鼓风机

一种基于无人机平台的无标靶式结构振动信号采集方法

振动信号采集方法无人机平台视频图像基础设施结构

基于执法记录仪的煤矿生产控制方法、系统、电子设备及存储介质

三维语义分割执法记录仪采煤机状态控制策略视频

一种基于多任务学习的词性标注与标点恢复方法及模型

站点导航

APP 下载