摘要
本发明公开一种基于迁移学习的教学幽默语言检测模型,属于自然语言处理技术领域。包括迁移学习模块、TCCA融合网络和长文本语义理解模块,其中迁移学习模块利用ChineseClip模型的文本编码器提取上下文幽默语义特征,TCCA融合网络模块通过改进的TCCA融合网络对词向量特征进行卷积、矩阵运算、注意力计算和参数聚合;长文本语义理解模块对TCCA输出的特征序列进行双向建模,捕捉长距离语义关系和语义转折,输出分类结果。本发明还构建了T‑humor数据集,并在CCL2018、CCL2019和T‑humor数据集上进行实验,证明该模型能有效提取幽默语义特征,识别语义转折,在F1分数等指标上表现优异,具有良好的检测性能和泛化能力,为教学幽默语言的自动检测提供了有效解决方案。
技术关键词
教学
注意力
文本编码器
矩阵
语义特征
语义相关度
上下文特征
标签
序列
网络模块
融合特征
自然语言
图像处理
数据
训练集
爬虫
系统为您推荐了相关专利信息
分析方法
脂肪
通道注意力机制
多任务联合学习
融合多模态特征