摘要
本发明公开了一种面向修辞手法的讽刺检测方法及系统,涉及文本讽刺检测技术领域,包括采集讽刺对话,进行第一标注;进行第一反事实处理,构建细粒度讽刺数据集;微调语言模型并进行知识增强,优化语言模型讽刺检测性能。本发明所述方法通过采集讽刺对话并进行第一标注,实现了对讽刺语言现象的基础数据构建,通过进行第一反事实处理,构建了可用于模型训练的细粒度讽刺数据集,将讽刺对话改写为非讽刺版本,确保了语境和结构的完整性,通过微调语言模型并进行知识增强,提升了讽刺检测模型的整体性能,双重反事实增强和竞争合理化的结合,既增加了数据样本的丰富性,又提升了模型的推理能力。
技术关键词
数据收集模块
预训练语言模型
处理器
计算机设备
可读存储介质
存储器
文本
标签
样本
基础
系统为您推荐了相关专利信息
文本
生成方法
数据
预训练语言模型
语言模型训练方法
数据处理方法
日志
分析单元
场景分类
计算机程序产品
收益预测方法
LSTM模型
重要性评估方法
长短期记忆网络
动态特征选择
负载均衡器
加密数据
机器可读存储介质
服务器
客户端设备