摘要
本发明公开了一种基于大语言模型的新闻规范用语检测与更正方法,其特点是采用基于生成器‑检测器协同训练架构,利用Qwen2.5‑7B‑Instruct模型作为生成器,辅以检测器模块对隐向量进行精细筛选,引导生成器避免过度敏感和误改,有效解决了新闻稿件中因字词使用不当、语言表达不规范及等名词错误所导致的新闻用语失范问题。本发明与现有技术相比具有解决新闻稿件中因字词使用不当、语言表达不规范及政治性名词错误所导致的新闻用语失范问题。实验结果显示,该方法在新闻用语更正任务上取得了理想的F0.5指标,表明大语言模型在文本质量控制与智能编辑领域具有广阔的应用前景。
技术关键词
大语言模型
更正方法
检测器模块
文本
字词
检测头
数据
生成模板
训练集
标签
脚本
序列
多任务
框架
超参数
适配器
标记
分词