一种基于大模型微调的中文语法纠错方法、系统

正文

推荐专利

申请号：CN202411964598

申请日期：2024-12-30

公开号：CN119849482B

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及一种基于大模型微调的中文语法纠错方法、系统。该方法使用Qwen2‑7B模型生成纠错指令数据集；依据复杂度、质量和多样性对指令数据集进行筛选；采用LORA方法对Qwen2‑7B模型进行监督式微调，重点优化自注意力层和前馈网络层，以增强模型对长距离依赖和上下文信息的处理能力；然后使用Qwen2‑72B模型对纠错数据集进行评分，生成偏好标签，并利用这些标签进一步优化Qwen2‑7B模型，从而提升其响应质量；使用直接偏好优化方法，结合偏好数据集对模型进行训练，调整参数以最小化损失函数，从而增强模型对偏好响应的倾向性。该方法通过多层次的优化策略，有效提高了中文语法纠错的准确性。

技术关键词

纠错方法指令数据答案纠错选项更新模型参数复杂度纠错系统标签语句输入错误注意力样本多层次因子机制矩阵信号

系统为您推荐了相关专利信息

一种基于对比学习的个性化血压监测算法

监测算法血压样本深度学习方法形态学特征

一种基于图神经网络的数据质量评估方法及系统

异常数据神经网络提取特征向量关系数据输出模块数据输入模块

一种船舶船体结构二维图纸和三维模型一致性检查方法和系统

船舶船体图纸检查方法检查系统零件

一种基因组学径向布局可视化推荐方法

推荐方法节点统计学特征布局轨道

隧道掌子面图像描述性模型构建方法、系统、设备及介质

隧道掌子面图像高维特征模型构建方法模型构建系统深度学习算法

一种基于大模型微调的中文语法纠错方法、系统

站点导航

APP 下载