一种基于大模型微调的中文语法纠错方法、系统

AITNT
正文
推荐专利
一种基于大模型微调的中文语法纠错方法、系统
申请号:CN202411964598
申请日期:2024-12-30
公开号:CN119849482B
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及一种基于大模型微调的中文语法纠错方法、系统。该方法使用Qwen2‑7B模型生成纠错指令数据集;依据复杂度、质量和多样性对指令数据集进行筛选;采用LORA方法对Qwen2‑7B模型进行监督式微调,重点优化自注意力层和前馈网络层,以增强模型对长距离依赖和上下文信息的处理能力;然后使用Qwen2‑72B模型对纠错数据集进行评分,生成偏好标签,并利用这些标签进一步优化Qwen2‑7B模型,从而提升其响应质量;使用直接偏好优化方法,结合偏好数据集对模型进行训练,调整参数以最小化损失函数,从而增强模型对偏好响应的倾向性。该方法通过多层次的优化策略,有效提高了中文语法纠错的准确性。
技术关键词
纠错方法 指令 数据 答案 纠错选项 更新模型参数 复杂度 纠错系统 标签 语句 输入错误 注意力 样本 多层次 因子 机制 矩阵 信号
系统为您推荐了相关专利信息
1
一种基于对比学习的个性化血压监测算法
监测算法 血压 样本 深度学习方法 形态学特征
2
一种基于图神经网络的数据质量评估方法及系统
异常数据 神经网络提取特征向量 关系 数据输出模块 数据输入模块
3
一种船舶船体结构二维图纸和三维模型一致性检查方法和系统
船舶船体 图纸 检查方法 检查系统 零件
4
一种基因组学径向布局可视化推荐方法
推荐方法 节点 统计学特征 布局 轨道
5
隧道掌子面图像描述性模型构建方法、系统、设备及介质
隧道掌子面 图像高维特征 模型构建方法 模型构建系统 深度学习算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号