摘要
本发明属于自然语言处理技术领域,具体公开了一种基于多模态增强的中文拼写纠错方法,通过构建语义、视觉、听觉感知模块,提取待纠错文本中的语义、视觉、听觉感知特征向量,实现深度融合多模态信息检错,显著提升检错效果。并且在通过检错网络获得检错标签后,将纠错任务转化为填空任务,利用大语言模型的强大语义理解能力进行纠错,并结合上下文学习为大模型提供任务相关示例,使其快速适应中文拼写纠错任务,避免无约束润色,提高了纠错性能。同时本发明基于预训练模型和大语言模型训练及构建,避免了使用大规模语料进行复杂训练,降低了应用成本。
技术关键词
拼写纠错方法
纠错文本
序列
听觉
语义
字符
大语言模型
视觉
融合多模态信息
编码
拼音
标签
大规模语料
通道
模块
更新模型参数
全局平均池化
系统为您推荐了相关专利信息
云端管控系统
AI深度学习
电力作业管理系统
智能分析模块
视频流
序列推荐方法
融合全局
前馈神经网络
生成推荐项目
多层感知机
光伏发电数据
预处理系统
光伏发电设备
特征提取模块
数据模块