摘要
本发明公开了一种支持语法错误句子的构式提取方法,该方法首先对语法正确的语料进行构式提取,得到每个句子对应的构式集合;接着,根据构式对应句子的词元位置信息,将构式进行去重处理,得到对应词元位置不重叠的构式集合;再将该构式集合分别替代句子中对应的词元,从而嵌入句子中,得到正确句子嵌入构式的模型训练语料;最后利用句子对的方法训练语言模型,利用语言模型对于噪声的鲁棒性,生成语法错误句子的构式集合。该方法能够提取针对语法错误句子的构式集合,是现有的构式提取方法的拓展,有较好的应用前景。
技术关键词
训练语言模型
列表
处理器
存储器
可读存储介质
程序
鲁棒性
电子设备
计算机
数据
噪声
标记
系统为您推荐了相关专利信息
代码混淆
前馈神经网络
生成代码
代码检测方法
样本
激光头
表面检测方法
控制策略
表面缺陷检测
周期
策略
网络
最小化系统
电网能量管理系统
微电网能量管理
数字预失真系数
分段线性模型
预失真模块
信号处理方法
数字模拟转换器