摘要
本申请提供了一种英语学习语料库动态更新方法及系统,所述方法包括:基于预设规则将英语语料数据采集任务分布到多个节点,对多个节点采集的英语语料数据进行初步处理;对初步处理的英语语料进行深度清洗和标准化处理,获取标准化英语语料数据;基于预设的多标签分类模型对标准化英语语料数据进行多维度分类,生成一系列的标签,获取分类结果;从分类的英语语料中提取实体和关系,通过建立语义链接和概念映射形成知识图谱;通过知识图谱对采集的不同分类英语语料进行增量评估,获取评估结果,对评估结果满足预设阈值的英语语料,动态更新到对应分类英语语料数据中,本申请可以高效提升英语语料的质量,实现对英语语料库的动态均衡更新。
技术关键词
动态更新方法
标签
节点
实体
动态更新系统
英语语料库
语义角色标注
构建知识图谱
知识图谱构建
关系
概念
可读存储介质
扩充模块
数据获取模块
计算机
系统为您推荐了相关专利信息
故障电弧识别方法
邻域特征
神经网络模型
识别故障电弧
采集单元
伺服驱动方法
伺服驱动装置
图像处理模型
信息处理模型
控制伺服驱动
上行功率控制方法
节点特征
网络功率控制方法
网络能量效率
单小区
沉降监测方法
防护堤坝
传感器节点
光纤光栅传感器阵列
北斗短报文