摘要
本申请提供一种组词训练数据生成装置、组词训练装置及方法、电子设备、存储介质及计算机程序。组词训练数据生成装置包括第一数据处理模块,根据汉字数据的字难度等级和字相似性属性创建多个汉字数据集合,每个汉字数据集合包括字表难度等级和一组相似汉字数据;第二数据处理模块,遍历每个汉字数据集合中的汉字数据,针对每个汉字数据集合中的每个汉字数据,确定能够与该汉字数据组词的匹配汉字数据及对应的词数据;至少根据对应汉字数据所在汉字数据集合的字表难度等级确定每个词数据的词难度等级;利用汉字数据集合中的汉字数据的匹配汉字数据创建对应的匹配汉字数据集合,利用汉字数据集合中的汉字数据对应的词数据创建对应的词数据集合。
技术关键词
汉字
训练题目
训练数据生成方法
数据生成装置
训练装置
家族
数据处理模块
语义
矩阵
处理器
语音
层级
提示音
标记
电子设备
基础
存储器
计算机
系统为您推荐了相关专利信息
视频生成模型
视频生成方法
训练样本集
对象
序列
剪枝模型
跨模态
预测特征
输出特征
内容生成方法
图像分割模型
字典数据库
积水识别方法
样本
矩阵