摘要
本申请公开了一种语料扩展方法、设备及存储介质,该语料扩展方法包括:对原始语料进行分词得到原始词汇;基于候选替换词汇和/或原始词汇对应的词义数量,确定与候选替换词汇匹配的评分影响因素;利用评分影响因素计算候选替换词汇对应的替换推荐评分,选取替换推荐评分满足预设条件的候选替换词汇作为原始词汇对应的目标替换词汇;将原始语料中的原始词汇替换为原始词汇对应的目标替换词汇,得到扩展语料,可以准确获取不同候选替换词汇匹配的评分影响因素,提高替换推荐评分的计算准确性,进而提高各个原始词汇的目标替换词汇选取的准确性,在增加语料数量的前提下,减少扩展语料相对原始语料出现语义变化的情况,保证扩展语料的质量。
技术关键词
语料扩展方法
实体关联关系
自然语言模型
语句
自然语言转换
三元组
依存句法分析
语义特征
命名实体识别
可读存储介质
分词
电子设备
处理器
程序
指令
存储器
计算机