语料扩展方法、设备及存储介质

AITNT
正文
推荐专利
语料扩展方法、设备及存储介质
申请号:CN202510282003
申请日期:2025-03-11
公开号:CN119783672B
公开日期:2025-07-11
类型:发明专利
摘要
本申请公开了一种语料扩展方法、设备及存储介质,该语料扩展方法包括:对原始语料进行分词得到原始词汇;基于候选替换词汇和/或原始词汇对应的词义数量,确定与候选替换词汇匹配的评分影响因素;利用评分影响因素计算候选替换词汇对应的替换推荐评分,选取替换推荐评分满足预设条件的候选替换词汇作为原始词汇对应的目标替换词汇;将原始语料中的原始词汇替换为原始词汇对应的目标替换词汇,得到扩展语料,可以准确获取不同候选替换词汇匹配的评分影响因素,提高替换推荐评分的计算准确性,进而提高各个原始词汇的目标替换词汇选取的准确性,在增加语料数量的前提下,减少扩展语料相对原始语料出现语义变化的情况,保证扩展语料的质量。
技术关键词
语料扩展方法 实体关联关系 自然语言模型 语句 自然语言转换 三元组 依存句法分析 语义特征 命名实体识别 可读存储介质 分词 电子设备 处理器 程序 指令 存储器 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号