摘要
本发明涉及自然语言处理技术领域,具体地说,涉及一种高质量的藏文文本数据增强方法及模型,将藏文形容词按语义特征及修饰对象分为描述性质、状态、数量、感官和感受等五大类四十六小类,通过提取藏文形容词和形容词修饰对象的特征构建了藏文形容词知识库和形容词修饰对象近义词表,本发明通过匹配形容词的类型、音节数等特征替换形容词,同时,匹配形容词修饰对象的句式结构,将形容词修饰对象用近义词表中对应的词替换。本发明能够显著增加藏文文本数据量。
技术关键词
句式结构
对象
文本
数据校正
语义特征
感官
识别模块
自然语言
数据项
智力
听觉
分词
观点
心理
年龄
生理
视觉
系统为您推荐了相关专利信息
图像生成网络
生成对抗网络架构
迁移方法
语义分割网络
语义特征
真实性验证方法
深度学习模型
情感倾向分析
语义向量
电商
视频
缺陷检测方法
标签纸
深度学习模型
分页设备
语义意图
多任务
大语言模型
界面控件树
生成方法