一种高质量的藏文文本数据增强方法及模型

AITNT
正文
推荐专利
一种高质量的藏文文本数据增强方法及模型
申请号:CN202510470580
申请日期:2025-04-15
公开号:CN120561210A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,具体地说,涉及一种高质量的藏文文本数据增强方法及模型,将藏文形容词按语义特征及修饰对象分为描述性质、状态、数量、感官和感受等五大类四十六小类,通过提取藏文形容词和形容词修饰对象的特征构建了藏文形容词知识库和形容词修饰对象近义词表,本发明通过匹配形容词的类型、音节数等特征替换形容词,同时,匹配形容词修饰对象的句式结构,将形容词修饰对象用近义词表中对应的词替换。本发明能够显著增加藏文文本数据量。
技术关键词
句式结构 对象 文本 数据校正 语义特征 感官 识别模块 自然语言 数据项 智力 听觉 分词 观点 心理 年龄 生理 视觉
系统为您推荐了相关专利信息
1
针对无人系统的光学到雷达的跨模态图像迁移方法及装置
图像生成网络 生成对抗网络架构 迁移方法 语义分割网络 语义特征
2
一种用户评论真实性验证方法、设备及介质
真实性验证方法 深度学习模型 情感倾向分析 语义向量 电商
3
一种标签纸的缺陷检测方法及系统
视频 缺陷检测方法 标签纸 深度学习模型 分页设备
4
障碍物对民航雷达遮蔽下空中运行程序确定方法
障碍物 程序 远距离 雷达设备 雷达天线
5
基于语义意图与界面状态融合的多任务结构及生成方法
语义意图 多任务 大语言模型 界面控件树 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号