一种高质量的藏文文本数据增强方法及模型

正文

推荐专利

一种高质量的藏文文本数据增强方法及模型

申请号：CN202510470580

申请日期：2025-04-15

公开号：CN120561210A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，具体地说，涉及一种高质量的藏文文本数据增强方法及模型，将藏文形容词按语义特征及修饰对象分为描述性质、状态、数量、感官和感受等五大类四十六小类，通过提取藏文形容词和形容词修饰对象的特征构建了藏文形容词知识库和形容词修饰对象近义词表，本发明通过匹配形容词的类型、音节数等特征替换形容词，同时，匹配形容词修饰对象的句式结构，将形容词修饰对象用近义词表中对应的词替换。本发明能够显著增加藏文文本数据量。

技术关键词

句式结构对象文本数据校正语义特征感官识别模块自然语言数据项智力听觉分词观点心理年龄生理视觉

系统为您推荐了相关专利信息

针对无人系统的光学到雷达的跨模态图像迁移方法及装置

图像生成网络生成对抗网络架构迁移方法语义分割网络语义特征

一种用户评论真实性验证方法、设备及介质

真实性验证方法深度学习模型情感倾向分析语义向量电商

一种标签纸的缺陷检测方法及系统

视频缺陷检测方法标签纸深度学习模型分页设备

障碍物对民航雷达遮蔽下空中运行程序确定方法

障碍物程序远距离雷达设备雷达天线

基于语义意图与界面状态融合的多任务结构及生成方法

语义意图多任务大语言模型界面控件树生成方法

一种高质量的藏文文本数据增强方法及模型

站点导航

APP 下载