摘要
本发明属于高性能感知汽车技术领域,且公开了一种高性能感知汽车行业词权重新方法的具体步骤如下S1:噪声检查策略规划;S2:高频词汇实体类别梳理;S3:单字实体类别专项审查;S4:漏标数据筛查处理;S5:数据增强思路确定;S6:分词顺序重排操作;S7:数据集扩充结果确认。本发明的方案具备多重优势,一是提出独特数据集扩充与调整法,依实际需求处理噪声、增强数据,打造优质数据集,二是增加数据量并保分类准确,结合场景使F1得分提升4%,三是以汽车行业应用语言为基,秉持精确、个性化原则精准归类标注实体,能有效助力和相关任务开展。
技术关键词
高性能
数据
实体
分词
文本
规划
语义
重构
噪声
思路
策略
汽车
频率
关注点
进程
规模
场景
助力
车型
典型
系统为您推荐了相关专利信息
异常数据
密度峰值聚类算法
电网数据采集系统
计算机执行指令
数据清洗方法
电气特征
火灾风险评估
辨识系统
长短期记忆网络
辨识方法
多模态交互系统
模拟训练模型
环境控制设备
环境感知设备
训练设备
产品推荐方法
面部
意图
计算机程序产品
产品推荐装置