摘要
本发明公开了基于大模型的多粒度金融文本噪声开放分类方法,属于文本噪声分类技术领域,包括:提取金融文本的语义特征;对语义特征进行聚类处理,得到多个不同标签的粒球,并计算多个不同标签的粒球的属性;根据样本在粒球中的位置与粒球的属性,将粒球内样本分类为干净样本、分布内噪声、分布外噪声。通过聚类处理得到多个不同标签的粒球,并计算各粒球的属性,此时每个类别最终由具有相同标签但属性不同的多个粒球表示,能够有效反映类别的多粒度原型和分布范围,提高了表征学习效果。同时,根据样本在粒球中的位置与粒球的属性进行分类处理,能够适用于各种分布类型的数据环境。
技术关键词
样本
语义特征
分类方法
金融
文本
噪声分类技术
聚类
噪声标签
代表
定义
原型
参数
数据
编码
系统为您推荐了相关专利信息
损伤预测方法
风电叶片
概率分布函数
效应
BP神经网络
分析电力系统
分析设备
网络攻击路径
节点
面向电力系统
分类器
标签
情感识别模型
脑电情感识别方法
情感识别系统