摘要
本发明涉及一种基于提示学习的金融报表字段分级方法,包括:对金融报表字段文本的原始数据进行预处理;将标准数据集中的每个样本转换为多个输入;将多个输入输入预训练语言模型,预测出填入每个模板函数掩码位置的答案;将答案输入答案映射器,将答案映射为对应的输出标签词,综合每个模板函数的输出标签词,得到最终金融字段分级结果。本发明还公开了一种基于提示学习的金融报表字段分级系统。本发明减少了对大量人工特征工程的依赖,简化金融文本分类的预测流程,提高了分类效率和准确性;实现了金融报表字段智能分级,可以根据实际需求动态调整分类标准增强对文本的理解和分类能力,极大地提高分类的准确性和一致性。
技术关键词
预训练语言模型
字段
金融
答案
证券数据报表
文本
模板
标签
样本
分词方法
停用词表
分级系统
字符
特征工程
模块
序列
系统为您推荐了相关专利信息
数据检索方法
模糊匹配算法
数据管理平台
对象
元素
转换数据结构
转换方法
生成结构化数据
结构化解析方法
字段
分级排序方法
消息
语义特征
时序特征
文本编码器
企业关联关系
推送方法
知识图谱分析
产品属性信息
金融