摘要
本发明涉及数据处理技术领域,具体涉及一种基于大语言模型的电力审计文本分类方法,该方法包括:获取分类好的历史电力审计文本数据;构建和优化历史电力审计文本数据的分类表示,并评估这些表示在不同类别间的分类误导度;获取实时电力审计文本数据,并基于分类误导度对实时电力审计文本数据相对于所选类型的初始匹配度进行修正,得到最终匹配度;基于最终匹配度实现实时电力审计文本数据的文本分类。该方法的实施能够避免因电力审计文本样本数据分布不均导致的预测结果偏差问题。
技术关键词
文本
大语言模型
字典
电力
语义特征
样本
列表
数据处理技术
数据分布
偏差