一种基于熵理论及情感分析的文本数据置信评估方法

正文

推荐专利

申请号：CN202511004345

申请日期：2025-07-21

公开号：CN121009365A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于熵理论及情感分析的文本数据置信评估方法。首先构建与目标群体相关的关键词集合，利用关键词集合从训练集中筛选含有关键词的文本数据，或与目标群体密切相关的文本数据。然后通过情感分析模型对文本数据进行情感分类，统计不同情感类别的文本数据数量，计算各类别的概率。然后基于信息熵的计算方式，计算文本数据集对目标群体的情感偏向及偏向程度。该方法能够量化文本数据集中针对特定目标群体的情感分布不均衡性，可以使用该指导大模型的训练与优化，提升数据治理和算法公平性，且具有良好的扩展性和推广前景。

技术关键词

情感分析模型情感类别关键词文本情感分类标签信息熵理论模型训练方法训练集数据语义职业符号指标标记标识算法社会

系统为您推荐了相关专利信息

一种上下文感知的多轮对话文本到SQL自动转换方法

自动转换方法多轮对话文本语句代表

一种交互式学习活动动态优化方法及系统

交互式学习动态优化方法标签兴趣节点

基于智能图像增强与自动分类的档案数字化方法和系统

数字化方法图像增强多维索引结构 Wiener滤波器文本

一种基于FPGA的激光雷达点云在线样本自生成方法

激光雷达点云生成方法 SVM分类器样本标记

基于自然语言处理及人工智能的稿件内容识别分析系统

识别分析系统词语自然语言语句文本

一种基于熵理论及情感分析的文本数据置信评估方法

站点导航

APP 下载