一种基于LDA主题模型的法律停用词设置方法及系统

AITNT
正文
推荐专利
一种基于LDA主题模型的法律停用词设置方法及系统
申请号:CN202510838998
申请日期:2025-06-23
公开号:CN120688493A
公开日期:2025-09-23
类型:发明专利
摘要
本发明涉及一种基于LDA主题模型的法律停用词设置方法系统,该方法包括如下步骤:步骤1、使用分词工具对法律文本进行预处理;步骤2、使用LDA主题模型对步骤1获得的分词结果进行分析;步骤3、计算词语的章节频率和逆章节频率,以量化词语语义特征;步骤4、根据计算出的章节频率和逆章节频率的阈值,生成候选停用词表;步骤5、进行第一轮专家审核,重复执行步骤1至步骤4的筛选流程,再进行第二轮专家审核,形成法律领域专属停用词表。本发明能显著提高LDA主题模型在法律领域应用的性能与泛化能力,与传统的通用停用词表相比,显著提高了模型分析的主题质量和连贯性,为未来使用自然语言处理进行自动化章节级法律文本分析提供重要参考。
技术关键词
LDA主题模型 停用词表 词语 文本 分词 频率 生成主题 语义特征 计算机模块 关键词 词典 自然语言 术语 命令 程序 数据 核心 对象
系统为您推荐了相关专利信息
1
基于知识图谱的儿童教育内容智能推荐方法及系统
儿童学习内容 内容智能推荐 矩阵 关系网络 实体
2
一种风险内容自动识别的方法和装置
风险 内容搜索系统 文本 图片 多模态
3
基于大模型智能体与多知识库的急诊辅助决策系统
辅助决策系统 急诊 生成文档 非结构化文本 容错需求
4
解剖学区域引导的医学视觉-语言预训练系统
预训练系统 文本解析器 报告 标签 对齐模块
5
生成统一招标文件的方法、装置、电子设备及存储介质
智能学习模型 机器学习模型 文本 容错机制 决策
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号