一种基于LDA主题建模的地铁建设风险分类方法

AITNT
正文
推荐专利
一种基于LDA主题建模的地铁建设风险分类方法
申请号:CN202510993023
申请日期:2025-07-18
公开号:CN120873186A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于LDA主题建模的地铁建设风险分类方法,涉及工程风险管理技术领域。包括从施工单位安全巡查系统中导出隐患文本记录,获得初始文本内容,正则化处理获得清洗后的文本内容,进而构建词典,将词典输入分词工具中,获得分词结果,构建词袋模型,结合分词结果计算TF‑IDF权重,形成语料向量集合,确定LDA超参数,将语料向量集合以及LDA超参数输入至LDA模型中进行训练,获得训练好的LDA模型,将待检测文本输入至LDA模型中,获得主题关键词以及文本主题分布,并进行风险分类,形成结构化风险文本数据库。本发明能够实现隐患信息的结构化与标准化分类,提升风险识别的准确性和全面性。
技术关键词
风险分类方法 词袋模型 主题关键词 分词 构建词典 巡查系统 风险管理技术 中文文本 参数 指标 语义 表达式 术语 字符 符号 批量
系统为您推荐了相关专利信息
1
一种大语言模型训练方法、系统及装置
训练样本集 语言模型训练方法 分词 大语言模型 文本
2
基于AI技术的产品分类识别方法及系统
分类识别方法 语义向量 标签文本 注意力 产品标签
3
数据处理方法、装置、电子设备及非易失性存储介质
数据处理方法 大语言模型 结构化查询语句 脚本 非易失性存储介质
4
一种基于结构和组件的APP界面相似度计算方法
度计算方法 界面 文本 标记 布局
5
一种融合实体类别特征和目标上下文的知识图谱检索方法
知识图谱检索方法 实体 文本 标签 词嵌入向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号