一种非结构化电厂配置信息数据挖掘方法

AITNT
正文
推荐专利
一种非结构化电厂配置信息数据挖掘方法
申请号:CN202410963854
申请日期:2024-07-18
公开号:CN118779403A
公开日期:2024-10-15
类型:发明专利
摘要
本发明属于数据挖掘技术领域,具体涉及一种非结构化电厂配置信息数据挖掘方法。包括以下步骤:步骤1:组成专业语料库;步骤2:筛选有效的文本数据;步骤3:制作字典;步骤4:搭建词嵌入模型,并进行词嵌入模型的训练;步骤5:建立基于字符串匹配的编码识别规则;步骤6:搭建设备状态识别模型;步骤7:将经过训练后的语义识别模型用于语料库之外文本的自动识别。本发明的有益效果在于:实现了非结构化数据的有效挖掘和智能语义识别,能从自然语言文本中提取所需的目标参数信息,并输出为结构化数据。
技术关键词
数据挖掘方法 词嵌入模型 编码 智能语义识别 清洗规则 字典 双向长短期记忆 自然语言文本 字符 数据挖掘技术 专业 深度学习模型 中文分词 人工标记 词典 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号