摘要
本发明实施例公开了一种民航复杂运行系统风险要素提取方法、系统及存储介质。方法包括:收集资料数据进行清洗,得到段落数据及短语集合1;采用大语言模型对段落数据进行处理,得到风险要素集合及短语集合2;采用嵌入模型对短语集合1、2中短语描述的风险要素进行相似语义判别,并聚类,得到风险要素;为每类风险要素设置代表词,并存储以形成风险要素库。本发明优点:通过大语言模型提取、归纳风险要素,并基于语义相似度进行风险要素合并,可降低风险要素冗余,有利于提高风险要素库的准确性;可提高不安全事件报告利用率,降低审核员人力消耗;直接采用预训练模型,无需额外数据,具有泛化性能,可根据要求调整提示词。
技术关键词
风险
大语言模型
资料
语义
聚类
输入设备
自然语言
处理器
可读存储介质
预训练模型
存储计算机程序
数据管理
格式
存储器
指令
代表
航空
报告
系统为您推荐了相关专利信息
障碍识别系统
抑郁
大语言模型
医学知识图谱
量表
语义实体
隐私保护模块
Kubernetes容器
知识图谱构建
接口模块
协同调度系统
数据采集模块
协同调度方法
动态特征提取
资源分配