摘要
本发明实施例公开了一种信息识别方法和装置。通过在数据库中获取原始数据,对原始数据进行切片得到数据切片,获取数据切片对应的辅助信息,根据辅助信息和数据切片生成嵌入向量,在获取到用户的查询信息后,根据数据切片的内容和嵌入向量获取与查询信息相关的至少一个候选数据切片,通过预先训练的得分模型获取各候选数据切片与查询信息的相关性得分,根据相关性得分在候选数据切片中获取目标数据切片,通过大语言模型根据目标数据切片获取安全数据节点的识别结果,所述识别结果包括节点信息和边信息。由此,可以降低信息识别的成本和难度,提升场景覆盖率。
技术关键词
信息识别方法
大语言模型
切片功能
计算机程序指令
信息识别装置
数据获取单元
检索算法
计算机程序产品
信息识别单元
节点标识符
存储计算机程序
场景
文本
处理器
可读存储介质
覆盖率