摘要
本申请公开了一种电力文档的术语一致性检查方法、装置、设备及存储介质,方法包括:对电力文档分块得到多个文档块,每个文档块继承前一个文档块的术语状态,通过大语言模型提取每个文档块的各个完整术语,确定标准词库中与完整术语语义最接近的标准术语,并检测完整术语与标准术语之间的显式偏差,确定标准术语在标准场景句中的第一语义,以及完整术语在原句中的第二语义,计算第一语义和第二语义之间的语义等价性评分,从而确定术语一致性。可见,通过文档分块且术语状态能够继承,使电力长文档能够被连贯处理,通过分析术语的显式偏差和语义等价性评分,从而更准确地判断术语的一致性,以提升电力行业技术文档质量、保障电力项目顺利推进。
技术关键词
术语
语义
大语言模型
电力专业词库
检查方法
偏差
上下文特征
索引
电力行业技术
校验单元
分块
特征提取单元
场景
检查设备
检查装置
处理器
数据
格式
存储器
系统为您推荐了相关专利信息
图像编解码
数据
通信方法
语义特征提取
语义知识库
声纹识别模型
会议记录方法
语音识别模型
发言者
文本
知识库管理
WebSocket协议
支持多用户协作
模块
问答模型