一种基于语义理解的端到端文本匹配辅助标注方法

正文

推荐专利

申请号：CN202410947826

申请日期：2024-07-15

公开号：CN118964611A

公开日期：2024-11-15

类型：发明专利

摘要

本发明涉及文本匹配辅助标注领域，具体来说是一种基于语义理解的端到端文本匹配辅助标注方法，包括S1.基于语义理解的PDF关键信息抽取；S2.基于非监督算法的多专家模型推荐，结合非监督学习算法和预训练语言模型，将多个专家模型的输出融合为一个集成模型进行大规模综合打分，对于每条文档数据，选取最终得分最高的若干条检索数据作为推荐，最终由人类专家进行标注。本发明同现有技术相比，其优点在于：提高文本匹配和标注的效率、准确性和实用价值，提高系统的易用性和一体性，减少人力标注成本，提高关键信息定位和抽取能力，极大减少文字转换的资源开销，并降低文字抽取结果的噪音。

技术关键词

辅助标注方法文本关键词预训练语言模型非监督训练词向量模型语义学习算法实体列表一体性标签页面数据人类样本答案人力

系统为您推荐了相关专利信息

SQL语句优化方法、电子设备、存储介质与产品

语句优化方法大语言模型文本元素 SQL优化技术

一种字帖路径识别与标注方法及系统

二值化图像轮廓数据风格顶点标注方法

一种运用NLP技术自动识别企业供应链上下游关系的方法

文本识别模型词特征实体 NLP技术多任务

一种模型优化方法、装置、电子设备及存储介质

硬件平台样本实体策略关系

一种基于大语言模型的业务流程信息提取方法

业务流程信息大语言模型信息提取方法信息提取系统文本

一种基于语义理解的端到端文本匹配辅助标注方法

站点导航

APP 下载