摘要
本发明属于自然语言处理与信息检索技术领域。提供了一种基于大模型的标书多模态查重方法及系统,对输入标书进行结构化解析与多模态特征提取,生成语义分块与非文本元素的特征表示;利用动态上下文感知的大语言模型对文本分块进行深度语义编码,结合层次化位置编码保留长文本的逻辑关联性;通过混合检索架构实现海量语义向量的高效匹配,并结合分布式计算框架与硬件加速指令优化计算效率;最终对表格、图表等非文本内容进行结构化特征重建,实现了跨模态语义关联分析。
技术关键词
查重方法
语义向量
文本
分块
动态上下文
层级
可读存储介质
索引
多模态特征
SIMD指令集
跨模态
分布式计算框架
局部敏感哈希
广度优先遍历
公式编辑器
信息检索技术
查重系统
系统为您推荐了相关专利信息
数据分类方法
语义
文本
深度学习技术
构建分类模型
文本
识别方法
节点
灾害数据采集
非暂态计算机可读存储介质
数据收集方法
BERT模型
结构化数据格式
文本
电力
图文检索方法
层级
跨模态
文本编码器
图像编码器