富文本分析方法、装置、存储介质及计算机设备

正文

推荐专利

申请号：CN202510892862

申请日期：2025-06-30

公开号：CN120671642A

公开日期：2025-09-19

类型：发明专利

摘要

本申请提供的富文本分析方法、装置、存储介质及计算机设备，包括：获取富文本文件和目标提示词，并识别富文本文件中的组件，得到富文本文件对应的多种组件集合；接着确定各个组件集合中的组件的语义向量并存储于预设的向量数据库中；然后将目标提示词与向量数据库中的语义向量进行相关性匹配，以确定与目标提示词相关的组件标识后，在各个组件集合中确定目标组件，并将各个目标组件输入至预设的多模态模型中，得到分析结果。通过识别富文本文件中的组件，并且确定各个组件的语义向量，以向量的形式进行相关性匹配，使得跨部分的关联信息也能够捕捉到，充分挖掘跨部分的关联信息，提高富文本分析和理解的准确性。

技术关键词

语义向量文本分析方法富文本计算机可读指令关键词预训练模型标识计算机设备多模态表格分析模块图片数据获取模块标签处理器分析装置融合特征识别模块

系统为您推荐了相关专利信息

基于大语言模型的心理咨询对话评估系统

大语言模型评估系统模型预训练矩阵关键字

基于对比学习和差异化数据增强的关系抽取方法和装置

关系抽取方法样本编码器大语言模型原型

一种基于自然语言处理的医患沟通智能体交互方法及系统

药物微粒空间结构特征疾病特征控制显示装置语义特征

根告警数据定位方法及装置

网络运维系统数据定位方法训练样本数据标签神经网络模型

一种基于大语言模型的放疗目标体积识别方法

体积识别方法大语言模型结构纹理图像斑块生成结构

富文本分析方法、装置、存储介质及计算机设备

站点导航

APP 下载