摘要
本申请提供的富文本分析方法、装置、存储介质及计算机设备,包括:获取富文本文件和目标提示词,并识别富文本文件中的组件,得到富文本文件对应的多种组件集合;接着确定各个组件集合中的组件的语义向量并存储于预设的向量数据库中;然后将目标提示词与向量数据库中的语义向量进行相关性匹配,以确定与目标提示词相关的组件标识后,在各个组件集合中确定目标组件,并将各个目标组件输入至预设的多模态模型中,得到分析结果。通过识别富文本文件中的组件,并且确定各个组件的语义向量,以向量的形式进行相关性匹配,使得跨部分的关联信息也能够捕捉到,充分挖掘跨部分的关联信息,提高富文本分析和理解的准确性。
技术关键词
语义向量
文本分析方法
富文本
计算机可读指令
关键词
预训练模型
标识
计算机设备
多模态
表格
分析模块
图片
数据获取模块
标签
处理器
分析装置
融合特征
识别模块
系统为您推荐了相关专利信息
药物微粒
空间结构特征
疾病特征
控制显示装置
语义特征
网络运维系统
数据定位方法
训练样本数据
标签
神经网络模型
体积识别方法
大语言模型
结构纹理图像
斑块
生成结构