摘要
本发明涉及一种面向信息合规性治理的多模态知识表示方法。首先对视觉模态特征进行提取,考虑卷积方式提取图片遇到的效率问题,使用无卷积的图像切分方法对图像进行标准化与切分,后通过投影获取图像数据特征;再通过KeyBert模型从长文本中提取主题词,用MacBert对文本进行编码,并通过文本中蕴含的主题词的位置信息对原文本进行语义代换,结合原文本的类型特征得到文本模态特征;最终使用BiLSTM‑Attention模型对两种模态特征进行多模态融合,实现对政务领域信息的语义表示。本发明能够提升视觉模态特征提取时的效率,实现面向长文本数据的文本模态特征提取,并通过融合模型完成对政务领域信息的有效表示,以进一步对政务信息加以甄别。
技术关键词
文本
原始图像数据
关键词
投影特征
政务
图像块
图像数据集合
合规性
样本
视觉
语义
分词
编码
代表
多模态特征
嵌入特征
线性
系统为您推荐了相关专利信息
大语言模型
标签生成方法
文本
生成标签
标签匹配方法
情感分析模型
多尺度特征提取
融合语义信息
情感分析方法
模态特征
特征分析方法
节点
多模态
图像特征提取算法
光学字符识别技术
风险评估模型
文本分类模型
热力图
封闭模块
多模态