基于大语言模型的多模态感知问题生成方法、系统及介质

AITNT
正文
推荐专利
基于大语言模型的多模态感知问题生成方法、系统及介质
申请号:CN202510009573
申请日期:2025-01-03
公开号:CN119942300A
公开日期:2025-05-06
类型:发明专利
摘要
本发明公开了一种基于大语言模型的多模态感知问题生成方法、系统及介质,属于计算机语义分析技术领域,方法包括提取图像特征,并在图像特征中提取与输入文本最相关的特征;将输入内容中的文本背景转化为词嵌入,并与图像特征中提取到的与输入文本最相关的特征进行交互,获得与文本内容最相关的图像表示以及与图像内容最相关的文本表示;将与文本内容最相关的图像表示以及与图像内容最相关的文本表示进行语义对齐,得到视觉和文本信息的多模态语义综合表征,并转换成大语言模型所能理解的输入表征;基于大语言模型所能理解的输入表征引导大语言模型生成问题。本发明能够更加充分的利用大语言模型使其理解更为复杂的多模态输入并生成有效的问题。
技术关键词
大语言模型 文本 生成方法 注意力 计算机语义分析 图像嵌入 视觉 矩阵 序列 图像特征向量 分块 前馈神经网络 图像特征提取 表达式 图像编码器 可读存储介质 生成解码 对齐模块
系统为您推荐了相关专利信息
1
基于语义理解的医患智能语音交互服务系统
智能语音交互 服务系统 神经网络语言模型 抵消算法 序列
2
一种应用于超分辨率成像的焦平面识别方法及识别系统
多尺度特征 平面识别方法 可见光图像 特征提取模型 分辨率
3
基于大模型的标准文档自动生成与多维度审核方法及系统
审核方法 参数 分布式数据库 检测点 生成规则
4
基于AI的图像识别与分析系统
级联卷积神经网络 分类决策树 语义特征 动态特征选择 多模态
5
自适应双熵-多尺度Transformer无监督跨域复合材料损伤预测方法
损伤预测方法 多尺度网络 复合材料 矩阵 跨域方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号