摘要
本公开提供了一种生成多模态偏好数据的方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于生成式人工智能(AIGC)、人机交互等场景。具体实现方案为:接收用户指令、第一文件和针对用户指令和第一文件的多个问答信息;第一文件包括图像和视频中的至少之一;提取第一文件的视觉信息;将用户指令、多个问答信息和视觉信息输入预先训练的神经网络模型,以获取针对各个问答信息的评估值;基于用户指令、第一文件、多个问答信息和针对各个问答信息的评估值,生成多模态偏好数据。
技术关键词
多模态
神经网络模型
指令
数据
光学字符识别
车辆识别
子模块
大语言模型
人工智能技术
计算机程序产品
计算机视觉
图像
处理器通信
视频
可读存储介质
文本
系统为您推荐了相关专利信息
体征数据分析
生命体征数据
可穿戴设备
整体健康
训练集
傅里叶变换红外光谱
机器学习算法
鉴别方法
样本
傅里叶红外光谱
传感器块
风扇组件
电子控制系统
温度传感器
速度
SOC预测方法
LSTM神经网络
锂电池
机器人
耦合特征
卸载方法
决策
元学习方法
训练深度神经网络
剪枝技术