摘要
本申请公开了一种文化数据大模型构建方法和文化数据问答平台,包括:获取大量的不同领域的多模态的文化数据,对所述文化数据进行预处理;所述多模态的文化数据包含文本数据、图像和视频数据;构建多模态融合架构,采用所述文本数据对NLP模型中进行训练,采用图像和视频数据对CV大模型中进行训练;利用多模态大模型将NLP模型和CV大模型的输出特征进行关联,得到文化数据大模型;获取不同领域的问答对样本集,利用不同领域的问答对样本集对所述文化数据大模型进行微调训练,以此对所述文化数据大模型进行参数优化。本申请的文化大模型,对文化知识有更深层次的融合,面对多文化背景时,输出的内容更加准确。
技术关键词
模型构建方法
数据
多模态
文本
输出特征
样本
计算机程序产品
视频
平台
图像
处理器
计算机设备
参数
存储器
答案
书籍
分词
指令
索引
报告
系统为您推荐了相关专利信息
多源时空数据
智能识别方法
激光雷达点云数据
空间分布特征
遥感影像数据
岩石打磨机
光电检测电路
光电传感器
电机控制电路
非暂态计算机可读存储介质
语音识别训练方法
音频
语音识别模型
注意力机制
预训练模型
层合板
期望最大化算法
损伤识别模型
Akaike信息准则
高斯混合模型