基于大模型的视频交互方法、装置、电子设备和介质

正文

推荐专利

申请号：CN202510273140

申请日期：2025-03-07

公开号：CN119893240A

公开日期：2025-04-25

类型：发明专利

摘要

本公开提供了一种基于大模型的视频交互方法、装置、电子设备和介质，涉及人工智能技术领域，尤其涉及大模型、自然语言处理和图像处理技术领域。实现方案为：在基于大模型的视频交互过程中，获取输入的交互输入数据和目标文件，其中，交互输入数据包括语音数据、图像数据和视频数据中的任一项；通过大模型处理交互输入数据和目标文件，以确定交互输出数据；以及输出交互输出数据。

技术关键词

视频交互方法数据视频交互装置解码视频帧意图关键帧电子设备网络图像处理技术人工智能技术语音兴趣计算机程序产品对象处理器通信自然语言

系统为您推荐了相关专利信息

一种多任务语音检测方法、装置、存储介质以及电子设备

神经网络模型语音检测方法模型融合方法参数多任务

基于多状态时序建模的智能断句活动语音检测方法、装置

语音识别模型活动语音检测方法声学特征序列长短期记忆网络

一种基于多源异构数据的技术规范文本生成方法和系统

多源异构数据文本生成方法解析工具填充工具数据处理工具

基于北斗短报文与汽车显示终端协同的安全认证方法

汽车显示终端认证方法生物特征信息令牌汉明距离

一种行道树安全风险特征的检测方法、系统、设备及存储介质

识别图像信息多尺度卷积核行道树病虫害训练检测模型

基于大模型的视频交互方法、装置、电子设备和介质

站点导航

APP 下载