摘要
本公开提供了一种基于大模型的视频通话处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域,尤其涉及大模型、视频通话、数据处理技术领域。实现方案为:响应于接收到用于视频通话的第一触发请求,创建第一用户端进行视频通话的模拟视频通话场景;获取模拟视频通话场景中的视频通话数据,以通过多模态大语言模型实现视频通话质量检测;响应于确定视频通话质量检测通过,确定可进行正式视频通话操作;响应于接收到用于视频通话的第二触发请求,开启第一用户端与第二用户端之间的正式视频通话,以从模拟视频通话场景转换到正式视频通话场景。
技术关键词
视频通话场景
视频通话数据
大语言模型
多模态
人像特征
画面
图像
音频
计算机程序产品
电子设备
可读存储介质
数据处理技术
处理器通信
指令
环境光
存储器
系统为您推荐了相关专利信息
图像处理方法
实体
图像生成模型
关系
大语言模型
数字孪生驱动
起落架
高应力
生成对抗网络
动态时间规整方法
动态调度资源
语义分割网络
优先级调度策略
动态分配计算机网络
对齐技术