摘要
本申请涉及音视频会议技术领域,公开了一种音视频会议的实现方法及系统。所述方法包括:采用时间平移模块与二维卷积神经网络对第一用户终端采集的原始音视频数据流进行预处理和时间视觉特征同步,得到第一音视频数据流;进行自注意力和交叉注意力处理,得到第二音视频数据流;采用动态三元组损失和多项式损失函数进行编码并通过ModEFormer模型进行音频和视频嵌入特征提取,得到第三音视频数据流;构建得到每个第二用户终端的音视频同步和分发路径;定义数据传输和数据加密策略并将第三音视频数据流分发至多个第二用户终端,同时,通过多个第二用户终端进行音视频展示,本申请提高了会议的音视频展示效果并提高了会议的安全性。
技术关键词
二维卷积神经网络
数据同步
注意力
数据加密
终端
屏幕共享
音频
视频帧
视觉特征
节点特征
色彩校正
三元组
白板功能
音视频会议技术
多项式
策略