基于多模态大模型的智能通信箱系统及其控制方法

AITNT
正文
推荐专利
基于多模态大模型的智能通信箱系统及其控制方法
申请号:CN202510678883
申请日期:2025-05-26
公开号:CN120529069A
公开日期:2025-08-22
类型:发明专利
摘要
本发明涉及通信箱系统技术领域,尤其为基于多模态大模型的智能通信箱系统及其控制方法,包括以下步骤:步骤1:视觉特征采集:采集现场多路摄像头图像,并提取视觉特征向量V,视觉特征向量V的数学表达式为:,式中,为第i路摄像头采集的视频帧,M为摄像头路数;步骤2:音频特征采集:采集麦克风阵列音频,并提取语音特征向量A,语音特征向量A的数学表达式为:,本发明中,基于基于多模态大模型,提升了带宽受限环境下的音视频保真度和链路鲁棒性,确保了关键区域和语义信息的高质量传输,并实现了从人工经验调参到端到端自动化的跨越式改进,满足救援通信对实时性、可靠性和可持续运行的严格要求。
技术关键词
通信箱 多模态 音频编码参数 视频编码参数 采集现场 链路 分流策略 视觉特征 编码后数据 麦克风阵列组件 音频编码器 控制视频编码器 表达式 麦克风阵列采集 时延 数学 音频特征
系统为您推荐了相关专利信息
1
多模态大模型的评测方法、装置、设备、存储介质及产品
多模态 生成测试数据 评测方法 答题 答案
2
基于人工智能的数据流优化方法及系统
数据流优化方法 数字孪生模型 动态拓扑结构 多模态特征 决策
3
一种实时连续岩屑采样与智能化地质录井方法
地质录井 Sigmoid函数 三维地质模型 皮尔逊相关系数 融合特征
4
基于多模态信息融合的睡眠呼吸暂停亚型检测方法
亚型检测方法 睡眠呼吸暂停 多模态信息融合 多模态生理 嵌入特征
5
基于多模态检索增强和指南引导的医疗诊断方法和系统
医疗诊断方法 医学影像信息 多模态 医学知识库 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号