摘要
本发明公开了一种多模态人脸语义通信方法、设备及介质,属于语义通信技术领域,用于解决目前的人脸语义通信方案在灵活性、协同性、通信效率以及信道适应性方面均存在不足,无法适应当前用户对人脸传输服务的多样化需求的技术问题。包括:对人脸视频流中的人脸图像进行语义转化,得到对应的图像语义表征信息;基于语言重塑指令中的语义特征及人脸图像中的人脸特征确定语义偏移量;根据语义偏移量对图像语义表征信息进行优化;对发送端与接收端之间的传输信道进行编码策略优化,基于信道噪声对接收端的解码器进行参数微调;通过优化的传输信道将图像语义表征优化信息发送到接收端,并通过参数微调后的解码器对语义表征优化信息进行解码及图像重建。
技术关键词
人脸语义
人脸特征
通信方法
语义特征
多模态
状态预测器
混合高斯噪声
解码器
编码策略
信道
模拟噪声
接收端
嵌入特征
非易失性计算机可读存储介质
视频流
注意力
图像特征提取模型
系统为您推荐了相关专利信息
资源监测方法
双频全球定位系统
数据
地理信息系统
多模态传感器
异物清除系统
接触网
分层强化学习
决策
注意力机制
Softmax函数
预测系统
融合特征
多模态特征
图像提取模块
煤矿智能监测系统
数据采集节点
矿井巷道
伞齿轮
三通管道