摘要
本申请提供一种基于大模型的多语言跨文化沟通辅助方法及系统。其中,本申请通过在通话时接收源语言音频流,调用多语言声调频谐特征库提取基频谐波强度分布与声调转折特征,生成文化声学指纹向量;基于该向量控制麦克风阵列相位差,定向增强说话人基频谐波分量并抑制噪声,输出高信噪比频谱图;解析频谱图的发音节奏与声调转折特征,捕捉音节边界音高跃变及时长,生成声学文化标签;关联频谱图与目标语义库,基于大模型匹配谐波分布与文化语境规则,输出含歧义消解建议的文化解释性提示;对齐声学标签与语义提示生成校准结果,以动态浮动字幕叠加至视频会议画面说话人面部区域。本申请消除了多语言沟通中的文化声调歧义。
技术关键词
沟通辅助方法
谐波
多语言
信噪比
麦克风阵列
定向声波
结构化数据格式
指纹
发音
人声
语义库
音频
字幕
校准
沟通辅助系统
标签
序列
延迟参数
面部
系统为您推荐了相关专利信息
图像增强算法
无人机遥感
图像数据采集模块
图像增强方法
峰值信噪比
图像修复模型
图像修复方法
噪声特征
混合模块
复杂度
顺序控制方法
故障清除状态
动态
设备状态传感器
DCS控制站