一种基于用户特征的音频分析方法

AITNT
正文
推荐专利
一种基于用户特征的音频分析方法
申请号:CN202510053762
申请日期:2025-01-14
公开号:CN119479707A
公开日期:2025-02-18
类型:发明专利
摘要
本发明涉及音频分析技术领域,具体为一种基于用户特征的音频分析方法,包括:获取目标用户的音频信号,对所述音频信号进行预处理,以得到标准音频信号;对所述标准音频信号进行特征提取,以得到所述标准音频信号所对应的音频特征,其中,所述音频特征包括频谱图和梅尔频率倒谱系数。本发明通过同时提取音频和文本两种特征,并将它们进行融合,从而能够充分利用不同模态的信息,音频特征如频谱图和梅尔频率倒谱系数能够提供声音的语音特性、音调、节奏、语速等信息,而文本特征则能提供语言的语义内容,通过对音频信号和文本的多模态融合,能够充分考虑到语音中的情感色彩及其语言表达,从而提高情感分类的准确性。
技术关键词
音频分析方法 音频特征 文本 融合特征 信号 编码向量 分词 音频分析技术 梅尔倒谱系数 多模态 语音识别模型 LSTM模型 表达式 离散余弦 标签 频率 注意力机制 输出特征
系统为您推荐了相关专利信息
1
基于多关系图特征的网络用户特定群体识别方法
群体识别方法 网络用户 关系 节点 异常用户识别方法
2
一种光纤传感网络的信号识别方法及系统
光纤传感网络 信号识别方法 多尺度结构特征 动态规划技术 噪声功率谱密度
3
船舶推进永磁电机模型参考自适应无位置控制方法
无位置控制方法 永磁电机 扩张状态观测器 准谐振控制器 估算系统
4
一种基于语义抽取的财务机器人发票要素识别方法
发票 识别方法 OCR识别模型 财务机器人系统 识别置信度
5
基于大语言模型的软件配置项测试用例数据处理分析方法
软件配置项 数据处理分析方法 测试用例数据 大语言模型 PageRank算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号