基于大模型的语音风格识别系统

正文

推荐专利

基于大模型的语音风格识别系统

申请号：CN202411919730

申请日期：2024-12-25

公开号：CN119360830B

公开日期：2025-03-04

类型：发明专利

摘要

本申请涉及智能语音识别领域，其具体地公开了一种基于大模型的语音风格识别系统，其通过接收由麦克风采集的目标用户的语音输入信号，然后从中提取出梅尔频谱，并采用基于深度学习和大模型的信号分析和处理技术来对提取出的语音输入信号梅尔频谱图进行分块处理和多尺度语义编码，以此根据编码得到的各个上下文梅尔频谱局部编码特征之间的动力学特征聚合表示来智能地生成语音风格识别播报语音。通过该方式，系统能够确保复杂风格得到充分表征，并且能够更好地适应不同说话人在发音方式、语速、音调等方面的显著差异，提高泛化能力。

技术关键词

频谱特征编码特征识别系统风格序列度量分块智能语音识别编码向量因子编码模块转换器结构信号采集模块多尺度生成语音麦克风信号分析

系统为您推荐了相关专利信息

融合伪3D人工标注与2D目标跟踪的图像数据标注方法

质心偏移量数据标注方法物体索引图像

一种细胞外囊泡中microRNA提取和检测的整合方法

荧光标记探针 RNA保护剂粒度分析仪建立检测模型微流控芯片

一种批量任务耗时预警方法、设备、介质及程序产品

预警方法批量序列时序周期性

基于SVM与BiLSTM模型的超导电缆故障预测方法

故障预测方法故障预测模型超导电缆计算机可读指令注意力

基于动态自适应分块和子图同构的量子比特映射算法

比特映射算法深度优先搜索算法分块反转技术序列

基于大模型的语音风格识别系统

站点导航

APP 下载