流式语音交互方法及相关装置、设备和存储介质

AITNT
正文
推荐专利
流式语音交互方法及相关装置、设备和存储介质
申请号:CN202510026410
申请日期:2025-01-08
公开号:CN119479620B
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:对流式语音进行端点检测,并响应于检测到流式语音的起始端点,对流式语音执行滑窗操作,得到语音帧,基于语音帧进行特征提取,得到语音帧的语音特征;输入语音帧的语音特征至用于识别流式语音的语音识别系统,得到语音帧的识别结果,基于语音帧的编码特征进行分类预测,得到语音帧的分类结果;响应于分类结果表征语义结束,基于从起始端点至结束端点各个语音帧的识别结果,得到识别文本,至少基于识别文本由智能对话模型进行处理,生成得到回复文本;响应于分类结果表征语义未结束,继续返回执行滑窗操作。上述方案,能够提升流式语音交互的适时性。
技术关键词
智能对话模型 文本 语音交互方法 端点 语音特征 语音识别系统 编码特征 语义 语音交互方式 语音交互装置 指令 意图识别 程序 处理器 可读存储介质 模块 存储器
系统为您推荐了相关专利信息
1
一种机械故障诊断方法、装置、设备及存储介质
机械故障诊断方法 故障诊断信息 旋转设备 信号编码器 大语言模型
2
图生视频模型生成方法、视频生成方法及装置
适配器 样本 注意力 空间模块 模型生成方法
3
一种基于Web的数据挖掘方法及系统
多模态数据融合 数据挖掘系统 模态特征 数据挖掘方法 跨模态
4
面向大语言模型的知识库构建方法、检索方法及相关装置
知识库构建方法 大语言模型 文本 知识库检索方法 列表
5
智能微型档案室的档案管理系统、方法及设备
档案管理系统 协同过滤算法 档案室 编码 局部敏感哈希索引
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号