文本生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510146101

申请日期：2025-02-10

公开号：CN120067388A

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及人工智能技术领域及金融科技和医疗健康领域，公开了文本生成方法、装置、计算机设备及存储介质，其中，通过获取目标音频，利用音频Transformer模型提取所述目标音频的音频表示；获取所述目标音频的提示文本，并利用大语言模型对所述提示文本进行分词处理，生成文本嵌入；对所述音频表示进行下采样，并将其与所述文本嵌入对齐；利用所述大语言模型对对齐后的所述音频表示和所述文本嵌入进行解码，生成所述目标音频的描述文本；从而本发明可以生成更加多样化、准确且真实的音频描述文本。

技术关键词

文本生成方法音频大语言模型融合特征计算机设备频谱特征分词文本生成装置策略可读存储介质人工智能技术医疗健康处理器解码模块采样模块列表存储器

系统为您推荐了相关专利信息

一种基于病毒性肺炎风险评估预测系统

病毒性肺炎肺部CT图像风险预测模型热力图风险评估报告

数据处理方法、装置、设备、计算机可读存储介质及计算机程序产品

融合特征文本标记计算机可执行指令图像

一种多智能体思维链多轮对话中医问诊系统

多轮对话问诊系统动态知识图谱大语言模型处理单元

一种低耦合、轻量化的车牌识别方法及布控球设备

车牌识别方法特征融合网络特征提取网络号码融合特征

一种单体资产成本分摊与归集分析方法、设备及介质

资产分析方法单体指示值标识

文本生成方法、装置、计算机设备及存储介质

站点导航

APP 下载