摘要
本申请公开了一种数据综合处理方法及系统,涉及文本语音处理技术,包括:预先获取目标人员的基础文本信息,并根据所述基础文本信息建立基于RAG的数据库;获取用户的语音数据,并识别语音数据中的文本信息;根据识别的文本信息,在所述数据库进行检索,以获得关联上下文信息;基于所述上下文信息以及所述文本信息,生成相应的提示词;根据所生成的提示词,利用大语言模型生成输出文本;将所述输出文本进行语音合成,并根据合成的语音进行语音播报。本申请通过AI手段模拟人的外貌、音色和知识背景,构建具备语音交互功能的数字人系统。
技术关键词
文本
识别语音数据
人脸特征
大语言模型
语音交互功能
生成提示词
编码器
基础
生成语音
视频
语义
列表
存储器
模板
处理器
索引
参数
系统为您推荐了相关专利信息
动作序列生成方法
指令
动作噪声
运动编码器
文本
标签文本
文本分类方法
计算机设备
文本分类技术
文本分类装置
风险分析系统
文本特征向量
注意力机制
多模态
数据处理模块