摘要
本公开提供了一种对象处理方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大模型、生成模型等领域。具体实现方案为:根据待处理的对象包含的音频和图像中的至少一个,确定初始文本,初始文本包括多个子文本;基于大模型,根据多个子文本和第一时间戳,生成结构树;结构树包括多个结点,每个结点的属性包括结点名称和第二时间戳,每个结点表征对象中的一个片段,多个结点之间的依赖关系表征多个片段描述内容之间的层级关系;根据结构树中各结点的依赖关系和结构树中各结点的属性,从结构树中确定目标结点;根据目标结点的结点名称和第二时间戳,确定分段大纲以便展示分段大纲。
技术关键词
结点
文本
层级
分段
对象
生成结构
标记
生成思维导图
关系
图像
重复性
参数
语音
字符
电子设备
处理器
音频
关键点
人工智能技术
计算机
系统为您推荐了相关专利信息
文本生成图像方法
注意力
对象
图像生成单元
可读存储介质
综合测试控制系统
控制系统模型
数据处理模块
控制器单元
测试机
生成方法
覆盖率
对象
文档关键词
测试用例生成装置