摘要
本申请公开了一种金融统计信息无障碍播放方法、装置、设备、介质及产品,涉及大模型技术领域,该金融统计信息无障碍播放方法包括:获取金融统计信息对应的图像数据,其中,所述金融统计信息至少包括统计图或统计表格中的一种;将所述图像数据输入预设的目标多模态大语言模型,通过所述目标多模态大语言模型输出所述金融统计信息对应的描述文本,其中,所述目标多模态大语言模型由多组金融统计信息和对应的标签文本训练得到;将所述描述文本转换成第一音频信号,并播放所述第一音频信号。本申请的技术方案能将金融统计信息转换成音频信号形式播放,为视障人群在选择金融产品时提供更全面的信息。
技术关键词
信息无障碍
大语言模型
金融
多模态
自然语言
标签文本
训练集数据
图像
表格
播放装置
音频播放模块
信号
网络
基础
数据获取模块
计算机程序产品
处理器
系统为您推荐了相关专利信息
SimHash算法
多模态
视觉特征提取
结构相似性算法
级联卷积网络
语言模型训练方法
语音对话数据
编解码器
语言模型训练系统
大语言模型
导引运输车
设备运行参数
拓扑特征
平均故障间隔时间
拓扑图
协同注意力
图像
生成方法
深度学习模型
定位模块
纵向排水系统
声波发生器
循环神经网络模型
信号采集模块
信号处理模块