摘要
一种提供数字相框具有语音互动与智能生成的系统及其方法,数字相框提供互动语音至图像编修服务器,图像编修服务器使用语音转文字技术转换为文字消息,图像编修服务器通过应用程序接口提供文字消息至人工智能平台,由人工智能平台反馈包含执行指令的文字回应,图像编修服务器使用通用人工智能模型执行文字回应所包含的执行指令,自数字相框取得数字图像并加以编辑或是修改为编修数字图像或自数字相框取得数字图像并加以编辑或是修改为编修数字图像,数字相框依据编修数字图像所包含的多模态信息进行显示或数字相框依据编修数字图像所包含的多模态信息进行显示以及播放,由此可以达到提供语音互动与智能编修生成数字图像的技术功效。
技术关键词
数字相框
人工智能平台
人工智能模型
语音
编辑
服务器
非暂态计算机可读存储介质
三维建模工具
麦克风装置
计算机可读指令
喇叭装置
消息
手势控制
生成数字图像
操作者
处理器