AI资讯新闻榜单内容搜索-视觉

AITNT
未登录
搜索: 视觉

谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI

谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI
6971 AI资讯
谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI

大模型拿金牌却输给三岁宝宝!一套「纯视觉考卷」把顶尖VLM打回幼儿园

大模型拿金牌却输给三岁宝宝!一套「纯视觉考卷」把顶尖VLM打回幼儿园
9144 AI技术研报
大模型拿金牌却输给三岁宝宝!一套「纯视觉考卷」把顶尖VLM打回幼儿园

在谷歌深耕14年,华人研究员创立视觉AI公司Elorian,计划融资5000万美元

在谷歌深耕14年,华人研究员创立视觉AI公司Elorian,计划融资5000万美元
8714 AI资讯
在谷歌深耕14年,华人研究员创立视觉AI公司Elorian,计划融资5000万美元

DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案
7471 AI技术研报
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案

「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化

「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化
8449 AI资讯
「liko.ai」完成首轮融资,打造以 AI Home Center 为核心的智能家居解决方案|光源孵化

「听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式

「听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式
6819 AI技术研报
「听觉」引导「视觉」,OmniAgent开启全模态主动感知新范式

多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案

多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案
6866 AI技术研报
多模态推理新范式!DiffThinker:用扩散模型「画」出推理和答案

任意图像+视频=无限创意!港科大BiCo:AI视频进入组合时代,随意换角

任意图像+视频=无限创意!港科大BiCo:AI视频进入组合时代,随意换角
6164 AI技术研报
任意图像+视频=无限创意!港科大BiCo:AI视频进入组合时代,随意换角

DeepSeek-OCR是「长文本理解」未来方向吗?中科院新基准给出答案

DeepSeek-OCR是「长文本理解」未来方向吗?中科院新基准给出答案
5693 AI技术研报
DeepSeek-OCR是「长文本理解」未来方向吗?中科院新基准给出答案

华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了

华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
7058 AI技术研报
华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
上一页 当前第5页,共71页 下一页
沪ICP备2023015588号