腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
资源拓展
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了
2026-05-16 11:08

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


这是一个操作系统层的个人AI助手。


智东西5月15日报道,近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。


Marvis目前仅支持Windows PC和安卓手机,iOS/macOS即将上线。


具体到日常使用场景,Marvis能干不少活。工作场景中,它能做文件格式转换、合同信息审查、运营数据分析,甚至帮忙整理参考文献。这些功能超越了单纯的文字、代码生成,能真正去操作系统、文件和应用等更为底层的元素。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


在生活娱乐场景中,它能帮你监控游戏限时福利和明星动态,自动完成微博签到、整理高清物料,也可以定时执行每天早上的新闻汇总。


Marvis这一名字致敬了知名智能助手“Jarvis”,取自“马(Ma)”与“Jarvis”的结合。比较有趣的是,它把每个Agent的形象设计成一只长着牛角的黑色小马,简称“小牛马”,“小牛马”还继承了腾讯企鹅标志性的围脖


你可以在虚拟办公室里随时查看每只Agent在干什么,被安排任务的Agent会坐在工位上认真搬砖,其他闲着的Agent可能会打盹、闲逛、健身、喝咖啡或上厕所。


当你指定任务后,会有一只Agent主管出来主持大局,分配任务给相应的Agent,Agent在完成工作后会向主管汇报。


目前Marvis里的专家Agent具备App操作、电脑系统运维、网页交互、数字资产管理和搜索任务等能力。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


Marvis目前提供了两种运行模式:云端效率模式采用混元和DeepSeek V4等最新模型,本地隐私模式则采用Qwen端侧模型,做到一句话都不出电脑。


这一产品还支持本地知识库的功能,可以自动识别本地文档、图片并进行索引。当用户需要搜索特定内容时,Marvis可以基于标题匹配或基于内容匹配。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


与同样能操控电脑的其他“龙虾类”产品相比,Marvis有什么优势?


智东西获知,Marvis背后是腾讯应用宝团队,继承了十几年与英特尔、微软等软硬件厂商的合作关系和跨端引擎技术。


因此,Marvis不仅能操作电脑EXE软件,还能通过应用宝,直接在电脑上操控手机App(同花顺、开盘啦、飞常准、汽车之家、唯品会等App已授权)。


该团队通过对端侧模型做芯片级优化,实现了跑端侧模型速度提升20%,并能通过提示词直接对电脑文件进行查询、变更等操作。而当前大多数AI应用都做不到这种深入操作系统层的能力。


智东西第一时间拿到Marvis的内测资格。根据我们的实际体验,Marvis展现了


“AI打工人”的雏形,它能实实在在地帮你干活,完成任务的质量不错,但在速度、token消耗量、灵活性等方面仍有提升空间。


指路:marvis.qq.com


找文件、调设置


Marvis全动手试了一遍


电脑操作是Marvis的一大长板。Marvis拥有系统级的能力,可直接完成对电脑的全流程操作。我们的首批案例就围绕这类任务展开。


进入主页后,用户可以直接与Marvis对话并指派任务,也可通过自动任务页面让Marvis定时执行既定任务。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


案例1:图像搜索、文件定位都能胜任,就是有点烧token


对许多用户来说,在本地设备上寻找指定的文件或图像,是件费时费力的事情。我试着让Marvis帮我在本地的下载文件夹中,找到一张包含纳斯达克元素的图片。


拿到这一任务后,Marvis的团队负责人Agent把任务分配给了文件处理Agent,后者先是尝试了文件名搜索,未获得命中。在这一过程中,它判断我的图片命名大多无意义,决定换个思路,用图像分析来找到相关图像。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


切换思路后,Marvis终于步入了正轨,它成功地找到了包含纳斯达克相关元素的图片。然而,调用图像分析工具,Marvis的token消耗量呈现指数级的增长。在搜索了一百多张图片后,总消耗量来到了200万token。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


Marvis可以完成跨端的文件查找和传递。我在手机上向Marvis发送了一条命令,搜索与字节跳动估值有关的文件并发送到我的手机上。


它很快找到了文件,并发送到我的手机上。可能是因为这次文件名本身就包含了需要查找的关键词,任务的token消耗量明显降低了。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


案例2:精准抓取电脑配置,还给我提了优化建议


Marvis可以直接在Windows系统层进行一些操作。当我要求它帮我把电脑的主题调为绿色时,Marvis的电脑操作Agent接手了工作,并直接找到了系统主题色的设置入口。这一操作并未通过模拟点击实现,应该是深入了系统底层。


不过,它没有100%完成这一任务,停在了找到入口这一步,后续的具体设置需要我手动操作。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


Marvis可以精准地获取各种系统信息。当我向它咨询我的设备是否支持《黑神话·悟空》这样的大型游戏时,它快速整理出了我的系统配置,看样子是直接在设置中找到了相关内容。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


紧接着,我让Marvis分析了我这套配置中的短板,并提出升级建议。它判断我的显卡配置充裕,但是CPU、内存和硬盘都稍显落后。Marvis建议我对内存进行升级,并说这是性能提升最直接、成本最低的方式。


不过,它似乎不了解当内存涨价的情况,告诉我32GB的DDR4 3200MHz内存只要四五百块。实际情况是,同类内存的价格至少也得1000元出头。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


在我们的实际体验中,Marvis在遇到批量删除文件、核心配置修改时一定会询问用户,用户点击确认后才会执行。


写代码、出报告


多Agent协作有亮点


多Agent的协作,理论上可以完成更复杂的任务,或是提高任务执行的质量。我们拿几个复杂任务试了试Marvis的能力边界。


案例1:开发本地知识库,全程无需碰代码


我们的首个复杂任务要求Marvis设计一个本地知识管理系统,支持自定义大模型接入,实现简单的RAG。


在这种更复杂的任务中,Marvis反而没有调用多Agent,而是由主Agent完成所有的开发工作。Marvis陆续创建了目录结构,并且并行写入了配置文件和核心模块,之后打造了Web界面。Marvis默认使用了ollama本地跑模型,我要求它切换为接入外部API的模式。


Marvis提供的API设置界面较为人性化,它向我发送了选项卡,只要逐步选择并填写信息就行。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


最终,Marvis按照我的要求打造出了这一知识管理系统,支持导入文件、导入目录、导入文本等选项,可提供参考来源。我们试着上传了几份文件并询问相关信息,该系统输出的内容准确,也没有编造不在知识库内的信息。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


案例2:盘点硅谷裁员潮,直接输出PDF文件


下一个实测任务要求Marvis梳理一下今年硅谷大厂的裁员情况,做成一个PDF网页,包含裁员数据和分析,每条数据背后附上单独的消息来源。


在这一任务中,Marvis使用了多Agent协作的模式,文件Agent被唤起,并主动调用了文档写作Skill。这一Skill要求模型先做复杂度判断,然后加载写作模板、写作规范,再开始正式的执行。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


Marvis判断这属于一个复杂文档,预计产出超过3500字。它进行了多轮的网页搜索,收集到足够数据后开始逐页撰写PDF内容,最终输出了一份完整的调研报告。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


执行过程中,Marvis的多Agent协作让任务划分更加合理,两个Agent的并行工作一定程度上提高了效率。不过,这一任务中Agent出现了自主切换到英文的问题,Skill的内容和背后模型的特性可能导致了这一现象。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


Marvis生成的文档可以直接在侧边栏中进行预览,从结果来看,这一文档的内容明显要比AI单次生成的内容来得详实,文中的数据基本准确。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


排版方面,这一文档的风格比较朴素,通过表格、加粗、章节划分等方式,让内容的可读性更强。这种输出方式应该与Marvis内置的Skill有关。


靠应用宝操作安卓应用


效率仍有提升空间


Marvis可以通过腾讯应用宝在Windows PC上完成对安卓App的操作,并且相关操作不会干扰PC的正常使用。安装应用宝后,我们对这部分功能进行了体验。


案例1:自动到微博打卡签到,任务耗时3分多钟


Marvis官方在首页展示了微博超话签到这一任务。我们也实测了一下,要求Marvis打开微博去陈奕迅超话签到。


App操作Agent是这一任务的主要执行者。我们提前在应用宝中下好了微博并登录,以免Marvis在登录这一步卡住。


Marvis的执行速度不太理想。此前我们已经跑过类似任务,但它还是较为机械地按照规范来,检查微博安装包,试图搜索微博操作Skill,未果后直接开始任务执行。


开始操作后,Marvis只能截图一步,操作一步,每张截图都要分析个几秒钟,整个任务的执行时长被拉到3分多钟。下图是它的完整执行过程,画面经过20倍速的处理。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


▲动图经过20倍速处理


借助Marvis的定时任务功能,用户可以把上述App操作设置为每天自动执行的任务。不过,前提是电脑必须保持24小时开机。


案例2:拒绝小红书、微信操作请求


除了微博之外,我们也尝试了Marvis操作其他App的能力。当我们要求它操作微信并发送消息时,Marvis拒绝了这一请求,称由于系统限制无法在微信内执行点击和输入操作。我们尝试了小红书,也同样无法操作。


腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了


这可能是因为微信这类App的聊天和支付界面,本身可能就有防模拟点击、防注入输入的特殊安全机制,如果AI助手能随意替用户在微信上发消息、转钱,一旦被恶意利用,造成的风险和平台责任是平台无法承受的。因此,Marvis从源头上拒绝了任何涉及资金划转的自动交易等操作。


我们也尝试询问Marvis它到底可以直接操作哪些应用,不过Marvis一直答非所问。


结语:AI打工人雏形已现


但离“放手”还有距离


对于愿意尝鲜的极客用户来说,Marvis已经能带来实打实的效率提升。然而,现在普通用户仍无法完全放手让Marvis执行一个任务,复杂的软件生态、文件系统等影响因素,都有可能让Marvis的任务执行中断或偏离预期。


不过,Marvis的设计思路确实代表了一种明确的趋势。目前,国内已有不少AI厂商在多Agent产品上展开探索,跨端协同也逐渐成为行业共识。尽管体验还需要进一步打磨,但腾讯至少已经迈出了第一步。



文章来自于微信公众号 “智东西”,作者 “智东西”

1
文件重命名

【开源免费】ai-renamer是一个用AI帮你做文件夹或者图片命名的项目。该项目会根据文件夹或者图片内容来为文件进行重新命名,让你的文件管理更加便利。

项目地址:https://github.com/ozgrozer/ai-renamer

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
IOS下载
安卓下载
微信群