事情是这样的。
前几天我在一个群里看到有人在问,「有没有那种既能聊天又能帮我干活的AI?不是那种只能回答问题,而是真的能帮我整理文件、写代码、做PPT的那种?」
底下有人回,「ChatGPT啊,很聪明。」「Claude也不错。」
那个人说,「我试过了,它们确实很聪明,但是...它们只能动嘴。」
只能动嘴。
这四个字一下子戳到我了。
对啊,我们用了这么久的AI,它们确实很能聊,能写诗、能解答问题、能帮你改文案,但是你想让它们帮你把电脑里那一堆乱七八糟的文件整理一下?想让它们帮你把Excel里的数据做成图表?想让它们帮你写一段代码然后直接运行看看效果?
不行。
它们做不到。
它们被困在对话框里,被困在云端服务器里,它们触碰不到你的本地文件,执行不了你的本地命令,它们是一群被关在笼子里的聪明人,能给你出主意,但你自己得动手去干。
这就像一个特别厉害的军师,坐在帐篷里给你画作战地图,但具体带兵打仗,还得你自己去。
那你有没有想过,如果AI不只是一个军师,而是一个士兵呢?一个既能听懂你的话、又能真的动手干活的士兵?
这就是我今天想认真跟你聊的东西,腾讯WorkBuddy。
先别被这个名字吓到,WorkBuddy,翻译成中文就是「工作伙伴」,一个能真正帮你干活的AI伙伴。
它不是又一个聊天机器人,它是腾讯推出的一款AI原生桌面智能体工作台,这句话有点绕,我用大白话解释一下。
普通的AI,比如ChatGPT,你跟它聊完天,它给你一段文字回复,然后就没了,剩下的事全是你的。
WorkBuddy不一样,你跟它说一句话,它不只是给你建议,它会自己动手去干,读你的文件,写你的代码,整理你的数据,生成你的PPT,甚至能直接在你的电脑上执行命令,做完之后把结果交给你。
听懂人话,有自己的脑子,还能真的干活。
这三个加在一起,就是WorkBuddy最核心的东西。
你可能会问,具体能干什么?
我给你举几个具体的场景,都是真实能用的。
场景一,处理文件。
你电脑里有一堆PDF文件,可能是合同,可能是报告,可能是各种资料,你想把它们的主要内容整理成一份摘要,或者想从里面提取某些关键信息。
以前你得自己一个一个打开,慢慢看,慢慢摘。
现在你对WorkBuddy说,「帮我把桌面上的这10个PDF文件的主要内容整理成一份摘要,保存到Word文档里」,它就去干了,一个个读,整理,最后给你一个完整的文档。
它直接操作你的本地文件,不需要你手动上传下载,不需要你在各个窗口之间切来切去。
图片
场景二,写代码。
假设你不是程序员,但你想做一个小工具,比如一个能帮你自动记账的脚本,或者一个能批量重命名照片的小程序。
你直接跟WorkBuddy说,「帮我写一个Python脚本,能读取一个文件夹里所有照片的拍摄时间,然后按日期重新命名这些照片」,它就会帮你写代码,而且还会帮你把代码跑起来,看看有没有报错,如果有问题它自己会改,直到能跑通为止。
你不需要懂编程,你只需要说清楚你想干什么。
场景三,做PPT。
明天要开会了,你需要做一个汇报PPT,但你没时间弄。
你对WorkBuddy说,「帮我做一个关于Q1销售数据分析的PPT,风格简洁商务,包含销售趋势、区域对比、产品线分析三个部分」,它会自动生成完整的PPT文件,有标题、有内容、有图表,你拿到手之后微调一下就能用。
场景四,数据分析。
你有一份Excel表格,里面是你店铺过去一年的销售数据,你想看看哪些产品卖得好,哪些月份是旺季,但你对Excel的数据透视表不太熟。
你把文件给WorkBuddy,说「帮我分析这份销售数据,找出销量前10的产品和销售额最高的3个月份,用图表展示出来」,它会读你的Excel,做分析,生成图表,最后把结果告诉你。
这些都是已经能做的事,不是概念,不是演示,是你现在就能用的。
说到这里,你可能会想,这玩意跟ChatGPT到底有什么区别?
这个问题问得特别好,我觉得用一个比喻最能讲清楚。
ChatGPT是一个特别聪明的顾问,你问它问题,它给你答案,你想让它帮你写东西,它给你草稿,但每一个步骤的执行,都得你自己来。
WorkBuddy是一个真的会干活的同事,你告诉它你想要什么结果,它自己去想办法,自己去执行,做完把结果交给你,中间的过程你甚至可以不用管。
一个是动嘴的,一个是动手的。
还有几个很具体的区别,我列一下:
能不能操作你的本地文件? ChatGPT不能直接碰你电脑里的文件,WorkBuddy可以,当然是在你授权之后。
能不能自己执行任务? ChatGPT给你建议,然后就停了,WorkBuddy会自己把任务做完,包括运行代码、生成文件、整理数据。
能不能用手机远程控制? 这个很酷,WorkBuddy有一个功能叫Claw,你在手机上用微信给它发一条指令,你不在电脑前面也能让它帮你干活,回来就能看到结果。ChatGPT做不到这个。
需不需要一直盯着? ChatGPT是对话式的,你说一句它回一句,WorkBuddy可以自主规划任务步骤,复杂任务它能自己拆解成很多小步骤,然后一步步做,做完汇报给你。
图片
那它跟Cursor或者GitHub Copilot又有什么区别?
这三个都是跟写代码有关的AI工具,但定位不太一样。
Cursor是一个AI代码编辑器,它把AI能力深度集成到了编辑器里,写代码的时候补全特别快,适合专业程序员日常写代码用。
GitHub Copilot是微软出的,也是代码补全为主,你在编辑器里写代码,它实时给你提示接下来该怎么写。
WorkBuddy不是一个纯粹的编程工具,它是一个通用的工作台,代码只是它能做的事之一,它还能处理文件、做PPT、分析数据、管理邮件,而且它有一个很关键的特性,就是Agent模式,它能理解整个项目的结构,不只是补下一行代码,而是能规划一整个功能的实现。
简单说,如果你是专业程序员,日常写代码,Cursor可能更适合你,因为它的编辑器体验和代码补全是最强的。
但如果你不是程序员,或者你不只是想写代码,你还想让AI帮你处理各种办公任务,那WorkBuddy覆盖面更广。
还有一点很关键,WorkBuddy是腾讯出的,在国内访问没有问题,不需要科学上网,而且支持微信登录,对国内用户来说省了很多麻烦。
再来聊聊怎么上手。
这个其实特别简单,我给你说一下步骤,你照着做5分钟就能跑起来。
第一步,下载安装。你去搜「腾讯WorkBuddy」,或者访问它的官网(WorkBuddy - AI Agent 办公新范式),下载安装包,Windows装exe,Mac装.dmg,双击一路下一步就行,跟装一个普通软件没区别。
第二步,登录。打开之后用微信扫码登录,3秒钟搞定,也可以用账号密码,但推荐微信扫码,方便。
第三步,选模型。这个稍微讲一下,WorkBuddy支持好几个大模型,有腾讯自家的混元,还有DeepSeek、GLM、Kimi、MiniMax,你可以自由切换。
如果你不想研究那么多,记住一个省积分的口诀,「日常用DeepSeek-V4-Flash,复杂任务上GLM,尝鲜可以试试Hy3」,这样用你的免费积分能用很久。
新用户注册送2000积分,有效期90天,用DeepSeek-Flash的话够你玩很久了。
第四步,说句话试试。在底部的输入框里打「你好」,按回车,看到回复就说明已经跑通了。然后你可以试着说「帮我写一封请假邮件,理由明天去医院体检」,看看它是怎么干活的。
基本上到这一步,你已经有了一个能帮你干活的AI伙伴了。
用了WorkBuddy一段时间之后,我发现它有几个地方确实做得挺用心的。
一个是它的工作记忆机制,它能跨会话记住你的项目背景和偏好,你不用每次重新解释你是谁、你在做什么、你喜欢什么风格,它会记住。
就像你跟一个同事合作久了,他了解你的习惯,不需要你每次都交代一遍。
另一个是它的Skills技能包,现在已经内置了20多种技能,包括读PDF、做PPT、连腾讯文档、连QQ邮箱、定时任务、远程控制等等,而且支持零代码扩展,你想要新功能可以自己装技能包。
还有一个是它的企业级安全,腾讯给自己企业客户做的东西,安全审计这块是认真的,敏感信息过滤准确率超过99%,对于企业用户来说这个很重要。
说到这里,我想聊聊一个更深层的问题。
AI到底应该是什么?
这两年AI发展特别快,大家都看到了,从最开始的只能聊天,到后来能写代码,能画图,能做视频,能力越来越强,但我们好像一直在一个框框里打转,这个框框就是,AI永远只是在「回答」,而不是在「做事」。
你说一句话,它回一句话,这个模式用了好几年了,大家觉得这就是AI该有的样子。
但WorkBuddy让我看到的是另一种可能性,AI不应该只是一个回答者,它应该是一个执行者,一个能听懂你的意图、自己规划步骤、自己动手把事情做完的执行者。
这个变化看起来只是加了一个「执行」的能力,但实际上它改变的是你和AI之间的关系。
以前你跟AI的关系是,你问,它答,你是大脑,它是参考书。
现在你跟AI的关系是,你说目标,它执行,你是指挥官,它是士兵。
这个关系的变化,才是真正有意思的地方。
最后说几句大实话。
WorkBuddy不是万能的,它有它的局限,有些特别复杂的任务它可能做不好,有些它需要操作的地方你可能得给它一些指引,它还在快速迭代中,有些功能可能还不太稳定。
但方向是对的。
AI从「动嘴」到「动手」,这是一个必然的趋势,WorkBuddy只是比较早把这个体验做出来、并且做到了普通用户能用的程度。
如果你每天有大量重复性工作,如果你经常要处理各种文件和数据,如果你想有一个能真的帮你干活的AI伙伴,不只是动嘴的那种,可以装一个试试。
2000积分的免费额度,够你认真玩一阵子了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。