

从养宠物到做PPT,Skills正在变成Agent真正的万能搭档
2026年,Skills数量呈现爆炸式涌现,AI coding agent平台,如Claude Code、Codex、Openclaw、Gemini CLI等也作为越来越多用户首选安装之地了。
Anthropic 于2025年底推出的开放标准agentskills.io被广泛采用,Skills 通过一个包含 SKILL.md 的文件夹打包特定任务的指令、工作流、专业知识、元数据和脚本,实现可复用、专业化能力。
随之迎来更高关注点的CLI被带入大众视野,CLI作为提供执行层和工具调用能力,Skills则提供知识与流程层,指导 Agent 如何思考、判断、逐步执行,二者形成互补。
目前,许多工具已将 Skills 与 CLI 深度整合,支持一键安装和管理,通过逐步披露上下文的方式来节省我们所订阅的Token。

以下是分享的4个好玩实用的Skills,以及他们对应背后的生态与思考。
Codex宠物系统
把后台任务变成可视化陪伴
这套 Skill 最终生成的效果会包含 9 种动画状态,比如待机、奔跑、挥手、跳跃、失败、等待和代码审查等,供 Codex App 加载,并显示在工作界面中。

它的工作流程大致分为四步:
第一步是准备阶段,用户输入宠物名称、描述和风格要求后,系统会生成工作目录和任务清单。这个任务清单通常包含 10 个视觉生成任务,也就是 1 个 base 主参考图,以及 9 个动画状态行。
第二步是生成 base 图片。系统会调用底层的image-gen图像生成能力,先生成宠物的主参考图。这个 base 图相当于宠物的身份基准,后续所有动画帧都要围绕这个形象保持一致,避免不同动作之间出现角色漂移。

第三步是生成动画行。系统会逐行生成 idle、running-right、waving、jumping、failed、waiting、running、review、running-left 等 9 组帧 strips。其中,running-left 可以从 running-right 镜像派生,减少重复生成带来的不一致问题。
第四步是组装与打包。系统会将所有动画帧合成为一张 1536×1872 的 WebP 精灵图,并输出 QA 检查单、预览视频和验证报告。最终,会被放入指定的目录中,成为一只可以被正式加载的自定义宠物。
Github地址:
https://github.com/openai/skills/tree/main/skills/.curated/hatch-pet

现阶段OpenAI Codex 桌面端也已经原生集成了宠物悬浮层功能。
用户可以在应用设置面板中进入外观选项,找到宠物设置,并在内置基础宠物中进行选择,比如 Dewey 小鸭子、BSOD 蓝屏小鬼等。如果不想通过菜单操作,也可以直接在指令框输入「/pet」命令,选中的宠物就会出现在屏幕角落。
这些宠物会一直悬浮在窗口顶层,但不会遮挡代码,也不会干扰正常开发。不过,宠物功能并不只是屏幕装饰,它同时也是一种状态可视化工具。
当 Codex 在后台处理任务时,宠物的动画状态会和系统运行状态同步。比如任务运行中,宠物会忙碌地跑动,像是在说「我正在干活」;等待任务完成时,它会进入 waiting 状态;代码审查时,它会呈现 review 状态;任务失败时,它会出现沮丧或失败反馈;需要用户确认时,还会显示红色时钟图标;任务完成后,则会弹出绿色勾选提示。

宠物系统的价值体现在用更轻量、更有氛围感的方式,让开发者感知 Codex 的运行状态。用户不需要反复切换窗口去检查线程进度,只要看一眼宠物的动作,就能大致知道系统正在做什么。
如果Codex 桌面版的内置宠物不够用,此时用户可以通过 hatch-pet Skill 定制自己的专属角色。操作方式也比较直接:先在 OpenAI Codex 输入框中键入「skill-installer hatch-pet」并回车完成安装;然后在命令菜单中强制刷新应用内的技能列表;最后输入「hatch-pet create」并加上具体描述词,就可以开始生成宠物。
系统会自动分配多个子代理并行工作,生成包含不同动作状态的动画帧,并打包成标准格式。生成完成后,配置文件和图片会自动存入本地 pets 文件夹,重启应用后就能在宠物列表中看到这只新角色。

自定义宠物的流行,也催生了第三方资源社区。
其中,Petdex 是一个典型的开源资源分享平台,目前收录了超过一千个由开发者上传的动画伴侣,并支持按照心情、颜色和类型进行筛选。
它最方便的地方在于提供一键安装指令。用户在网页上看到喜欢的宠物后,只需要复制并运行对应的「npx petdex install」命令,就能把宠物直接安装到本地 Codex 环境中,省去了手动配置的麻烦。

地址:https://petdex.crafter.run/zh
另一个平台 codex-pets.net 则更像是一个创作者画廊。
它加入了点赞、浏览量统计和随机推荐功能,更适合用户去挖掘冷门作品,或者寻找特定画风的动漫角色和动物伴侣。
这里的安装方式相对手动一些,用户需要下载压缩包,并将其解压到 Codex 指定目录中。但也正因为这种创作者属性,它吸引了不少喜欢分享自制角色和同人作品的玩家。

地址:https://codex-pets.net/#/?sort=popular
用户不仅可以自己孵化宠物,也可以直接使用社区里的现成作品,让 Codex 桌面端变得更有个人风格。
飞猪 FlyAI Skill
把旅行搜索能力接入Agent
它的核心作用,是把飞猪官方的旅行商品库、实时库存和搜索能力,封装成 AI 可以直接调用的工具,让开发者可以在自己的Agent系统中接入酒店、机票、景点、度假等旅行服务。
简单来说,过去 AI 可以帮用户规划旅行,但往往停留在「给建议」的层面。它可以告诉你三亚有什么好玩、周末适合去哪,但很难直接连接真实商品库,完成实时搜索、价格对比和预订跳转链接。

这套能力依托飞猪 AI 开放平台,目前重点开放在搜索维度,主要包含两类核心能力。
第一类是全域搜索。用户可以用自然语言发起一次查询,AI 会跨酒店、机票、景点门票、演出活动、度假产品等多个品类进行搜索。比如用户说「这周末想带娃去湖州玩两天,找个儿童娱乐设施丰富、交通方便的酒店」,系统就能理解其中的时间、地点、亲子需求、酒店条件和交通要求,并返回匹配结果。
第二类是垂直场景搜索引擎。它把不同旅行场景拆成更结构化的能力,比如酒店搜索、机票搜索、POI 搜索、火车票搜索,以及万豪酒店和酒店套餐搜索等。酒店搜索可以覆盖全球酒店、度假村、民宿和高端酒店套餐;机票搜索可以查询全球航班动态,并支持复杂航程对比;POI 搜索则可以覆盖景点门票、一日游、境外签证和当地向导等服务。


从 Skill 配置来看,flyai 的定位是一个面向旅行、航班、酒店搜索与预订场景的运行时 Skill。
它支持自然语言搜索酒店、机票、景点、演出、旅行优惠等内容,并通过 Fliggy MCP 连接飞猪的实时搜索与预订服务。适用场景包括自由行、跟团游、商务出差、亲子旅行、蜜月、周末短途、演唱会出行等。
在实际使用中,flyai 提供了多种命令能力。比如 keyword-search 适合做宽泛的旅行探索,一句话同时搜索酒店、航班、景点门票、演出活动和文化体验;ai-search 更偏语义搜索,适合处理复杂自然语言意图;search-flight、search-hotel、search-poi、search-train 则分别对应机票、酒店、景点和火车票的结构化搜索,方便开发者做深度对比和结果展示。

Github地址:https://github.com/alibaba-flyai/flyai-skill
安装方式也比较直接。开发者可以通过以下指令安装:
除此之外,官方也提供了试用能力。对于刚开始体验的开发者来说,即使不配置 API Key,也可以进行基础测试(每天100次免费调用);
如果想获得更稳定的服务和更充足的调用次数,建议配置正式 API Key。飞猪还为每位开发者准备了 5000 次不限期的免费调用包,用来降低早期测试和应用开发成本。

官网链接:https://flyai.open.fliggy.com/
更值得注意的是,飞猪还同步推出了「推广者计划」。这个计划面向开放平台开发者,开发者可以在自己的 Agent 中集成 flyai Skill,为用户提供酒店、机票、景点等旅行搜索和预订能力。
当用户通过这个 Agent 完成相应旅行商品的下单后,开发者可以获得订单佣金分成。
过去,开发者做旅行 Agent,更多是在做攻略生成、行程规划和信息整合;但有了 flyai 之后,AI 应用可以直接连接飞猪的官方商品库与动态库存,把「推荐」延伸到「搜索、比较、跳转预订」。
飞猪不只是把商品放在自己的 App 里等待用户搜索,而是让开发者可以把这些能力带到更多 Agent、插件、工作流和对话应用中。
用户在哪里提出旅行需求,飞猪的搜索和预订能力就有机会在哪里出现。
当自然语言搜索、实时库存、商品跳转和佣金归因结合在一起,旅行数据就不再只是沉默资产,而会变成开发者可以调用、组合和变现的生产资料。
大量商家选择
美团餐饮系统skill助力运营
美团餐饮系统最近也正式发布了面向 AI 场景的 CLI 工具与配套 Skill。

它的核心作用,是把美团餐饮系统原本成熟的接口能力,封装成更适合 AI 调用的指令化工具,通过对接商家,将其连接到餐饮经营系统里,帮商家完成查询、推荐、排队、领券等具体操作。
这套能力分为两个部分。第一个是 mt-tech CLI 工具,它相当于美团餐饮系统和 AI 工具之间的连接器。用户只需要在 Node.js 环境下执行一行命令:
npm install -g mt-tech
就可以完成基础工具安装。之后,当用户在Claude、WorkBuddy等 Agent工具里提出需求时,AI 就能通过 CLI 调用美团餐饮系统的相关接口进行回答。

第二个是配套 Skill。它进一步降低了 AI 对接餐饮场景的门槛,预置了大量餐饮经营中的常见交互模板,覆盖门店信息、菜品推荐、排队取号、优惠发放、外卖服务、到店自取等场景。
安装完成后,用户可以直接用自然语言提问,AI 会自动引导提供凭证、选择门店,并调用接口返回结果。
金谷园饺子馆就是一个很典型的例子。这是一家开在北京北邮旁边、已经经营近二十年的饺子馆。今年 4 月,他们自建了金谷园饺子馆 AI Skill,并发布到 GitHub 和 Gitee。

顾客安装后,就可以通过 AI 助手查询门店信息,比如地址在哪、几点开门、是否支持外卖、生饺子怎么煮、Wi-Fi 密码是多少,甚至还能直接在美团上排队取号。
这个 Skill 不只是一个门店 FAQ,它还内嵌了基于美团排队能力的取号服务。顾客可以直接对 AI 说「帮我在北邮店排个队,2 个人」,AI 会先查询可选桌型,再和用户确认人数与桌型,最后自动完成取号,并返回排队号和等待信息。之后,用户还可以继续询问「我前面还有几桌」或「取消排队」。

遇见小面.Skill 则展示了另一种更品牌化的玩法。作为一个拥有全球 500 多家门店的重庆小面品牌,遇见小面把自己的 Skill 设计成了一个叫「小面君」的 AI 店小二。它可以帮用户找附近门店、查看菜单、推荐菜品、发放优惠券。
比如用户说「附近有什么遇见小面」,小面君会先询问所在区域,再返回附近门店的位置、距离、营业时间和联系方式。用户继续问「有什么推荐的」,它就能根据品牌招牌菜和用户偏好,推荐红碗豌杂面、金碗酸辣粉、不辣套餐或多人搭配。用户问「有优惠吗」,它还能发放 Skill 渠道专属优惠券。

美团餐饮系统后来把这类玩法进一步产品化,推出了类似「商家名片」的服务。商家不需要理解复杂的 AI 技术,也不需要自己写 Skill,只要提供门店基础信息,美团餐饮系统就可以帮助生成一个「24 小时在线的金牌服务员」。
这个 AI 服务员可以回答门店地址、电话、营业时间、Wi-Fi 密码等基础问题,也可以根据门店招牌菜、顾客口味和预算,给出点餐建议。顾客可以在微信里通过 WorkBuddy 等Agent平台中安装对应门店名片,随时向它提问。
对餐厅来说,这种服务最直接的价值,是把大量重复咨询从人工前台手里释放出来。比如顾客半夜想确认第二天能不能订座,或者出门前纠结远不远、适不适合带小孩、两个人怎么点,AI 都可以即时回应。

它不一定替代真正的服务员,但可以先把那些标准化、重复性、高频的问题接住,让员工把精力放在迎客、上菜、处理突发情况这些更需要人情味的环节。
现在,通过Skill,顾客在出门前、决策前、排队前,就已经开始和门店产生互动。AI 不只是售前客服,也可以成为菜单推荐员、排队助手、优惠分发入口和品牌陪伴角色。
Dokie PPT Skill
张月光打造工作助理朋友
Dokie Skill ,作为PPT生成的Skill,虽然目前市面上已经有大量的PPT生成项目,像平替Claude Design版OpenDesign效果就很不错,但作为一款原生AI产品中脱离的Skill,自然有着它独特的能力
该套Skill生成的文件中统一采用 1280×720 分辨率,图表使用 Chart.js 4.5,图标调用 Font Awesome 6.5,动画层只允许使用 GSAP,并且禁止 CSS animation、emoji 和虚构图片 URL。
最终产物会以按序编号的独立 HTML 文件形式输出。

Github链接:https://github.com/MYZY-AI/dokie-ai-ppt
它的生成流程也不是「输入标题,秒出 PPT」那种一次性结果,而是一个分步确认的 Agent 工作流。系统会依次完成需求收集、主题选择、大纲确认、HTML 生成和本地预览,每一步都需要用户确认后才继续推进。
主题可以通过 npx dokie-cli 命令行拉取,支持本地和在线主题库,也允许用户自定义颜色与字体。
动画风格则分为 Minimal、Balanced 和 Creative 三档,分别对应正式商务、通用展示和创意发布等不同场景。
在内容生成上,Dokie AI PPT Skill 强调按确认后的大纲生成。它不会随意扩展或缩减内容,每张幻灯片只承载一个核心主题,内容过密时会自动拆分。即使是在修改已有项目时,它也遵循最小改动原则,尽量保留原有布局结构。

制作此产品 Dokie 的背后关键人物正是张月光。
张月光 2012 年毕业于清华大学计算机科学与技术系,曾在阿里和字节跳动担任产品经理。2023 年,他作为产品负责人主导了妙鸭相机。妙鸭上线后凭借 9.9 元 AI 写真迅速出圈。
但他后来反思道,妙鸭更像是互联网思维运营的写真生意,还不是真正的 AI Native 产品。
离开阿里后,他在 2023 年 12 月创立北京沐言智语科技有限公司,使命是「创造 AI 朋友」。

沐言智语随后推出了多款产品,包括 AI 实时互动播客「ChatPods」 、AI 乙女游戏与情绪陪伴产品「星眠」,以及对话式Agent 「Dokie.ai」
其中 Dokie.ai 于 2026 年 1 月左右上线,支持文本、文件、URL 等多种输入,可以自动生成大纲、内容和设计布局,并在短时间内积累了数十万用户和百万美金级 ARR。
张月光选择 PPT 这个方向,是因为他认为 PPT 本身已经完成了 PMF,不需要再验证需求,真正的问题是如何做出明显更好的体验。他观察到,市面上的 AI PPT 产品大致有两类:一类是套模板,本质上是把用户内容塞进固定模板里;另一类是用前端代码生成,但后续修改成本很高。

还有一些图像生成式 PPT 产品虽然视觉效果不错,但在商业表达中容易省略关键信息,而且风格辨识度太强,一眼就能看出是 AI 做的。
因此,张月光对这个标准的定义很直接,拿出来给人看,没人觉得这是 AI 做的,而且比人做得更好。
他认为,PPT 的核心包括构建内容、组织逻辑和视觉呈现。AI 在前两项上已经具备优势,Dokie 要补齐的是视觉呈现这一层,让设计真正服务于表达。
他希望 Dokie 能是一个先解决功能性问题,再逐渐走向人格化的工具。按照他的理解,一个能稳定帮你解决某类问题、并在交互中不断反馈和成长的 AI,也可以被称为「朋友」。






