写在前面今天这篇不是讲程序员怎么跑数据仓库,而是讲普通运营、内容团队、小店主、社群负责人也会遇到的事:手里一堆 Excel、CSV、平台后台导出表,老板要你明天交一份周报。Agent 能帮忙,但前提是别让它直接“总结一下”。先保留原始数据,再清洗、探索、画图、写结论,最后把流程沉淀成团队自己的 skill。
最近在公司里遇到一个很常见的场景。
运营同学拿着几份后台导出的表:曝光、点击、成交、退款、客服工单、投放消耗。每张表字段都不太一样,时间口径也不完全一致。老板只问一句:
这时候很多人会打开 Excel,先做几个透视表,再截几个图,最后凭经验写结论。问题是,这种报表很难复盘。
你说“转化率下降”,别人追问分母是什么。
你说“产品 B 表现稳定”,别人追问是不是去掉了缺货那两天。
你说“渠道 3 质量变差”,别人追问有没有排除异常订单。
Agent skills 真能帮上忙的地方,不是替你把图画得更漂亮,而是把“从原始数据到最终结论”的路径固定下来。
我会把今天这条数据报表工作流拆成 8 个环节。
1)spreadsheets:先让表格变成可检查的工作簿
用途
spreadsheets 适合处理 .xlsx、.csv、.tsv 这类表格文件:整理多张 sheet、生成公式、做透视式汇总、加校验列、生成图表和 dashboard。
如果你是运营、社群负责人、店铺老板,最实用的用法不是“帮我分析一下”,而是让它先做一份可检查的工作簿:
原始数据 sheet 只读保留。
清洗数据 sheet 记录字段转换。
指标口径 sheet 写清楚公式。
汇总 dashboard 只引用前面的可追溯结果。
适配平台
Codex 里有本机 Spreadsheets skill;Claude Code 可以放一个自定义 spreadsheets / xlsx-report skill;OpenClaw、Hermes 也可以用兼容 SKILL.md 的表格处理 skill,把“原始表不可覆盖、派生列必须有公式”写进规则。
接入方式
Codex:直接用插件 skill 处理本地 Excel/CSV,要求输出 .xlsx 并检查公式和图表。
Claude Code:放到 ~/.claude/skills/ 或项目 .claude/skills/,让描述触发“遇到 Excel、CSV、报表、dashboard 时使用”。
OpenClaw/Hermes:从 skill 目录安装前先读 SKILL.md,确认它不会默认上传你的业务表到外部服务。
适合环节
第一步。先把数据放进一个能审计的结构里,而不是马上写结论。
风险提醒
表格 skill 最怕静默改数据。一定要求它:
不覆盖原始文件。
所有派生指标用公式或清洗日志解释。
行数、去重数量、缺失值数量要前后对账。
2)data-analysis:把清洗规则写成流程,而不是临时手改
用途
这里的 data-analysis 我更愿意把它理解成一类 skill:负责把“脏表”变成“可分析表”。比如字段名统一、日期格式转换、金额单位修正、重复订单去重、异常值标记。
它不是负责最后拍板结论,而是负责把加工过程透明化。
适配平台
Codex 可用 spreadsheets 加自定义数据清洗规则;Claude Code / OpenClaw / Hermes 可用 data-analysis、csv-data-wrangler、data-cleaning 这类 SKILL.md。我今天核对到的社区 skill 里,csv-data-wrangler 明确强调保留原始文件、校验行数、处理编码和大 CSV;这类规则比“帮我清洗一下”靠谱。
接入方式
把 skill 描述写得具体一点:
当用户提供 CSV/Excel 并要求清洗、合并、统计、生成报表时,先抽样检查字段、编码、缺失值和重复行,再输出清洗日志。
适合环节
原始表之后、分析之前。尤其适合平台导出表、订单表、投放表、问卷结果、课程报名表。
风险提醒
不要让 agent 自动删除“看起来异常”的记录。异常值要先标记,再让业务人确认。很多真实业务里的异常不是脏数据,而是促销、断货、退款、刷单、活动爆发。
3)analyzing-data:先探索,再决定该讲什么
用途
analyzing-data 更偏探索性数据分析。它适合做这些事:
看字段类型、缺失率、分布。
找异常点和异常日期。
看两个指标有没有明显关系。
判断该用趋势图、柱状图、散点图还是热力图。
这个 skill 的价值是让你在写周报前先问一轮问题,而不是先有结论再找图证明。
适配平台
Claude Code 和其他兼容 Agent Skills 的工具可以直接引用这类 SKILL.md;Codex 也可以把它作为本地自定义 skill 或配合 spreadsheets 使用;OpenClaw/Hermes 适合放在“探索数据”阶段触发。
接入方式
建议给它三个输入:
业务问题:这次想回答什么。
数据范围:时间、渠道、产品、用户群。
禁止动作:不能删除原始行,不能把相关性写成因果。
适合环节
清洗之后、可视化之前。先找真正值得讲的变化。
风险提醒
探索性分析很容易制造“看起来有关系”的幻觉。比如某天销售额低,不一定是渠道问题,也可能是缺货、节假日、退款延迟或统计口径变了。报告里要把“发现”和“推断”分开写。
4)data-visualization:图表要回答问题,不是装饰页面
用途
data-visualization 负责把数据变成图,但它应该先问:这张图回答什么问题?
看趋势,用折线图。
看类别对比,用柱状图。
看结构占比,用堆叠柱或 treemap,别动不动用饼图。
看异常点,用散点图或箱线图。
看多指标关系,用热力图或小 multiples。
适配平台
Codex 可以用表格、Python 或内置 artifact 能力生成图表;Claude Code / OpenClaw / Hermes 可以用 data-visualization skill 约束图表选择原则。今天核对到的社区 data-visualization SKILL.md 明确写了 chart type、颜色、标签和可访问性这些约束,适合作为参考。
接入方式
不要只说“画几张图”。更好的输入是:
这份周报面向老板,最多 4 张图。每张图必须有一个判断标题、指标口径、时间范围,禁止使用无法解释的装饰色。
适合环节
数据探索之后。把真正有价值的变化变成可读图表。
风险提醒
漂亮图表会放大错误结论的可信度。坐标轴截断、双轴图、缺少样本量、颜色暗示过强,都会让读者误解。建议把图表验收标准写进 skill:标题必须是判断句,脚注必须有口径。
5)data-analyst:把图表翻译成业务动作
用途
data-analyst 负责把数字变成业务语言。它不只是说“环比上涨 12%”,而是要补三件事:
为什么这个变化值得看。
可能原因是什么,哪些只是推断。
下一步动作是什么,谁负责验证。
比如内容团队的周报,data-analyst 不应该只写“收藏率提高”。它要进一步说:是哪个题材、哪种标题、哪个发布时间段带来的变化;下周要不要加测;需要保留哪些对照组。
适配平台
Claude Code、Codex、OpenClaw、Hermes 都可以接入业务分析类 SKILL.md。我今天核对到的 data-analyst skill 侧重 BI、SQL、KPI 定义和面向非技术人的洞察表达,适合放在“结论生成”阶段。
接入方式
给它一个固定输出格式:
本周最重要的 3 个变化。
每个变化的证据。
可能解释。
待验证项。
建议动作。
适合环节
图表生成之后、正式报告之前。
风险提醒
业务洞察最容易越界。Agent 可以提出假设,但不能替你确认因果。凡是涉及收入、投放预算、人效、绩效、客户归因的结论,都要标清楚“已验证 / 推断 / 待确认”。
6)documents:把分析过程写成能交接的报告
用途
documents 适合把数据分析过程沉淀成正式说明:背景、数据来源、口径定义、关键发现、风险、下一步动作。
这一步很容易被跳过。很多周报只有图和结论,没有说明。等下周换个人接手,没人知道这张图到底从哪张表算出来。
适配平台
Codex 有 Documents skill,强调 .docx / 文档 artifact 的渲染和验收;Claude Code / OpenClaw / Hermes 可以用文档写作类 skill,让 agent 生成报告说明、复盘文档、SOP。
接入方式
报告说明里建议固定这几个栏目:
数据来源。
时间范围。
指标口径。
清洗规则。
关键结论。
待确认风险。
下周动作。
适合环节
结论生成之后。适合日报、周报、复盘、投放报告、社群运营报告、课程报名分析。
风险提醒
文档 skill 很容易把不确定内容写得像事实。建议强制保留“证据等级”:原始数据、计算结果、推断、主观判断分开写。
7)presentations:把报告变成能讲的一页或几页
用途
presentations 不是让你再写一篇 PPT 文章。它在数据报表里的角色更窄:把已经确认的结论、图表和行动项做成可讲的汇报页。
如果只是小团队周会,甚至可以只做 3 页:
本周整体变化。
一个最关键问题。
下周要做的动作和负责人。
适配平台
Codex 有 Presentations skill;Claude Code / OpenClaw / Hermes 可以用 presentation / deck-builder / slide-outline 类 skill。注意,2026-05-24 已经专门写过 PPT 工作流,今天这里它只是报表链路的最后交付形态。
接入方式
输入不要是“做个高大上的 PPT”,而应该是:
用已确认图表和结论生成 3 页汇报页。每页标题必须是判断句;每页只讲一个结论;脚注保留数据口径。
适合环节
报告说明之后、会议沟通之前。
风险提醒
PPT 会压缩信息。被压缩掉的往往是前提、口径和不确定性。所以凡是图表进入 PPT,都要保留最小脚注:数据来源、时间范围、指标定义。
8)skill-creator:把一次报表流程沉淀成团队规则
用途
skill-creator 的价值在最后一步:把这次做报表的方法,沉淀成团队自己的 SKILL.md。
如果你们每周都做同一类报告,就不要每次重新写 prompt。把流程固定下来:
输入需要哪些表。
哪些字段必须存在。
哪些指标怎么算。
哪些图表允许用。
哪些结论必须人工确认。
输出文件命名和归档路径是什么。
适配平台
Codex 有官方 skill-creator;Claude Code、OpenClaw、Hermes 也都可以使用兼容 Agent Skills 格式的 SKILL.md。这个 skill 不是用来分析一次数据,而是用来把“下次怎么分析”写成可复用规则。
接入方式
最小版本可以这样写:
name:weekly-data-report
description:当用户要把平台导出的 Excel/CSV 做成运营周报时使用。
workflow:备份原始数据 -> 清洗 -> 指标口径 -> 图表 -> 洞察 -> 文档 -> 汇报页。
safety:不得覆盖原始文件;不得上传敏感数据;所有结论必须追溯到数据路径。
适合环节
流程跑通之后。尤其适合运营、销售、课程、社群、电商、小红书账号复盘这类重复任务。
风险提醒
不要把一次临时经验写成“永远正确”。团队 skill 要有版本号和复盘机制。业务变了,指标口径也要跟着更新。
如果明天早上就要交一份运营周报,我不会一上来让 agent 写结论。
我会这样拆:
1.把所有原始 Excel/CSV 复制到一个只读目录。
2.用 spreadsheets 建一个工作簿,拆出原始表、清洗表、指标口径表和 dashboard。
3.用 data-analysis / csv-data-wrangler 处理字段、编码、重复行和缺失值。
4.用 analyzing-data 找异常日期、异常渠道、异常产品和可能关系。
5.用 data-visualization 只画能回答问题的图。
6.用 data-analyst 把图翻译成业务洞察,但标清推断和待确认。
7.用 documents 写一份报告说明,留数据来源和口径。
8.用 presentations 做 3 页汇报页。
9.最后用 skill-creator 把这条流程变成团队自己的周报 skill。
说人话就是:先把证据链搭起来,再让 agent 帮你表达。
第三方 skills 处理表格时,风险比写文章更高。
因为表格里经常有客户手机号、订单号、销售额、成本、员工绩效、投放预算。你如果随手装一个来路不明的 skill,让它联网、读全盘、执行脚本,再把数据交出去,问题就不只是“报表写错”。
我的建议是:
能在本地跑,就不要上传。
原始表只读,不做覆盖保存。
skill 里如果有脚本,先读脚本再执行。
需要 API key、数据库密码、Cookie 的 skill,默认高风险。
第一次用社区 skill,先拿脱敏样例数据试跑。
输出报告时保留数据口径,不要只保留结论。
Agent 做数据报表最有价值的地方,是让过程更稳定,而不是让人完全不看数据。
数据报表这件事,看起来很适合 AI:表格、图表、总结,都是 agent 擅长的格式。
但越是这样,越不能让它直接跳到最后一步。
一份靠谱的报表,应该经得起追问:
原始数据在哪里?
清洗规则是什么?
指标怎么算?
图表为什么这样画?
结论是事实、推断,还是建议?
如果这些问题答不上来,报表越漂亮,风险越大。
OpenAI openai/skills 仓库,2026-05-27 核对最新提交为 2026-05-21,仓库包含 skill-creator、skill-installer、jupyter-notebook 等 curated/system skills:https://github.com/openai/skills
OpenAI skill-creator SKILL.md,说明 skills 由 SKILL.md、可选 scripts/references/assets 等组成:https://github.com/openai/skills/blob/main/skills/.system/skill-creator/SKILL.md
OpenAI Academy「Using skills」,说明 SKILL.md 是 workflow playbook,可用于让 ChatGPT/Codex 稳定执行重复任务:https://openai.com/academy/skills/
Claude Code Skills 官方文档,2026-05-27 核对可访问并跳转到 code.claude.com/docs/en/skills:https://docs.claude.com/en/docs/claude-code/skills
OpenClaw Skills 官方文档,2026-05-27 核对 openclaw skills install <slug> 等 CLI 说明:https://docs.openclaw.ai/cli/skills
Hermes Skills System 文档与 bundled skills catalog,用于核对 Hermes 的 skill 目录和 SKILL.md 组织方式:https://hermes.dhuar.com/en/guide/skills-system/ ,https://hermes.dhuar.com/en/reference/skills-catalog/
legout/data-agent-skills 的 analyzing-data SKILL.md,2026-05-27 读取 raw 文件,仓库最新提交核对到 2026-03-11:https://raw.githubusercontent.com/legout/data-agent-skills/main/skills/analyzing-data/SKILL.md
belokonm/claude-supercode-skills 的 csv-data-wrangler、data-analyst SKILL.md,2026-05-27 读取 raw 文件,仓库最新提交核对到 2026-01-16:https://github.com/belokonm/claude-supercode-skills
planifest/planifest-framework 的 data-visualization SKILL.md,2026-05-27 读取 raw 文件,仓库最新提交核对到 2026-05-19:https://raw.githubusercontent.com/planifest/planifest-framework/main/planifest-framework/external-skills/data-visualization/SKILL.md
本机 Codex 插件技能清单,2026-05-27 核对 Spreadsheets、Documents、Presentations、imagegen、skill-creator 的 SKILL.md。
关于「技术放肆聊」
我是小肆,一个大厂程序员,下班后聊 AI、前端、后端和互联网热点。不写通稿,不装导师,尽量把技术圈的热闹翻译成工程现场能听懂的话。
觉得这种视角还对胃口,可以关注一下。下次继续聊点真实的技术和互联网。