30秒速览
你有没有过这种体验:花了两三天做一份PPT,排版调了又调,动画改了又改,发给领导——领导翻了两页就关了。
我有过。直到有一天我让AI直接输出了一个HTML文件。打开的瞬间我愣住了:这东西能点、能筛、能折叠、能交互——而且是AI用10分钟生成的。
然后我突然意识到一件事:在AI时代,你的标准工作输出物可能不再是PPT、Word、Excel——而是HTML。 不是那个"写网页用的HTML"——是AI直接生成的、可交互的、可沉淀的"界面型"产出。
一、我以前是怎么交付工作成果的
做一份调研分析:收数据→跑结果→写结论→做PPT→排版→发给领导。
做一个方案建议:想清楚→写Word→画流程图→做PPT→排版→发给领导。
做一份数据看板:导数据→做Excel→画图表→截图→贴进PPT→排版→发给领导。
发现没有——不管什么工作,最后都变成了"做PPT"。 而"做PPT"这件事本身,跟你的专业能力没有任何关系。它消耗的是你的排版能力、审美能力、跟PowerPoint斗智斗勇的能力。
更让人崩溃的是:你花了三天做的PPT,大部分人看两页就关了。 不是内容不好——是太长了、太静态了、找信息太费劲了。
二、然后AI给了我一个HTML文件
有一次我让AI帮我做一份调研数据的分析报告。我本来以为它会给我一份文档或者Markdown。结果它问我:"要不要输出成HTML?可以做成可交互的。"
我说试试。
打开之后我愣住了。
这不是一份"文档"——这是一个界面。左边有目录导航,点哪跳哪。数据部分有筛选器,可以按维度切换。详细内容默认折叠,想看哪段点开哪段。图表是动态的,鼠标悬停能看具体数字。
整个体验跟"读一份报告"完全不同——更像是"用一个工具"。
从那之后,我开始把越来越多的工作输出改成HTML。用了几个月之后,我发现了五件事:
1. 它不是静态的——内容可以动态变化,可以界面化操作
PPT是死的。你做完就定了,改一个数据要重新排版。
HTML不一样。里面的内容可以动态变化。 你可以加筛选器让看的人自己选维度;可以加折叠区让详细内容按需展开;可以加Tab切换让不同视角并排呈现。
看的人不是在"读"你的成果——是在"用"你的成果。 他可以按自己的关注点去找信息,不用从头到尾翻完一份50页的PPT。
2026年5月,Anthropic Claude Code的工程负责人Thariq Shihipar给了这个现象一个定义:
"AI的产出物从'被阅读的文档'进化为'被使用的界面'。每一个HTML文件都是一个临时性的思维环境(temporary thinking environments)。"
——Thariq Shihipar, 2026年5月7日
临时性的思维环境——这个词特别准。 它不是一份你要"保存归档"的文档,而是一个你要"在上面继续想事情"的环境。
2. 它可以直接做demo——比需求文档直观100倍
以前我要跟别人沟通一个想法,得写需求文档:功能是什么、流程是什么、交互是什么。写完发过去,对方看了半天说"我没太理解你说的是什么意思"。
现在我让AI直接生成一个HTML的demo。不用写需求文档了——直接把"我想要的东西"做出来给你看。
"我想要一个能录入数据、自动生成分析、可以导出结果的工具"——与其写三页文字描述,不如让AI用10分钟生成一个能点能操作的demo。对方打开就懂了。
Simon Willison(Django联合创始人)在2026年5月8日做了一个验证实验:用同一段复杂代码,分别让AI输出Markdown解释和HTML解释。他的结论是:
HTML版本"明显好用"——深色主题、语法高亮、按严重性颜色编码、能折叠展开技术细节。对比Markdown版本的"一坨长解释",完全不在一个维度上。
3. 输出后不是一次性的——是可沉淀的框架
这是最让我惊喜的一点。
PPT做完就完了——下次做类似的东西,你还得从零开始。模板是死的,数据换一套就得重新排。
但HTML不一样。AI生成的HTML本身就是一个框架。 下次做同类分析,你把新数据丢进去——结构在、逻辑在、交互在、样式在——直接出结果。
我现在每次做完一个分析任务,都会让AI把最终成果生成一个HTML格式的离线工具。导入新数据和文档后,不需要联网、不需要再开对话,直接离线生成我想要的内容。
这个东西不是"一次性的报告"——是"可以反复使用的生产工具"。
Thariq发布的20个HTML示例里就有这类东西——拖拽看板、标志编辑器、prompt调优器。不是文档,是工具。用完一次还能再用。
4. AI直接就能读取——不需要像其他格式那样装插件
这个点可能很多人没想到。
你让AI读一张图片——需要视觉能力,很多模型不支持,支持的也经常"看错"。你让AI读一份PDF——需要解析插件,解析出来经常格式乱七八糟。你让AI读一份Excel——需要专门的工具,而且复杂表格它经常读错行列关系。
但HTML?AI直接就能读。 因为HTML本质上就是结构化的文本——标签告诉AI"这是标题""这是表格""这是列表"——AI读起来没有任何信息损耗。
这意味着什么?你用AI生成的HTML,下次可以直接喂回给AI继续迭代。 不存在"格式转换导致的信息丢失"问题。而你试试把一份PPT喂给AI——它能读出来多少有效内容?大量排版信息、动画信息、图片占位符——全是噪声。
微软专门做了一个叫MarkItDown的工具(GitHub超12万Stars),功能就是把29种格式统一转成Markdown给AI读。这反过来说明了一件事:大部分格式AI读起来都费劲,需要专门转换。而HTML不需要。
5. 文件特别小
一份完整的HTML文件——含内联CSS样式、JavaScript交互逻辑、所有内容——多大?
根据Beam.ai的研究数据:完整HTML(含内联CSS + 渲染diff + 徽章)约5,480 tokens。占百万token上下文窗口的0.55%。
对比一下:一份PPT动不动几十MB。一份带图的Word也是几MB起步。一份Excel加上图表更大。
HTML是纯文本。 一个能交互、能筛选、能折叠的"看板",文件大小可能只有几十KB。你邮件发、微信发、链接分享——都没有压力。双击直接在浏览器打开——不需要装任何软件。
三、这不是我一个人在犯傻
我一开始以为是自己发现了什么新大陆。后来一搜——好家伙,2026年5月,AI圈集体"叛变"了。
5月7日,Anthropic Claude Code的工程负责人Thariq Shihipar发了条推:"HTML is the new Markdown。"附了20个示例——全是单文件HTML,没有一个是传统文档。
5月8日,Django联合创始人Simon Willison发文宣布:放弃用了三年的Markdown默认输出。 标题起得很猖狂——《The Unreasonable Effectiveness of HTML》(HTML那不讲道理的有效性)。
5月12日,OpenAI创始成员Andrej Karpathy公开力挺,顺手给了一条路线图:纯文本→Markdown→HTML→……→交互式神经视频。
三个大佬48小时内集体调转方向。5月9日文章登顶Hacker News首页。
Thariq说了一句话我觉得特别损:
"没人真正会读超过100行的Markdown,我也绝对无法让组织里的其他人去读它。"
把"Markdown"换成"你花三天做的PPT"——一样成立。
四、为什么以前不行,现在突然行了?
HTML存在30年了。为什么2026年才成为AI的标准输出?
因为以前有三座山挡着,现在全被推平了:
第一座山:以前AI的"嘴"太小。 2023年GPT-4只有8K token的输出窗口——HTML标签本身就吃token,生成一份带样式的HTML,光"包装纸"就占了一半空间。现在?起步200K,企业版1M。包装纸的成本约等于零。
第二座山:以前AI生成HTML不稳定。 2023年让AI写HTML,十次有三次格式炸裂、JS报错、样式崩塌。现在它能稳定产出单文件、内联CSS、vanilla JS——双击就能打开,不需要任何环境。
第三座山:以前工作的产出物本质是"被读的"。 一段解释、一份总结、一个README——文字就够了。但现在AI帮你做的是分析报告、实施计划、数据看板——这些东西的本质是"被用的"。你不只是要读它,你要在上面筛选、对比、操作、决策。文字承载不了这个需求,界面可以。
三座山一起倒——HTML的时代就来了。
而且Karpathy从脑科学的角度补了一刀:人类大脑约三分之一是专门处理视觉信号的并行处理器。AI给人类输出的最佳方向就是高带宽的视觉内容——Markdown是在用高速公路送自行车,HTML才配得上这条路的带宽。
五、"做PPT"这件事本身就是一种浪费
哈佛商业评论2026年3月发了一个研究——当人大量使用AI协作时会发生什么:
想想你现在的日常:AI给你一份分析、一份报告、一份方案——全是文字、全是长文档。你要从头到尾读完、判断哪些可用哪些有问题。到下午你的判断力已经被榨干了。
HTML通过视觉层次(重要的大、次要的小)、交互筛选(只看你关心的维度)、折叠隐藏(不相关的默认收起来)——直接降低你审阅时的认知负荷。
而你以前花三天做PPT做的是什么?排版、对齐、调颜色、加动画——全部是在手动做HTML自动就能做的事。 而且你做得还没有AI好。
这就好比:有人发明了洗衣机,你还在搓衣板上一件件搓——不是因为搓得更干净,是因为你不知道有洗衣机。
现在你知道了。
六、不是什么都要用HTML——别走极端
话说回来,我也不是什么东西都输出HTML。
给同事发个消息、写个TODO、记个备忘——文字够了,别整那么复杂。给AI喂素材(让它读你的文件)——用Markdown更好,token更省,AI解析更准。
简单判断标准:这个东西接下来是"看一眼就完了"还是"要在上面继续做事"?
看一眼就完了→Word/Markdown/随便什么。
要在上面做事→HTML。
Tony Bai有个比喻我觉得挺形象的:
"过去你是工人,需要Markdown这种轻巧的工具。现在你是厂长,需要HTML这种看板——快速审阅AI提交的工作报告。"
你什么时候从工人变成厂长的?大概就是你开始用AI的那一天。
最后
我现在回头看自己以前做的那些PPT,有种看自己高中日记的羞耻感——不是内容不好,是形式太落后了。
花三天调色块、对文字框、加动画——这些精力全部花在了"让内容好看"上,而不是"让内容好用"上。
现在AI用10分钟生成一个能交互、能筛选、能复用的界面。你的精力终于可以放在"这个东西对不对、够不够、还差什么"上了——这才是你真正值钱的地方。
早知道有HTML,我还苦哈哈做什么PPT。
如果你对AI有什么想聊的话题——不管是踩过的坑、没想通的事、还是"AI能不能帮我做XX"这种具体问题——可以告诉我。 我不一定有答案,但我们可以一起探讨。毕竟我也是一边用一边想——很多东西到现在也没完全想明白。
写于2026年5月