从 PPT 到 App:我用 Codex 跑了一遍 AI 开发流程
最近我明显感觉到,Codex 已经不只是一个“帮你写代码”的工具了。包括它已经可以操作你的电脑,浏览器等,我感觉使用起来已经很完善和成熟。它能调用插件生成 PPT,能做数据分析和模型预测,能开发网页,也能进一步尝试开发 App。接下来,这次我主要试了几个比较典型的场景:PPT 生成、世界杯数据分析与预测、网页开发,以及更复杂一点的 App 开发。1.PPT生成插件
调用ppt生成插件,然后让它帮助我生成一个ppt,首先可以选中“插件”,选择“Presentations”Q:帮我创建一个蓝色风格、白色底的ppt,介绍一下DeepSeek-V4的架构可以看到,最后的PPT效果还是不错的,而且贴合了我给出的要求,同时元素是可以进行编辑的。2.数据分析+模型预测:AI预测世界杯晋级
26年世界杯队伍冠军之路预测1)去到kaggle,下载历史fifa足球信息2)获取本届世界杯的晋级规则2)收集26年世界杯的所有队伍信息,包括队伍名称、近半年的队伍交手记录,人员情况等等3)根据收集到的信息,帮我构建一个预测分类器,同时根据队伍请求等信息,给出最后的晋级名单和夺冠概率等一开始只有Codex只给我生成了一个比较简单的效果,也就是初步使用分类器去预测每个对于的胜率情况。它算出来以前我也做过用分类器的方式去模拟每个队伍的胜率情况,但是有一个问题是,近半年的球队战绩和人员配置其实会有很大概率影响在世界杯中的发挥。所以说历史数据的权重分配必须更加精细,不能简单地将过去几年的表现一视同仁。具体来说,我们需要引入“时间衰减函数”来重新校准模型。 比如,距离世界杯开赛前三个月的热身赛和预选赛,其参考价值应该远高于一年前的联赛数据。同时,核心球员的伤病情况、新老教练的战术磨合度,这些动态特征往往比静态的历史胜率更能反映球队的即时战斗力。此外,世界杯的特殊性在于其赛会制性质,这与漫长的联赛积分制截然不同。 在联赛中,稳定性是王道;但在世界杯的短周期内,球队的爆发性、阵容深度以及应对逆风球的能力往往决定了能走多远。因此,在续写模型时,除了基础的Elo评分或逻辑回归,可能还需要加入针对“杯赛基因”的专项特征,比如该队过往在大赛中的心理素质评分,或者关键球员的国际大赛经验值。所以最后,在展示的场景和计算上,使用了官方球队的26人名单,然后通过阵容分来加入ELO评分机制:阵容分 = 0.60 * 五大联赛球员占比 + 0.30 * 强联赛球员占比 + 0.10 * 俱乐部国家分布多样性最稳的球队是:巴西 97.4%、荷兰 97.3%、瑞士 96.4%、美国 92.6%。第三名竞争里比较强的是:巴拉圭 67.9%、苏格兰 62.5%、捷克 55.6%、瑞典 51.8%、科特迪瓦 50.4%。整体看,E组最接近双强并列,D组第三名巴拉圭最有冲击力,C组巴西和F组荷兰出线最稳。西班牙 99.4%、英格兰 98.8%、阿根廷 98.6%、法国 97.5%、哥伦比亚 97.2%。第三名里比较有竞争力的是:塞内加尔 70.9%、奥地利 56.4%、伊朗 62.5%、埃及 51.3%。整体看,H组、L组、K组强弱分化最明显;G组最混乱,比利时之外其他三队差距不大;I组塞内加尔虽然排第三,但晋级概率很高,是强第三名候选。阵容分 = 0.60 × 五大联赛球员占比 + 0.30 × 强联赛球员占比 + 0.10 × 俱乐部国家分布多样性五大联赛球员占比权重最高,占 60%
五大联赛包括:英格兰、西班牙、意大利、德国、法国。强联赛球员占比占 30%
在五大联赛基础上,再加入葡萄牙、荷兰、比利时、巴西、阿根廷、美国、墨西哥等联赛。俱乐部分布多样性占 10%
如果球员来自更多不同国家/联赛体系,说明阵容国际化程度更高,也会略微加分。阵容分不会直接决定胜负,而是先转成一个 Elo 修正项:调整后 Elo = 历史 Elo + 阵容 Elo 修正先对 48 支球队的阵容分做标准化,限制在 ±2 个标准差 内,避免某些球队被极端放大;然后再乘以 30,这个修正后的 Elo 会继续参与:单场胜 / 平 / 负概率计算;
小组排名模拟;
淘汰赛晋级概率模拟。
英格兰是当前第一热门。夺冠概率 32.1%,进入决赛概率 47.5%,阵容深度和路径落位共同推高它的上限。西班牙保持第二梯队顶端。夺冠概率 25.6%,官方 26 人名单几乎全部来自五大联赛,阵容修正后仍是最稳候选之一。法国、荷兰、哥伦比亚、巴西是第二集团。它们都有强出线能力,但在官方第三名落位和淘汰赛路径下,冠军概率明显低于前两队。3.开发一个网页
帮我生成一个介绍最新codex和chatgpt合并等功能页面第二个是注释功能。这个是我用得最多的功能之一,真的很香。启用批注功能后,可以直接在页面内圈选任意元素并标注修改意见。例如,如需将某元素替换为官方Logo,仅需手动输入文字说明即可,无需再通过截图或冗长的口头描述进行传达。4.开发一个APP
Codex其实还可以做一个更加复杂的内容,比如我们可以直接开发一个APP。由于做APP比做网页更加复杂,所以这一次要用到它的“计划模式”功能这种方式可以让你先检查一下它的实施计划,也让Codex有了先想后做的功能,这样子做出来的任务往往成功率会更高。确定好计划之后,我们接下来什么都不用管,直接交给Codex去执行就好可以看到这份计划比较详细,那么确定好之后就可以开始让它执行了网页开发多依赖浏览器环境,而APP则需直面多样的操作系统、设备型号与硬件接口。这意味着除了核心代码,你还得处理原生SDK的调用、应用商店的审核规则,以及本地算力与电池续航的平衡。这些额外的技术栈与生态约束,让APP开发的复杂度呈指数级上升。比如这里会遇到一个SDK和Gradle的问题,但是我们不懂不要怕,直接让它帮我们安装相关的依赖就可以了最后对应的APK安装包已经做好了,就可以下载到手机中执行看看。当然还可以用USB链接电脑,让它帮我们实时查看下载APP和修改也可以。最后的效果如下。整体效果我觉得是 7/10,已经有 Demo 产品感。它的优点很明显:暗色主题统一,绿色高亮和足球预测主题比较搭;首页、冠军、小组赛、淘汰赛、球队、热点这些模块划分清楚,用户一眼能知道这是一个“世界杯概率预测 App”;冠军榜页面的信息密度也不错,冠军、进决赛、进四强、进八强、进16强逐层展示,逻辑是成立的。当然一开始发现生成的界面不太符合APP界面的设计要求,所以我让它重新生成一下,同时让它在生成过程中进行界面可视化模拟,这样子它可以利用截图功能,实时查看效果。当然,要让Codex能够实时看到你的截图,需要打开里面的Computer Use功能。写在最后
这次体验下来,我最大的感受,是在于它已经能把很多原本需要程序员、设计师、数据分析师一起配合的事情,压缩成一个人和 AI 的协作流程。当然,它还远远不是万能的。比如数据预测场景里,模型一开始给出的结果会比较粗糙,需要你继续补充业务假设、特征权重和计算逻辑;做 App 的时候,也会遇到 SDK、Gradle、界面适配等各种工程问题;做页面时,如果你不告诉它哪里不好,它也未必能自动改到你满意。但这恰恰说明,AI 时代真正重要的能力,已经从“我会不会写代码”,变成了“我能不能把问题讲清楚、把任务拆明白、把结果验出来”。这可能才是 Codex 这类工具最值得关注的地方。