上周有个读者问我:「我想用 AI 帮我写个 Python 脚本处理 Excel,4 个模型我该用哪个?」
这是个好问题。AI 写代码的能力确实天差地别——有的模型能一步生成完整可运行的脚本,有的则需要你反复调教才能得到正确结果。
我今天用 5 个办公常见的编码场景,实测了 4 个模型的代码能力。结果如下:
结论很明确:通义千问在代码能力上是碾压级的领先,尤其是在 Python 和 VBA 领域。
✦ 测试 1:Excel 公式生成—— 老司机也能翻车
测试问题:「我有一个销售表,A 列是产品名称,B 列是销售额,C 列是地区。要求统计每个地区销售额前 3 的产品名称和金额。」
💬 豆包给出的方案:FILTER + LARGE 组合
🤖 能用,但公式嵌套较深,新手容易改错。
💬 通义千问给出的方案:LAMBDA + SORT + TAKE 组合
🤖 方案更优雅,且附带了解释说明,方便读者理解原理。
Excel 公式方面,4 个模型差距不大,基本都能给出可用方案。但通义和文心在公式的优化程度上更胜一筹——不仅给公式,还会解释逻辑。
✦ 测试 2:Python 脚本生成—— 差距最大的环节
测试问题:「写一个 Python 脚本,读取一个文件夹下所有 Excel 文件,把每个文件里的 Sheet1 合并到一个 DataFrame,然后按日期排序输出到新 Excel。」
🤖 通义千问:一次性生成完整代码,含异常处理、路径校验、进度提示,运行零报错。
🤖 Kimi:代码质量也不错,但缺少异常处理,需要在提示词里额外要求。
🤖 文心一言:能跑,但生成的代码风格偏旧,用了很多已弃用的 pandas API。
🤖 豆包:生成了框架,但多个细节错误(路径拼接、pandas 读取方式),需要 2-3 轮修正才能运行。
✦ 测试 3:VBA 宏—— 小众但刚需
VBA 是很多公司「老系统」的标配。虽然 Python 在崛起,但 Excel 宏的需求依然庞大。
通义千问在 VBA 上的表现远超其他模型。给一个需求描述,它能生成带注释、带错误处理、带进度条的完整宏代码。豆包在 VBA 上几乎不可用,生成的代码经常缺关键字。
✦ 我的建议
如果你主要写 Excel 公式:哪个都行,甚至文心一言的公式解释最清晰。
如果你要写 Python/VBA:无脑通义千问,代码质量和一次成功率明显高一个档次。
如果你只是调试已有代码:Kimi 也很不错,它的上下文理解能力强,能看到代码的全局逻辑。
最后说个大实话:AI 写的代码需要人工验证。别太信任 AI 生成的代码,尤其是涉及数据处理的脚本,一定要先在小数据上跑一遍确认结果对,再上生产。
📌 收藏备用 · 明天聊:数据分析能力实测——做表、画图、出结论谁最好?