你最近有没有这种感觉——
Claude写代码越写越蠢?
Codex调用越来越像在抽盲盒?
GPT更是连基础语法都要帮你纠正三遍?
恭喜你,不只是你一个人这么觉得。
最近群里哀嚎一片,都在吐槽主流模型编程能力集体"降智"。有群友说Claude 3.7 Sonnet现在写个排序算法都能给你整出bug,还有人吐槽Codex的响应速度越来越慢,像在用2G网络。
而我,今天要告诉你们一个好消息: 国产模型,这次真的站起来了。
01 | 先说结论:Qwen 3.6-Plus是什么水平?
4月2号阿里刚发布的Qwen 3.6-Plus,我这几天深度用下来,只想说一句话:
"Claude,你歇歇吧,让专业的来。"
不是吹,先看数据:
这个SWE-bench是什么概念呢?就是让模型去解决真实GitHub仓库里的问题——代码对了就是对了,错了就是错了,没法糊弄。
Qwen 3.6-Plus在全球编程盲测榜单Code Arena上排名第二。
是的,你没看错,全球第二。
它前面只有一个Claude,后面踩着GPT-5.0-High和Gemini 3.1 Pro。
而且这还是盲测——评测者不知道哪个模型在跑,全凭效果打分。水分?不存在的。
02 | 降智这事儿,真的不是幻觉
我知道很多人会问:主流模型真的在降智吗?
我告诉你,不只是你一个人感觉降智了。
最近Codex和Claude的"降智"传闻已经从坊间八卦变成了行业共识。
Claude 3.7 Sonnet刚出来那会儿多猛啊,代码写得行云流水,debug能力直接封神。结果用着用着,总感觉它在"偷懒"——能两步写完的代码非要给你绕五步,注释倒是写得贼详细,代码质量嘛……emmm。
Codex更别提了,自从OpenAI把重心放到GPT-5上,Codex的更新就像挤牙膏,速度慢得像在用意念编程。
群里的老哥们已经开始用脚投票了——
"Claude现在写个React组件能给你整出10个warning"
"Codex?我用它的时间还不如直接自己写"
"等它响应我都能写完了"
而Qwen 3.6-Plus的出现,恰好填补了这个空窗期。
03 | 恒叔实测:这玩意儿到底行不行?
纸上得来终觉浅,我直接用qwen code调这个模型跑了三天。
先说结论: 速度快,代码质量过得去,最重要的是——免费,每天1000次。
这三条,每一条都是痛点。
速度这块,Qwen 3.6-Plus响应是真的快。我用它跑了一个中等复杂度的数据处理脚本,从需求描述到代码输出,大概就几秒钟。之前用Claude,光思考就要等半天。
代码质量这块,我用它写了几个小工具,包括一个自动化测试脚本和一个数据清洗脚本。整体逻辑清晰,边界条件处理得也比较到位,没有那种"一眼AI味"的感觉。
至于免费额度,每天1000次调用,对个人开发者来说简直是白嫖天花板。我算了一下,按这个额度用,一个月能省下至少大几百块的API费用。
群里也有几个老哥在用,反馈出奇的一致:
"qwen code + 3.6-Plus,真香"
"免费额度够用了,速度比Claude快"
"写业务代码绰绰有余"
04 | 它到底强在哪?
说人话:它不是一个代码补全工具,是一个能帮你干活的AI协作者。 第一,百万token上下文。
别的模型处理几千字就开始"断片",Qwen 3.6-Plus直接给你怼到100万token。
你知道这意味着什么吗?
你可以把整个代码仓库丢给它。
一个中型项目的所有代码,一次性分析。它能帮你梳理依赖关系、找出潜在的bug、标注技术债,最后给你输出一份带优先级的重构路线图。
第二,Agent能力是真的强。
它不是"帮你写一段代码",而是"帮你完成一个多步骤的开发任务"。
拆解任务→规划路径→执行→测试→修改
这一套流程,它能自主完成。
有个开发者实测,让Qwen 3.6-Plus在Claude官方的前端设计Skill指导下开发一个AI眼镜独立站,三轮对话,8分钟,网站搞定。
8分钟。
第三,价格是真的便宜。
每百万Tokens输入最低2元。
对比Claude的API价格,这个差距大概是7倍。
同样写代码,Claude一个月可能要几百块,Qwen 3.6-Plus可能就几十块。
效果差不多,成本差一个数量级。
05 | 适合谁用?
强烈推荐:
写业务代码的开发者
写单元测试
代码审查和重构
自动化脚本
前端页面生成
勉强能用:
复杂算法题(这个还是Claude更强)
前沿技术调研(有时理解不够深入)
说实话,对于日常开发来说,Qwen 3.6-Plus已经覆盖了80%的场景。
省下的20%,你用别的主力模型补上就行。
06 | 怎么用?
最简单的方式:用qwen code调用。
群里已经有老哥整理好了教程,核心就是通过Qwen Code插件接入,每天1000次免费额度,基本够个人开发者日常用了。
不想折腾代码的,直接去千问APP体验也行,虽然没有API那么灵活,但胜在简单粗暴。
07 | 写在最后
说实话,这几年国产AI给我的感觉一直是"差点意思"。
参数堆得挺高,评测分数也挺好,但实际用起来总觉得差一口气。
但Qwen 3.6-Plus不一样。
它在编程这个核心场景上,真的做到了"国产更好用",而不是"将就用国产"。
Code Arena全球第二,SWE-bench接近Claude Opus 4.5,价格是Claude的1/7,每天还有1000次免费额度。
这不是弯道超车,这是直接换赛道了。
当然,Claude没有死,GPT也没有退场。但对于我们这些要干活的人来说,多一个选择永远是好事。
免费、快速、质量够用——这三个条件同时满足,Qwen 3.6-Plus做到了。
恒叔建议:别光看评测报告,自己去试。
上手用一下,感受一下速度和代码质量,你会发现——
降智?不存在的。 只是该换个模型了。
如果觉得有用,转发给你身边还在用Claude"受苦"的程序员朋友。
关注恒叔,带你用最接地气的方式玩转AI工具。