DeepSeek 识图模式上线
打工人又多了一个免费神器
6月18日,DeepSeek 网页端和 App 端正式上线「识图模式」。没有发布会,没有预告,多模态团队负责人陈小康在 X 上就丢了一句话:「试试新的眼睛。」——对打工人来说,又一个免费生产力工具可以白嫖了,哈哈哈。
🤔 你是不是也这样——看到一张截图里有表格有代码,你要一个字一个字敲出来?收到一张数据报表的图片,想分析趋势却只能手动录入?开会拍的 PPT,想用里面的内容却发现全是图片无法复制?
你可能觉得,识图嘛——不就是把图片里的文字抠出来?
差远了。
传统 OCR 是"读字不认图",DeepSeek 的识图模式是真正让 AI 能"看懂"一张图。
什么意思?它不仅能读出图上的字,还能理解图里的逻辑关系、空间结构、甚至情绪。上传一张复杂图表,它不光提取数据,还能分析趋势;上传一张报错截图,它不光读出错误码,还能告诉你怎么修。
背后的技术叫「Thinking with Visual Primitives」(以视觉原语思考)。大白话就是:AI 在思考图片时,不再模糊地描述「左边那个大的」,而是像人一样边看边指,把坐标点、边界框直接嵌入推理链条。
💡 用专家的话说:相当于给 AI 装了一根「赛博手指」
一张 800×800 的图片,DeepSeek 处理后只需保留约90 个 token 在缓存中,而 GPT 需要约 740 个,Claude 约 870 个 , Gemini 约 1100 个。
01
截图变代码 / 变文字
这是最刚需的场景。设计稿截图 → 直接生成 HTML 代码;网页截图 → 提取所有文字信息,连跳转按钮都能还原。
"以前改个网页模板,至少得打开 IDE 手写半小时。现在截个图丢给 DeepSeek,它帮你反向生成代码。"
直接完美复刻,图标部分需自己替换
02
表格 / 图表数据提取
收到一张截图版的报表?不用再对着 Excel 手打数据了。上传图片,DeepSeek 能提取表格结构、数字,甚至帮你分析趋势。
实测这非常的精准呀!
03
报错信息秒诊断
程序报错、系统弹窗、蓝屏截图……截个图丢进去。DeepSeek 不仅读出错误信息,还会分析原因和给出解决方案。
"对非技术岗的打工人来说,这招尤其管用——你不懂代码,但截个图总会吧?"
04
PPT / 文档素材快速提取
开会拍的 PPT、随手翻到的纸质报告、产品说明书……拍张照上传,DeepSeek 帮你提炼核心信息。不需要手动打字,不用扫描仪,手机一拍就完事。
05
趋势一句话总结
运营、市场、销售——谁手上没几张数据图?月度趋势、用户增长、转化漏斗……上传截图,让它用一句话说清核心结论。汇报前看一眼,心里有底。
综合大量用户实测反馈:
✓日常场景很能打——截图、报错信息、表格、论文、网页内容,又快又准
!复杂图表掉链子——多层逻辑流程图、高密度数据图表,准确率明显下降
!人脸识别要降级——经过实测,连自己老板梁文锋都认错了(认成了杨植麟和马化腾)
🎯 结论:日常搬砖绰绰有余,关键场景建议人工复核。但考虑到它的价格——免费——这性价比没得挑。
1打开 DeepSeek 网页端 chat.deepseek.com 或 App
💡 目前网页端已全面开放,App 端仍显示"内测中",但功能已经可用。
DeepSeek 这波操作挺聪明——刚完成 510 亿元首轮融资、估值逼近 4000 亿元的消息刷屏没两天,就把识图模式全量放出来了。
一方面补齐了多模态这块短板,另一方面继续打"免费"这张牌。
你不一定每天用,但当你需要的时候,它就在那里——不用付费,不用科学上网,打开网页就能用。
这大概就是 2026 年最实在的"打工人福利"了。