很多技术人员看到这个问题,会脱口而出:「pandas功能远比Excel强,速度更快,Excel早就该淘汰了。」
但真相是:大公司根本没想过用pandas取代Excel。
不是因为pandas不够强,恰恰相反,是因为 pandas 太像工程工具,Excel 太像组织工具。这两者根本不在一个维度竞争。
在技术人员眼中,Excel只是一个处理二维表格的软件,有单元格、公式和图表。
但在非技术岗位(市场、销售、HR、财务)同事眼中,Excel是:
一个万能的、可视化的、所见即所得的商业画布和微型业务系统。
它的核心价值不在于能处理多大规模的数据,而在于它提供了一个极低门槛的环境,让完全不懂编程的业务人员,亲手将自己的业务逻辑和工作流程进行数字化和自动化。
我们公司商务部门有位大姐,快四十了,学历不高,但她部门的定海神针,人称「表姐」。
她的武器库里,只有Excel。她用它来做:
1. 客户关系管理(CRM)
2. 销售业绩追踪与预测
部门负责人每月初要看这个表来判断资源投入。
3. 项目管理
问题:你怎么用pandas取代她的工作流?
技术人员可能会说:
「我可以用Python+pandas+Streamlit搭一个Web应用,功能更强大。」
但现实问题是:
谁来开发?
公司成千上万个业务人员,每个人都有独特工作流,你能为每个人都定制一套系统吗?
谁来维护?
业务总在变。大姐自己打开Excel,10分钟改几个单元格公式就ok。
如果是系统,需求->评估->排期->修改->测试->上线,一周过去了。
谁来培训?
假设团队100人,5个数据分析,95个业务。
用pandas能把5个人效率提升3倍,但让95个人形成基本编程能力,成本高得离谱。
1. 可见性(Visibility)
表格世界里有技术人长期忽略的事实:
- 颜色、批注、边框、冻结窗格、筛选、高亮 这些在程序员眼里「很土」的东西,在业务流程里就是信息本身。
- 财务复核时,红色=待确认,黄色=口径变更,绿色=已过账
pandas能处理结构化数据,但Excel能承载半结构化协作。
2. 零门槛协作
pandas呢?发个.py文件给老板?
「这是什么玩意?我打不开。」
3. 培训成本为零
Excel的普及率接近100%。任何新员工上来就会用。
Python环境配置?IT申请、版本管理、依赖安装、权限控制...
光这些就能劝退90%的业务人员。
大公司从不试图用单一工具取代一切,而是分层:
| 层级 |
工具 |
使用人群 |
| 底层ETL |
SQL, Python, Spark, Airflow, dbt, Flink |
数据工程师 |
| 中间层 |
数据仓库, BI系统, 数据平台 |
数据分析师 |
| 最上层 |
Excel, 飞书表格, Google Sheets, 在线协同表 |
所有业务人员 |
pandas在底层默默运行,Excel在最表面闪耀。
技术人员容易高估pandas,低估Excel。
因为技术视角下:
但公司运转不只靠硬指标,还靠:
Excel在这些成本控制上,优势太大了。
一个很多人没意识到的点:
大多数用表的人,根本不需要pandas。
日常场景:
这些表:
在这种场景下,pandas的优势根本发挥不出来。
反而每多一层代码环境、依赖安装、版本差异、权限管理,都会变成真实阻力。
技术人追求的是「最优解」:
但组织追求的是把最多的人拉进同一套流程。
pandas很强,但它强在数据处理。
Excel没那么强,但它强在让不会写代码的人也能参与业务。
在一个百人公司里,有5个工程师和95个业务,你选哪个工具作为核心协作平台?
答案显而易见。
技术人员最容易犯的错,就是用技术标准去衡量业务工具。
「Excel落后了。」
「怎么还有人用Excel?」
「python+pandas分分钟取代它。」
但真正的问题是:取代了然后呢?
如果一个工具能让一个不懂编程的大姐,自己做出CRM、BI、项目管理系统,且用了十年都没出大错,那不是工具的落后,而是工具设计的伟大。
pandas和Excel从来不是竞争关系,而是互补:
- pandas处理后端数据heavy lifting
与其想着取代Excel,不如想着怎么让你的技术,更好地服务于那些用Excel的人。
(完)