你是否还在为很多 Excel 的操作而感到犯难?
把几十到上百个表格进行批量合并,对上千条数据逐行进行筛选,对同类格式的报表重复进行修改,熬夜进行数据汇总,最终却因为一个公式的错误而全部重新进行工作。
职场中人员所进行的很多看上去比较零碎的操作,往往会耗费他们接近一半的工作时间。
很多人实际上都进入了对 Excel 存在**“依赖症”**的误区。当数据的数量变大,操作的重复程度变高的时候,Excel 的效率就会迅速地降低,而且还容易出现错误。
Python 只需要三行核心代码,就能够轻松处理很多耗费时间的工作,能够将你从机械的劳动中解脱出来。
在开始进行对比之前,首先需要明确两类工具之间核心的不同之处:
具体优势体现在这 3 点:
很多人认为 Python 是困难的。但是实际上搭建用于处理 Excel 的环境是极为简单的。整个过程仅仅是不断地点击“下一步”操作就可以了,新手也能够很快地学习并掌握使用方法。
从 Python 官方网站下载适合自身所使用系统(Windows 或者 Mac)的相应版本。
注意:一定要勾选 **“Add Python to PATH”**(自动进行环境变量的配置)。在那之后持续点击 Next 来完成安装操作。
开启 Windows 系统的电脑的“命令提示符”或者开启 Mac 系统的电脑的“终端”,输入一行命令之后按下回车键:
pip install openpyxl pandas
要是安装速度比较慢的话,那么就更换成国内的镜像源吧,将命令修改成如下所示的情况:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl pandas
就以**“把多个 Excel 文件批量合并到一个表格”**为例,这是职场当中常见的高频难题之一。
如果手动使用 Excel 来进行合并操作,需要一个个打开然后进行复制粘贴,这样既耗费时间又容易出现错误,但是对于 Python 来说,只需要三行关键代码就可以完成。
import pandas as pdimport glob# 1. 读取文件夹下所有xlsx文件并合并df = pd.concat([pd.read_excel(f) for f in glob.glob('待合并Excel/*.xlsx')])# 2. 导出结果,不保留行号df.to_excel("合并后的表格.xlsx", index=False)
有很多人一看到代码就心生畏惧,但是这三行代码的逻辑实际上是比较简单的,把它按照每一行依次拆开进行分析解读就可以理解了。
Python 不仅仅能够进行批量合并操作,它还能够处理 Excel 的大部分高频操作。核心代码只要稍微进行修改就能够实现复用。
需求:从数量为一万行的数据当中,找出很多“销售额”超出一千的相关记录,之后将这些记录导出以制作成新的表格。
import pandas as pddf = pd.read_excel("销售数据.xlsx") # 读取原始数据df_filtered = df[df["销售额"] > 1000] # 筛选条件df_filtered.to_excel("高销售额数据.xlsx", index=False) # 导出结果
需求:需要将 10 个 Excel 文件里的“金额”列设置为货币格式并且保留两位小数。
import globfrom openpyxl import load_workbookfor file in glob.glob("数据文件夹/*.xlsx"): wb = load_workbook(file) # 加载文件 ws = wb.active # B列为金额列,设置货币格式 ws["B:B"].number_format = '#,##0.00' wb.save(file) # 保存修改后的文件
需求:需要依据原始数据,自动去计算每个月的销售额以及平均值,然后生成汇总报表。
import pandas as pddf = pd.read_excel("销售数据.xlsx")# 提取月份df["月份"] = pd.to_datetime(df["日期"]).dt.month# 计算总和与平均值,并保留两位小数report = df.groupby("月份")["销售额"].agg(["sum", "mean"]).round(2)report.to_excel("月度销售报表.xlsx") # 导出报表
很多人认为我不会 Python,学习起来会非常困难。
但是从上面的例子可以看出,处理 Excel 的核心代码仅仅只有那么几行,并且其中大部分内容还能够直接进行复制使用,就算是没有任何基础的人也能够很快地掌握并且开始操作。
Excel 具有其自身的用途,但是需要选择合适的使用场景。如果您需要处理重复且数量众多的 Excel 任务,那么不妨考虑一下 Python。
花费三分钟的时间来布置好环境,复制几行代码。这样原本需要一天才能完成的工作就能够缩短到几分钟来完成。剩余的时间无论是用来放松一下还是用来提升核心能力,都要比机械地去操作 Excel 更具有价值。
行动建议:从今天开始尝试批量合并 Excel。将上面的代码进行复制,替换成属于自己的文件路径。亲自去体会 Python 自动化所带来的高效之处。