06 连接VBA和Python¶
VBA虽然在表格处理领域有着举足轻重的作用,但是往往由于太原始了,所以在处理一些基础问题的时候经常需要手搓,比如排序,比如去重,这往往会浪费大量的时间,但是其毕竟是表格原生的语言,直接发送一个xlsm文件,用户也能成功执行
而python中内置很多关于表格处理的包,如xlwings,pandas等,其处理迅速,比如在处理上万行,上千个文件的时候,处理效率确实比VBA更快,但是由于不是“长在表格里的语言”,因此在某些问题上又不如VBA
因此将两者进行联动就显得非常重要了,让两个部分各自发挥自己最大的价值,其中一个很重要的工具就是 命令行,下面重点讲一下如何联动。
1. 通过命令行实现¶
方式1-1. python 的 sys 模块读取命令行¶
现在我在命令行,这样写了一句运行命令:
python 之后的 worker.py 开始(这个是程序的名字),就是一个参数列表了,sys 就会读取这个参数列表,并存放,如果我们只写一句 print(sys.argv),那么可以返回一个列表:
因此我们上面的方式,通过索引取值,sys.argv[1] 拿到的就是5,sys.argv[2] 拿到的就是6,然后调用multiply 函数,就并计算结果,最后你能在命令行看到:
当然,有的时候你可能不能立马在控制台看到输出,这个是因为
- Python的
print()函数使用行缓冲 - 输出内容先存储在内存缓冲区中
- 当缓冲区满了、遇到换行符或程序结束时,内容才会真正输出到控制台
所以你可以在 print 后面加上一个参数 flush=True,这个代表就是直接将结果立马输出到控制台。
方式1-2. VBA 调用 命令行执行python代码¶
我们已经知道可以通过命令行执行代码了,那如何通过VBA将命令行调用出来呢?比如我们要实现这样一个简单的需求:
从表格的A1和A2 单元格取值,然后执行python程序进行计算,将结果放到A3 单元格中:
我们就可以运行底下这样一段VBA代码,然后就可以看到A3单元格中填入了数字 6。
在上面的程序中,我们的 pyScriptPath 告诉VBA 程序在的位置,然后通过 CreateObject 创建一个窗口,发送命令,命令里面的四个引号代表的其实是一个双引号,pythoncmd等同于:
python "D:\pythonProject\NewBegin\worker.py" 2 3
然后我们通过objectShell.exec 构建一个对象,通过objExec.StdOut.ReadAll() 抓取python程序的输出,当然这里也可以使用run方法,只不过这样我们就需要先写入一个文档,然后再从文档里读,这样显然更麻烦。所以通过命令行的交互,我们知道了如何通过VBA调用python程序,但是调用前需要保证你本地:
- 有可以执行的python代码文件
- 有python的编译环境
2. 通过EXCEL插件实现¶
其实如果你有一些python使用xlwings或者pandas的经验,就可以将两个应用很好地融合在一起了,接下来我将演示如何通过xlwings 插件,将两者融合在一起。
方式2-1. EXCEL初始配置¶
首先打开你的EXCEL,注意需要在宏设置里面,勾选上启用VBA宏,以及信任对VBA工程的访问
- 打开 Excel,点击左上角的 “文件” (File) -> “选项” (Options)
- 点击左侧的 “信任中心” (Trust Center) -> “信任中心设置” (Trust Center Settings...)
- 点击左侧的 “宏设置” (Macro Settings)
- 勾选这一项:“信任对 VBA 工程对象模型的访问” (Trust access to the VBA project object model)
- 点击确定保存
设置完成之后,先退出EXCEL程序,因为后面我们需要在python中安装对应的插件
方式2-2. python 安装插件¶
然后通过pip安装支持包,然后通过第二条指令安装EXCEL插件
Successfully installed the xlwings add-in!
方式2-3. 插件选项卡¶
重新打开EXCEL,你就能看到在顶部工具栏,多了一个选项卡xlwings,在这里由于我是直接在anaconda环境的base空间中执行的上面两条命令,因此进入它就自己给我配置好了conda Path 和 Conda Env,如果说你进入的时候这个地方是空的,就在左侧的interpreter处填入你python编译器的位置即可。
另外需要提一下,建议勾选 RunPython: Use UDF Server(这是为了提高速度,防止每次点击都重启 Python 解释器) 接下来,你只需要写一段python程序,然后使用VBA调用它即可
方式2-4. 代码和表格准备¶
比如,我有一个DATA.xlsx 文件,结构大概是下面这样的:
因此如果你需要调用python程序来对你的文档做处理的话,就可以写一个同名的py文件,非常重要的是同名,这个是因为你在xlwings插件下可以看到最左侧有一个run main的按钮,这个按钮的意思是:
在本xlsx文件同一个目录下,找一个同样名字的 py文件,然后执行里面的 main 程序
所以,如果你想要点击上面那个按钮进行执行,就严格按照这个结构组织文件,所以我在DATA.py 中写了以下代码:
实现的主要功能,就是根据 “产品类别” 列拆分得到若干个sheet,其中大家需要理解的就是:
DATA.xlsx这个工作簿在调用,因此wb就被实例化为这个工作簿了,同时我们把所有要执行的代码,放到 main 这个函数下。
方式2-5. 程序运行¶
但是在点击这个按钮执行程序之前,需要记得一个非常重要的事情,就是在VBA工程中引用xlwings
1、工具 → 引用
2、然后把xlwings给勾选上
3、单击Run Main 运行程序
等待几秒钟,你就会发现有弹窗提示(当然这个是因为我DATA.py中写了提示框)
同时看到执行的结果,新建了四个表,按照产品类别进行了划分:
这里补充一句,如果你不想让python程序的名字和表格名字一样,我们也可以自己写VBA代码,然后执行:
这样子,我们其实就告诉xlwings在当前目录下有一个splitter.py文件,点击运行此VBA代码,就会执行splitter.py文件中的main过程,所以我们的py文件名字就不受约束,只不过就是我们自己得写一句上面这样简单的代码
希望上面的教程可以让你成功架起EXCEL和python之间的桥梁,快动手尝试一下吧!