Python 作为高级编程语言,对于其性能要求也越来越注重。
本文总结:
性能优化的主要方法: 多进程处理,工具检测性能消耗完善代码,使用 Cython 扩展等。
说明
代码优化工具列表
代码优化工具列表
| 优化工具 | 工具说明 |
|—————–|——————-|
| PyLint | 语法检查工具 |
| vprof | 运行时间和内存分析器。图形化工具。 |
| cProfile | 查询消耗时间最久的方法函数 |
| line_profile | 查看耗时函数中的行耗时 |
| timeit | 模块计算代码执行时间 |
| memory_profiler | 诊断内存的用量 |
代码常见性能优化指标
机器性能指标
- CPU
- IO
- MEM 内存
- NET 网络
常见性能指标
- 响应时间
- 错误率
- 吞吐率
- 执行时间
- 内存占用
优化方法小结
方法小结:
- 使用 cProfile, cStringIO 和 cPickle 等用 c 实现相同功能
- 使用 c 扩展。目前主要有 CPython(python 最常见的实现的方式)原生 API, ctypes,Cython,cffi 三种方式
- 并行编程 multiprocessing
- 大杀器 PyPy
- CUDA 编程
相关资源
运行时间-vprof 图表化
vprof 简单使用
1 | pip3 install vprof |
运行时间-gprof2dot 图表化(强烈推荐)
cProfile+gprof2dot 简单使用
1 | sudo pip3 install gprof2dot |
编译优化-PyPy
PyPy 是用 RPython(CPython 的子集)实现的 Python,使用了 Just-in-Time(JIT)编译器,即动态编译器,
与静态编译器(如 gcc,javac 等)不同,它是利用程序运行的过程的数据进行优化。
如果 python 程序中含有 C 扩展(非 cffi 的方式),JIT 的优化效果会大打折扣,甚至比 CPython 慢(比 Numpy)。
所以在 PyPy 中最好用纯 Python 或使用 cffi 扩展。
PyPy 优势在于使用 JIT 动态编译,对于运行的函数会生成一个类 C 的函数。
编译成机器码,下次调用函数时,会直接调用机器码,速度得到质的飞跃。
但是由于本身编译机器码需要时间。
所以很多 JIT 实现都会先解释执行,然后确定了一段代码经常被执行之后,再进行编译。并且分多层 JIT,比较初级的对编译出来的机器码不做比较复杂的优化.
运行时间-上下文管理器
用上下文管理器测量部分代码运行时间
1 | from time import clock |
内存-objgraph
objgraph 是一个非常轻巧的工具,但在排查内存泄露的时候非常有用。
objgraph 的代码很短,只有一个文件,其主要依靠标准库中的 gc 模块来获取对象之间的创建引用关系。objgraph 使用起来十分简单,
1 | # 列出最多实例的类型 |
在遇到内存泄露问题时候首先考虑下用 objgraph 来进行查看,没有问题的时候也可以学习下它的代码,可以极大了解 gc 模块的应用。
内存-tracemalloc
tracemalloc 是用来分析 Python 程序内存分配的工具,使用上也很简单,
1 | import tracemalloc |
snapshot 结果中可以看到每个模块最终创建分配的内存大小,在追查内存问题上很有帮助。
Python 3.5.x 之后将 tracemalloc 集成到了标准库当中
编码规范-autopep8
Autopep8 是一个将 python 代码自动编排的一个工具,它使用 pep8 工具来决定代码中的那部分需要被排。
,Autopep8 可以修复大部分 pep8 工具中报告的排版问题。很多人都知道 Ctrl+Alt+L 也可以排版,快捷键只是可以简单的排版。
跟 Autopep8 是无法相比的。
1 | # autopep8 使用命令 |