|
网站内容均来自网络,本站只提供信息平台,如有侵权请联系删除,谢谢!
文章转自微信公众号-Python之禅
众所周知,不是一种执行效率较高的语言。此外在任何语言中,循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为 1 个单位,将此操作重复执行上万次,最终耗费的时间也将增长上万倍。和是中常用的两种实现循环的关键字,它们的运行效率实际上是有差距的。
比如下面的测试代码:- import timeit
- def while_loop(n=100_000_000):
- i = 0
- s = 0
- while i < n:
- s += i
- i += 1
- return s
- def for_loop(n=100_000_000):
- s = 0
- for i in range(n):
- s += i
- return s
- def main():
- print('while loop\t\t', timeit.timeit(while_loop, number=1))
- print('for loop\t\t', timeit.timeit(for_loop, number=1))
- if __name__ == '__main__':
- main()
- # => while loop 4.718853999860585
- # => for loop 3.211570399813354
复制代码 这是一个简单的求和操作,计算从 1 到 n 之间所有自然数的总和。可以看到循环相比要快 1.5 秒。
其中的差距主要在于两者的机制不同。
在每次循环中,实际上比 for 多执行了两步操作:边界检查和变量 i 的自增。即每进行一次循环,都会做一次边界检查和自增计算(i +=1)。这两步操作都是显式的纯 Python 代码。
for 循环不需要执行边界检查和自增操作,没有增加显式的代码(纯 Python 代码效率低于底层的 C 代码)。当循环的次数足够多,就出现了明显的效率差距。
可以再增加两个函数,在 for 循环中加上不必要的边界检查和自增计算:- import timeit
- def while_loop(n=100_000_000):
- i = 0
- s = 0
- while i < n:
- s += i
- i += 1
- return s
- def for_loop(n=100_000_000):
- s = 0
- for i in range(n):
- s += i
- return s
- def for_loop_with_inc(n=100_000_000):
- s = 0
- for i in range(n):
- s += i
- i += 1
- return s
- def for_loop_with_test(n=100_000_000):
- s = 0
- for i in range(n):
- if i < n:
- pass
- s += i
- return s
- def main():
- print('while loop\t\t', timeit.timeit(while_loop, number=1))
- print('for loop\t\t', timeit.timeit(for_loop, number=1))
- print('for loop with increment\t\t',
- timeit.timeit(for_loop_with_inc, number=1))
- print('for loop with test\t\t', timeit.timeit(for_loop_with_test, number=1))
- if __name__ == '__main__':
- main()
- # => while loop 4.718853999860585
- # => for loop 3.211570399813354
- # => for loop with increment 4.602369500091299
- # => for loop with test 4.18337869993411
复制代码 可以看出,增加的边界检查和自增操作确实大大影响了循环的执行效率。
前面提到过,底层的解释器和内置函数是用 C 语言实现的。而 C 语言的执行效率远大于。
对于上面的求等差数列之和的操作,借助于内置的函数,可以获得远大于或 while 循环的执行效率。- import timeit
- def while_loop(n=100_000_000):
- i = 0
- s = 0
- while i < n:
- s += i
- i += 1
- return s
- def for_loop(n=100_000_000):
- s = 0
- for i in range(n):
- s += i
- return s
- def sum_range(n=100_000_000):
- return sum(range(n))
- def main():
- print('while loop\t\t', timeit.timeit(while_loop, number=1))
- print('for loop\t\t', timeit.timeit(for_loop, number=1))
- print('sum range\t\t', timeit.timeit(sum_range, number=1))
- if __name__ == '__main__':
- main()
- # => while loop 4.718853999860585
- # => for loop 3.211570399813354
- # => sum range 0.8658821999561042
复制代码 可以看到,使用内置函数替代循环之后,代码的执行效率实现了成倍的增长。
内置函数的累加操作实际上也是一种循环,但它由 C 语言实现,而 for 循环中的求和操作是由纯代码 s += i 实现的。。
再拓展一下思维。小时候都听说过童年高斯巧妙地计算 1 到 100 之和的故事。1…100 之和等于 (1 + 100) * 50。这个计算方法同样可以应用到上面的求和操作中。- import timeit
- def while_loop(n=100_000_000):
- i = 0
- s = 0
- while i < n:
- s += i
- i += 1
- return s
- def for_loop(n=100_000_000):
- s = 0
- for i in range(n):
- s += i
- return s
- def sum_range(n=100_000_000):
- return sum(range(n))
- def math_sum(n=100_000_000):
- return (n * (n - 1)) // 2
- def main():
- print('while loop\t\t', timeit.timeit(while_loop, number=1))
- print('for loop\t\t', timeit.timeit(for_loop, number=1))
- print('sum range\t\t', timeit.timeit(sum_range, number=1))
- print('math sum\t\t', timeit.timeit(math_sum, number=1))
- if __name__ == '__main__':
- main()
- # => while loop 4.718853999860585
- # => for loop 3.211570399813354
- # => sum range 0.8658821999561042
- # => math sum 2.400018274784088e-06
复制代码 最终的执行时间约为 2.4e-6,缩短了上百万倍。这里的思路就是,既然循环的效率低,一段代码要重复执行上亿次。
索性直接不要循环,通过数学公式,把上亿次的循环操作变成只有一步操作。效率自然得到了空前的加强。
最后的结论:
实现循环的最快方式—— —— ——就是不用循环
对于 Python 而言,则尽可能地使用内置函数,将循环中的纯 Python 代码降到最低。
当然,内置函数在某些情况下还不是最快的。比如在创建列表的时候,是字面量写法的速度更快
到此这篇关于Python 实现循环最快方式(for、while 等速度对比)的文章就介绍到这了,更多相关Python 实现循环最快方式内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
参考资料:
The Fastest Way to Loop in Python - mCoding (https://youtu.be/Qgevy75co8c)
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
免责声明
1. 本论坛所提供的信息均来自网络,本网站只提供平台服务,所有账号发表的言论与本网站无关。
2. 其他单位或个人在使用、转载或引用本文时,必须事先获得该帖子作者和本人的同意。
3. 本帖部分内容转载自其他媒体,但并不代表本人赞同其观点和对其真实性负责。
4. 如有侵权,请立即联系,本网站将及时删除相关内容。
|