替代 for 循环,让 Python 代码更 pythonic !

Python学习与数据挖掘

共 6164字,需浏览 13分钟

 ·

2024-04-11 04:40

推荐关注↓ 加入 城哥知识星球 ,解惑答疑,告别迷茫
为什么要挑战不在代码中使用for循环呢?因为这样可以促使你学习使用更高级、更地道的语法或库。以 Python 为例,本文介绍了许多大家其实在别人的代码里都见过、但自己很少用的语法。

从我开始探索 Python 中惊人的语言功能到现在已经有一段时间了。一开始,我给自己提出了一个挑战:练习更多的 Python 语法,降低使用for循环的频率。这让我的代码变得更简洁和规范,看起来更 pythonic!下面我将会介绍这样做的好处。


通常如下使用场景中会用到 for 循环:


  • 在一个序列来提取一些信息。

  • 从一个序列生成另一个序列。
  • 写 for 已成习惯。

幸运的是,Python 已经有很多工具可以帮助你完成这些工作,你只需要转移你的思路,并以不同的角度来思考它。
通过避免编写 for 循环,你可以获得什么好处:
  • 较少的代码量
  • 更好的代码可读性
  • 更少的缩进(对 Python 还是很有意义的)

我们来看一下下面的代码结构:
      
        
          # 1
        
      
      
        with ...:
      
      
            for ...:
      
      
                if ...:
      
      
                    try:
      
      
                    except:
      
      
                else:
      
    

在这个例子中,我们正在处理多层嵌套的代码,这很难阅读。这个例子使用了多层嵌套的代码。我在这段代码中发现它无差别使用缩进把管理逻辑(with, try-except)和业务逻辑(for, if)混在一起。如果你遵守只对管理逻辑使用缩进的规范,那么核心业务逻辑应该立刻脱离出来。
"扁平结构比嵌套结构更好" - The Zen of Python
可以使用的已有的工具来替换 for 循环
1.List Comprehension / Generator 表达式
我们来看一个简单的例子。如果你想将一个数组转换为另一个数组:
      
        result = []
      
      
        for item in item_list:
      
      
            new_item = do_something_with(item)
      
      
            result.append(item)
      
    

如果你喜欢 MapReduce,你也可以使用 map,或者 Python 中的 List Comprehension:
      
        result = [do_something_with(item) for item in item_list]
      
    

同样,如果您只想迭代数组中的元素,也可以使用一样的代码 Generator Expression。result = (do_something_with(item) for item in item_list)
2.函数
如果您想要将一个数组映射成另外数组,只需调用 map 函数,就可以用一个更高级、更实用的编程方式解决这个问题。
      
        doubled_list = map(lambda x: x * 2, old_list)
      
    

如果要将序列减少为单个,请使用 reduce
      
        from functools import reduce
      
      
        summation = reduce(lambda x, y: x + y, numbers)
      
    

另外,许多 Python 内置函数都会使用 iterables:
      
        >>> a = list(range(10))
      
      
        >>> a
      
      
        [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
      
      
        >>> all(a)
      
      
        False
      
      
        >>> any(a)
      
      
        True
      
      
        >>> max(a)
      
      
        
          9
        
      
      
        >>> min(a)
      
      
        
          0
        
      
      
        >>> list(filter(bool, a))
      
      
        [1, 2, 3, 4, 5, 6, 7, 8, 9]
      
      
        >>> set(a)
      
      
        {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
      
      
        >>> dict(zip(a,a))
      
      
        {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}
      
      
        >>> sorted(a, reverse=True)
      
      
        [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
      
      
        >>> str(a)
      
      
        
          '[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]'
        
      
      
        >>> sum(a)
      
      
        
          45
        
      
    


3.Extract Functions or Generators
上述两种方法是很好的处理更简单的逻辑。更复杂的逻辑怎么样?作为程序员,我们编写函数来抽离出复杂的业务。相同的想法适用于此。如果你是这样写的:
      
        results = []
      
      
        for item in item_list:
      
      
            # setups
      
      
            # condition
      
      
            # processing
      
      
            # calculation
      
      
            results.append(result)
      
    

显然,你让一个代码块承担了太多的功能。相反,我建议你做:
      
        
          def process_item(item):
        
      
      
            # setups
      
      
            # condition
      
      
            # processing
      
      
            # calculation
      
      
            return result
      
      
        
          
results = [process_item(item) for item in item_list]

如果换成嵌套函数会如何
      
        results = []
      
      
        for i in range(10):
      
      
            for j in range(i):
      
      
                results.append((i, j))
      
    

换成 List Comprehension 来实现是这样的:
      
        results = [(i, j)
      
      
                   for i in range(10)
      
      
                   for j in range(i)]
      
    

如果你的代码块需要记录一些内部状态
      
        
          # finding the max prior to the current item
        
      
      
        a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
      
      
        results = []
      
      
        current_max = 0
      
      
        for i in a:
      
      
            current_max = max(i, current_max)
      
      
            results.append(current_max)
      
      
        
          
# results = [3, 4, 6, 6, 6, 9, 9, 9, 9, 9]

我们使用 generator 来实现这一点:
      
        def max_generator(numbers):
      
      
            current_max = 0
      
      
            for i in numbers:
      
      
                current_max = max(i, current_max)
      
      
        
                  yield current_max
        
      
      
        
          
a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8] results = list(max_generator(a))

读者可能要问 “等等!你在 generator 中用到 for 循环,作弊啊!别急,再看看下面的代码。
不需要自己写,itertools 已经帮你实现了
这个模块很简单,我相信这个模块在大多数场景中可以替换你原先的 for 循环。
例如,最后一个例子可以重写为:
      
        from itertools import accumulate
      
      
        a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8]
      
      
        resutls = list(accumulate(a, max))
      
    

另外,如果要迭代组合序列,则需要使用product(), permutations(), combinations()。
结论
在大多数情况下,都不需要写 for 循环。
应该尽量避免写 for 循环,这样会有更好的代码可读性。

- EOF -

作者简介


城哥,公众号9年博主,一线互联网工作10年、公司校招和社招技术面试官,主导多个公司级实战项目(Python、数据分析挖掘、算法、AI平台、大模型等)


关注我,陪你一起成长,遇见更好的自己。

星球服务


会不定期发放知识星球优惠券,加入星球前可以添加城哥微信: dkl88191 ,咨询优惠券问题。

加入知识星球,可以享受7大福利与服务:免费获取海量技术资料、向我 1 对 1 技术咨询、求职指导,简历优化、历史文章答疑(源码+数据)、综合&专业技术交流社群、大模型技术分享、定制专属学习路线,帮你快速成长、告别迷茫。



原创不易,技术学习资料如下,星球成员可免费获取,非星球成员,添加城哥微信:dkl88191,请城哥喝杯星巴克。







浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报