10多万人关注的几个Python问题

共 6178字,需浏览 13分钟

 ·

2024-04-15 13:31

本文挑选了StackOverflow上被点赞最多的10个问题,其中总点赞数超过了5万,考虑到很多人只看不点赞,预估至少有10万人对这些问题感兴趣!

这么多人点赞,说明两个问题:

  1. 这些问题很常用,编程的时候经常碰到
  2. 这些问题不简单,否则不用去网上问

10个问题,看看你会几个?

  1. yield 关键词是做什么的?
  2. if name == 'main' 是做什么的 ?
  3. Python 有三元运算符吗?
  4. Python 的 metaclasses 是做什么的?
  5. 如果在不出异常的情况下检查文件是否存在?
  6. 如何一句话合并两个字典?
  7. Python 如何调用外部命令,比如启动QQ?
  8. 如何安全的创建一个多层文件夹?
  9. 循环中如何访问下标?
  10. staticmethod 和 classmethod 的区别?

这10个问题,有的复杂,有的简单。你会几个呢?可以在评论区留言。

我原本打算讲解10个问题,但由于篇幅原因,本文只涵盖了被问最多的一个问题,后续文章可能会涵盖多个问题。

下面我们重点看第一个问题:

yield关键词是做什么的?

这个问题是所有Python问题的排名第一:

  1. 有10000多人对问题点赞,表示有同样疑问。
  2. 其中高赞回答有15000多点赞。
  3. 有超过2百40万的浏览。

问题详细内容?

Yield关键词是做什么的?

比如下面的代码:

def _get_child_candidates(self, distance, min_dist, max_dist):
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild  

这是调用的代码:

result, candidates = [], [self]
while candidates:
    node = candidates.pop()
    distance = node._get_dist(obj)
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))
return result

当_get_child_candidates被调用时,发生了什么?返回了一个list吗?还是一个元素?它会被反复调吗?后续调用什么时候停止?

看着有点懵?可以继续往下看解答,然后再回来看问题。

最高赞回答 (15000多赞)

要理解yield,先理解generators,要理解generators先理解iterable(可迭代的)。

iterables

当你创建1个list,你可以一个个读取它的值,这叫做迭代:

>>> mylist = [123]
>>> for i in mylist:
...    print(i)
1
2
3

上面mylist是一个iterable(可以被迭代的)。当你使用一个列表推导式,你创建了一个列表,也就是一个iterable:

>>> mylist = [x*x for x in range(3)]
>>> for i in mylist:
...    print(i)
0
1
4

所以可以使用for...in...语法遍历的就是iterable:list, str, file等等

这些iterable很有用,你可以循环访问他们。但是它们所有的值都保存在内存中。如果你的list中有10亿个字符串的时候,创建这个list会很慢,而且会很占用内存,所以我们需要genertor.

generators

generator是iterable,可以被循环。但和上面不一样,它一般只能被循环一次。它不会把所有的值保存在内存中,他们在循环中动态产生元素的值。

>>> mygenerator = (x*x for x in range(3))
>>> for i in mygenerator:
...    print(i)
0
1
4

这个生成器和列表推导式几乎一样,唯一区别使用小括号(),而不是中括号[]. 但,你不能两次使用for i in mygenerator,因为生成器只能被循环一次:他们计算0x0,返回结果,自己并不保存,下一次调用它,他计算1x1,以此类推。

yield

yields是一个关键词,可以先理解成和return一样,区别是它返回一个generator.

>>> def createGenerator():
...    mylist = range(3)
...    for i in mylist:
...        yield i*i
...
>>> mygenerator = createGenerator() # create a generator
>>> print(mygenerator) # mygenerator is an object!
<generator object createGenerator at 0xb7555c34>
>>> for i in mygenerator:
...     print(i)
0
1
4

上面这个例子先创建了range,已经占用了内存,但平方数没有占用。这个例子不是很好,这是原作者举的,我的视频中应该有更好的例子。

首先,因为yield的存在,当你调用上面的函数,里面的代码并没有执行,而不是返回了一个generator。

然后是关键的地方:

  • 当for循环第一次调用generator的时候,它会从头开始执行,直到yield关键词,返回第一个值,也就是0。
  • 然后记住执行到哪一行代码,也就是yield的位置。
  • 下次for循环再次调用它,它从yield的下一行继续执行,直到再次碰到yield,返回下一个值,也就是1.
  • 这个过程一直重复,直到generator中没有内容了。例子中就是range里的数字被用完。

现在再看看最开始的问题:

这是一个对树的遍历算法,查找树上符合条件的节点。代码中加了详细的中文注释。

generator:

# 这个函数会返回一个生成器(Generator),这是一个二叉树的node对象中的方法
def _get_child_candidates(self, distance, min_dist, max_dist):

    # 如果还有左孩子,并且距离符合条件,返回左孩子,然后暂停在这里
    if self._leftchild and distance - max_dist < self._median:
        yield self._leftchild

    # 如果还有右孩子,并且距离符合条件,返回右孩子,然后暂停在这里
    if self._rightchild and distance + max_dist >= self._median:
        yield self._rightchild

    # 如果执行到了这里,说明没有符合条件的左右孩子了,生成器空了,就迭代结束了。

caller:

# 创建一个空的列表,和当前对象节点
result, candidates = list(), [self]

# 循环,开始里面只有自己
while candidates:

    # 弹出最后一个节点
    node = candidates.pop()

    # 获得obj对象和目标节点的距离
    distance = node._get_dist(obj)

    # 如果距离ok,写入到结果列表中
    if distance <= max_dist and distance >= min_dist:
        result.extend(node._values)

    # 把自己的子节点加入到candidates中,这样循环会继续,直到树上的所有节点都被遍历
    candidates.extend(node._get_child_candidates(distance, min_dist, max_dist))

return result


作者:麦叔

来源:麦叔编程

Crossin的新书《码上行动:用ChatGPT学会Python编程》已经上市了。本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。【点此查看详细介绍】

购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。
Crossin的其他书籍:



添加微信 crossin123 ,加入编程教室共同学习~

感谢转发点赞的各位~
浏览 143
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
10点赞
评论
收藏
分享

手机扫一扫分享

分享
举报