前言

你熟悉 / target=_blank class=infotextkey>Python 中的 yield 关键字吗?
你知道列表推导式与生成器推导式的区别吗?
它们有什么使用场景?
假设有以下文本文件:
- 我们需要找到那些"目标" 开头的行
你会怎么做?
一次把所有行读取下来,然后遍历过滤?
如果文件有100万行呢?
同时输出多个内容
如果我们把文件看作是一个仓库,里面每一行是货物。
你是零售商,此时有消费者找你买东西(那些"目标"开头的货物)
你有两种方式。
方式1:
- 行5:你从仓库中把所有的货物搬到自己家里
- 行7-11:然后一份份过滤,找到那两件货物
辛不辛苦不知道,但是占空间是肯定,应该没有谁会这么干吧
方式2:
- 行4-10:你本人走到仓库里,逐一判断扣下符合条件的货物
此时解决了占家里空间的问题,但是你需要亲自跑到仓库做事情(代码表现是你的判断逻辑全混合到读取文件逻辑中)
有没有改进空间?
逻辑转移
关键问题是:
- 红色框是取货逻辑,能不能移出来?
很简单:
- 行8:遍历过程中,都会调用一次 行15 我们提供的判断逻辑
但是,这方式代码实在不直观,特别对比方式1:
- 读取文件逻辑和取数判断逻辑完全分开
如果可以这样子就完美了:
- 注意,不能把所有的获取一次性加载进来
数据生成器
其实,在上一种方式上简单修改即可:
- 重点:不需要定义列表
- 行6:直接返回货物,但是不用 return ,而是用 yield
此时,如果我们简单调用这个函数,会得到什么?
- 这啥玩意
此时,这个函数叫做生成器(generator)。
注意,此时他根本不会加载数据,也就是说,这个函数里面的代码根本没有执行
它就像仓库管理员,现在你不需要亲自走进仓库里面:
- 行3:这里做了2件事情,1是你打电话通知仓库管理员准备。2是开始向他逐一拿出货物
- 行4:你逐一筛选货物
这里重点是叫他准备一次,他只能遍历一次:
- 行1:做准备
- 行5:使用了之前的准备
- 行11:无法再用,此时 encore 啥也没有
优点:
- 省了空间,整个过程中没有一次性把所有数据加载进来
- 加载数据与处理数据的逻辑代码独立开来
- 代码实际上比"逻辑转移"的方式要多了一些,但是现在我们是用遍历代码表达,语义更加直观清晰
需求升级一下:
在之前需求基础下,把目标数值大于95的货物取出来
想象一下,目标数量可能是200万,上面的代码行1变量 res 是一个列表,但数值大于95的可能只有几行。
我们好像又遇到了之前的空间问题
生成器推导式
上一种方式得到的是列表,是因为我们使用了列表推导式,我们只需要简单把最外层的方括号改为括号,推导式就会变成生成器:
- 行1 与 行5:使用括号,这是生成器推导式,并不会真正加载数据。所以不管数据有多少,这一句代码都会瞬间执行完毕
你学会了没有?
记得点赞,转发!谢谢支持!
胜象大百科









