前言

Python重要知识,生成器的威力

你熟悉 / target=_blank class=infotextkey>Python 中的 yield 关键字吗?

你知道列表推导式与生成器推导式的区别吗?

它们有什么使用场景?

假设有以下文本文件:

 

  • 我们需要找到那些"目标" 开头的行

你会怎么做?

一次把所有行读取下来,然后遍历过滤?

如果文件有100万行呢?


同时输出多个内容

如果我们把文件看作是一个仓库,里面每一行是货物。

你是零售商,此时有消费者找你买东西(那些"目标"开头的货物)

你有两种方式。

方式1:

 

  • 行5:你从仓库中把所有的货物搬到自己家里
  • 行7-11:然后一份份过滤,找到那两件货物

辛不辛苦不知道,但是占空间是肯定,应该没有谁会这么干吧

方式2:

 

  • 行4-10:你本人走到仓库里,逐一判断扣下符合条件的货物

此时解决了占家里空间的问题,但是你需要亲自跑到仓库做事情(代码表现是你的判断逻辑全混合到读取文件逻辑中)

有没有改进空间?


逻辑转移

关键问题是:

 

  • 红色框是取货逻辑,能不能移出来?

很简单:

 

  • 行8:遍历过程中,都会调用一次 行15 我们提供的判断逻辑

但是,这方式代码实在不直观,特别对比方式1:

 

  • 读取文件逻辑和取数判断逻辑完全分开

如果可以这样子就完美了:

 

  • 注意,不能把所有的获取一次性加载进来

数据生成器

其实,在上一种方式上简单修改即可:

 

  • 重点:不需要定义列表
  • 行6:直接返回货物,但是不用 return ,而是用 yield

此时,如果我们简单调用这个函数,会得到什么?

 

  • 这啥玩意

此时,这个函数叫做生成器(generator)。

注意,此时他根本不会加载数据,也就是说,这个函数里面的代码根本没有执行

它就像仓库管理员,现在你不需要亲自走进仓库里面:

 

  • 行3:这里做了2件事情,1是你打电话通知仓库管理员准备。2是开始向他逐一拿出货物
  • 行4:你逐一筛选货物

这里重点是叫他准备一次,他只能遍历一次:

 

  • 行1:做准备
  • 行5:使用了之前的准备
  • 行11:无法再用,此时 encore 啥也没有

优点:

  1. 省了空间,整个过程中没有一次性把所有数据加载进来
  2. 加载数据与处理数据的逻辑代码独立开来
  3. 代码实际上比"逻辑转移"的方式要多了一些,但是现在我们是用遍历代码表达,语义更加直观清晰

需求升级一下:

在之前需求基础下,把目标数值大于95的货物取出来

想象一下,目标数量可能是200万,上面的代码行1变量 res 是一个列表,但数值大于95的可能只有几行。

我们好像又遇到了之前的空间问题


生成器推导式

上一种方式得到的是列表,是因为我们使用了列表推导式,我们只需要简单把最外层的方括号改为括号,推导式就会变成生成器:

 

  • 行1 与 行5:使用括号,这是生成器推导式,并不会真正加载数据。所以不管数据有多少,这一句代码都会瞬间执行完毕

 


你学会了没有?

记得点赞,转发!谢谢支持!

胜象大百科