1 列表生成式和生成器
- from numpy import random
- a = random.random(10000)
- lst = []
- for i in a:
- lst.append(i * i) # 不推荐做法
- lst = [i * i for i in a] # 使用列表生成式
- gen = (i * i for i in a) # 生成器更节省内存
复制代码
2 字典推导式创建子集
- a = {'apple': 5.6, 'orange': 4.7, 'banana': 2.8}
- da = {key: value for key, value in a.items() if value > 4.0}
- print(da) # {'apple': 5.6, 'orange': 4.7}
复制代码
3 Key使用itemgetter多字段排序
from operator import itemgetter
- a = [{'date': '2019-12-15', 'weather': 'cloud'},
- {'date': '2019-12-13', 'weather': 'sunny'},
- {'date': '2019-12-14', 'weather': 'cloud'}]
- a.sort(key=itemgetter('weather', 'date'))
- print(a)
- # [{'date': '2019-12-14', 'weather': 'cloud'}, {'date': '2019-12-15', 'weather': 'cloud'}, {'date': '2019-12-13', 'weather': 'sunny'}]
复制代码
4 Key使用itemgetter分组
- from operator import itemgetter
- from itertools import groupby
- a.sort(key=itemgetter('weather', 'date')) # 必须先排序再分组
- for k, items in groupby(a, key=itemgetter('weather')):
- print(k)
- for i in items:
- print(i)
复制代码
5 sum类聚合函数与生成器Python中的聚合类函数sum,min,max第一个参数是iterable类型,一般使用方法如下:
- a = [4,2,5,1]
- sum([i+1for i in a]) # 16
复制代码
使用列表生成式[i+1 for i in a]创建一个长度与a一样的临时列表,这步完成后,再做sum聚合。
试想如果你的数组a长度是百万级,再创建一个这样的临时列表就很不划算,最好是一边算一边聚合,稍改动为如下:
- a = [4,2,5,1]
- sum(i+1for i in a) # 16
复制代码
此时i+1 for i in a是(i+1 for i in a)的简写,得到一个生成器(generator)对象,如下所示:
- In [8]:(i+1for i in a)
- OUT [8]: at 0x000002AC7FFA8CF0>
复制代码
生成器每迭代一步吐出(yield)一个元素并计算和聚合后,进入下一次迭代,直到终点。
6 ChainMap逻辑上合并多个字典
- dic1 = {'x': 1, 'y': 2 }
- dic2 = {'y': 3, 'z': 4 }
- merged = {**dic1, **dic2} # {'x': 1, 'y': 3, 'z': 4}
复制代码
修改merged['x']=10,dic1中的x值不变
ChainMap 只在逻辑上合并,在内部创建了一个容纳这些字典的列表。
- from collections import ChainMap
- merged = ChainMap(dic1,dic2)
- print(merged)
- # ChainMap({'x': 1, 'y': 2}, {'y': 3, 'z': 4})
复制代码
使用ChainMap合并字典,修改merged['x']=10,dic1中的x值改变
|