Python 高效编程技巧

论坛 期权论坛 期权     
进击的Coder   2019-7-14 05:30   3169   0
Python 提供了几个高级内置函数,另外还有几个比较实用的库,比如 collections,这里推荐一篇文章,介绍几个小的 Tips,如果大家用上的话可以稍微提高一些开发效率,希望对大家有帮助哈。
转载来源
公众号:Python 编程与实战
“ 阅读本文大概需要 5 分钟。


”工作中经常要处理各种各样的数据,遇到项目赶进度的时候自己写函数容易浪费时间。
Python 中有很多内置函数帮你提高工作效率!
[h2]一. 根据条件在序列中筛选数据[/h2][h3]1. 假设有一个数字列表 data, 过滤列表中的负数[/h3]使用列表推导式:
  1. result = [i for i in data if i >= 0]
复制代码
使用 fliter 过滤函数:
  1. result = fliter(lambda x: x>= 0, data)
复制代码
[h3]2. 学生的数学分数以字典形式存储,筛选其中分数大于 80 分的同学[/h3]
  1. d = {x:randint(50, 100) for x in range(1, 21)}
复制代码
  1. {k: v for k, v in d.items() if v > 80}
复制代码
[h2]二. 对字典的键值对进行翻转[/h2]使用 zip() 函数
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
  1. >>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
  2. >>> s1
  3. {'b': 1, 'f': 4, 'g': 3, 'r': 1}
  4. >>> d = {k:v for k, v in zip(s1.values(), s1.keys())}
  5. >>> d
  6. {1: 'r', 4: 'f', 3: 'g'}
复制代码
[h2]三. 统计序列中元素出现的频度[/h2][h3]1. 某随机序列中,找到出现次数最高的3个元素,它们出现的次数是多少?[/h3]构造随机序列如下:
  1. data = [randint(0,20) for _ in range(20)]
复制代码
方法1: 可以使用字典来统计,以列表中的数据为键,以出现的次数为值
  1. from random import randint
  2. def demo():
  3.     data = [randint(0, 20) for _ in range(30)]
  4.     # 列表中出现数字出现的次数
  5.     d = dict.fromkeys(data, 0)
  6.     for v in li:
  7.         d[v] += 1
  8.     return d
复制代码
方法2:直接使用 collections 模块下面的 Counter 对象
  1. >>> data = [randint(0, 20) for _ in range(30)]
  2. >>> data
  3. [7, 8, 5, 16, 10, 16, 8, 17, 11, 18, 11, 17, 15, 7, 2, 19, 5, 16, 17, 17, 12, 19, 9, 10, 0, 20, 11, 2, 11, 10]
  4. >>> c2 = Counter(data)
  5. >>> c2
  6. Counter({17: 4, 11: 4, 16: 3, 10: 3, 7: 2, 8: 2, 5: 2, 2: 2, 19: 2, 18: 1, 15: 1, 12: 1, 9: 1, 0: 1, 20: 1})
  7. >>> c2[14]
  8. 4
  9. >>> c2.most_common(3)  # 统计频度出现最高的3个数
  10. [(17, 4), (11, 4), (16, 3)]
复制代码
[h3]2.  对某英文文章单词进行统计,找到出现次数最高的单词以及出现的次数[/h3]通过上面的练习,我们知道可以用 Counter 来解决
  1. import re
  2. from collections import Counter
  3. # 统计某个文章中英文单词的词频
  4. with open('test.txt', 'r', encoding='utf-8')as f:
  5.     d = f.read()
  6. total = re.split('\W+', d)  # 所有的单词列表
  7. result = Counter(total)
  8. print(result.most_common(10))
复制代码
[h2]四.根据字典中值的大小,对字典中的项进行排序[/h2]比如班级中学生的数学成绩以字典的形式存储:
  1. {"Lnad": 88, "Jim", 71...}
复制代码
请按数学成绩从高到底进行排序!
方法1: 利用 zip 将字典转化为元组,再用 sorted 进行排序
  1. >>> data = {x: randint(60, 100) for x in "xyzfafs"}
  2. >>> data
  3. {'x': 73, 'y': 69, 'z': 76, 'f': 61, 'a': 64, 's': 100}
  4. >>> sorted(data)
  5. ['a', 'f', 's', 'x', 'y', 'z']
  6. >>> data = sorted(zip(data.values(), data.keys()))
  7. >>> data
  8. [(61, 'f'), (64, 'a'), (69, 'y'), (73, 'x'), (76, 'z'), (100, 's')]
复制代码
方法2: 利用 sorted 函数的 key 参数
  1. >>> data.items()
  2. >>> dict_items([('x', 64), ('y', 74), ('z', 66), ('f', 62), ('a', 80), ('s', 72)])
  3. >>> sorted(data.items(), key=lambda x: x[1])
  4. [('f', 62), ('x', 64), ('z', 66), ('s', 72), ('y', 74), ('a', 80)]
复制代码
[h2]五. 在多个字典中找到公共键[/h2]实际场景:在足球联赛中,统计每轮比赛都有进球的球员
第一轮: {"C罗": 1, "苏亚雷斯":2, "托雷斯": 1..}
第二轮: {"内马尔": 1, "梅西":2, "姆巴佩": 3..}
第三轮: {"姆巴佩": 2, "C罗":2, "内马尔": 1..}
模拟随机的进球球员和进球数
  1. >>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
  2. >>> s1
  3. {'d': 3, 'g': 2}
  4. >>> s2 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
  5. >>> s2
  6. {'b': 4, 'g': 1, 'f': 1, 'r': 4, 'd': 3}
  7. >>> s3 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
  8. >>> s3
  9. {'b': 4, 'r': 4, 'a': 2, 'g': 3, 'c': 4}
复制代码
首先获取字典的 keys,然后取每轮比赛 key 的交集。由于比赛轮次数是不定的,所以使用 map 来批量操作
  1. map(dict.keys, [s1, s2, s3])
复制代码
然后一直累积取其交集,使用 reduce 函数
  1. reduce(lambda x,y: x & y, map(dict.keys, [s1, s2, s3]))
复制代码
一行代码搞定!
推荐阅读

1
跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!
2
跟繁琐的模型说拜拜!深度学习脚手架 ModelZoo 来袭!

3
只会用Selenium爬网页?Appium爬App了解一下
4

妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池
崔庆才
静觅博客博主,《Python3网络爬虫开发实战》作者
隐形字
个人公众号:进击的Coder


长按识别二维码关注

好文和朋友一起看~
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:15
帖子:3
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP