怎么用最短时间高效而踏实地学习 Python?

论坛 期权论坛 期权     
匿名用户   2018-9-20 02:08   1218618   7
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

7 个回复

倒序浏览
2#
挖数  4级常客 | 2018-9-20 02:08:16 发帖IP地址来自
题主用了三个形容词,“短时间,高效,踏实”,事实上想学好一门语言或者是其他任何的技能,都不可能短时间内学成,除非可以像电视剧那样把手放在背后传功,或者拿到屠龙刀里的九阴真经,让你一下子变成超级赛亚人3,毁灭地球。
其实,我比较喜欢跟题主探讨一下怎么 “开心,高效,踏实” 地把Python学好,在我看来,只有一样东西可以帮你做到,那就是,兴趣-兴趣-兴趣!重要的事情说三遍!在Python这个魔法世界里,找到你自己感兴趣的点进行切入,并时刻找到兴趣点进行自我驱动是最好的学习方式!

以下,用我自己亲身经历的方式,说说我的Python入门学习之路(多图预警!)

看过的Python的书不多,也没上过coursera,但这里呕血推荐两本书,一本作为数据分析的切入,一本作为Python的语法学习。


show一下我的爬虫成果,这是我用爬下的电影数据做的网页,柱状图显示的是2004-2016年中国电影年度票房冠军的票房,下面的表格显示的是近两万部中国电影的数据。


最后,如果觉得写的还OK,请点赞哦 \( ^▽^ )/
3#
SimonS  4级常客 | 2018-9-20 02:08:17 发帖IP地址来自
建议读两本书:

1、集体智慧编程 (豆瓣)
因为Python是一门不需要花太多精力(甚至可以说很少),就可以基本掌握的一门语言,所以推荐这本书。题主提到以后想学机器学习,这是一本非常好的入门书,书中的例子源码都是Python实现的,并且能帮你迅速熟悉Python相关的各种计算库。

2、统计学习方法 (豆瓣)
考虑到题主要学得踏实,这本书深入浅出地讲了和机器学习有关的一切数学基础知识,一整本的干货,没有废话,非常值得一读。题主数学专业的话,读起来应该会比我更顺畅。

前景非常好,这两本书让我的年薪提升了不少,而且不会是死搬砖的工作。
4#
mahalanobis  2级吧友 | 2018-9-20 02:08:18 发帖IP地址来自
没想到这么多知友点赞哈,感谢。更新一波,答主目前在O2O行业从事算法工作。


更新于2017.09.27。

以下原文。
------------------------------------------
先说一下背景,统计系出身,自学python两年,目前在魔都一家互联网创业公司从事数据挖掘工作。平时工作中重度使用的库包括但不限于:
有人已经提到了安装Download Anaconda now!,很给力。


再说下我用python做些什么。用一个例子来说明。
数据抓取+清洗
这是我从网站上抓取的,英格兰足球超级联赛1992年~2015年,每一场比赛的进球记录,代码在GitHub - niudd/goal_times,我知道没人会看我代码的,感兴趣可以看看我import哪些库,数据按年份保存在csv里了。这里我用到了RequestsBeautiful Soup抓HTML数据,pandas数据框结构保存一场场比赛记录。
import pandas as pddf1 = pd.read_csv('2013-2014.csv')df2 = pd.read_csv('2014-2015.csv')df3 = pd.read_csv('2015-2016.csv')df = pd.concat([df1, df2, df3], ignore_index=True)df.reset_index(drop=True, inplace=True)
这样就把过去三个赛季的比赛读取进来,合并成一个dataframe。
数据可视化、初步分析
pandas数据框有丰富的功能,比如Group By: split-apply-combine,比如想知道英超场均进球数。
df.groupby('year').get_group('2013-2014')['goals'].mean()
更便捷的可以:
df.groupby('year').mean()
此外,做图我用Seaborn: statistical data visualization,有了它我就不用R做图了。
这是阿森纳在90分钟内每一分钟进球的频率。大家都觉得足球比赛90分钟绝杀很少见,可是数据告诉我们补时阶段的进球率是常规时间的8~9倍。



数据挖掘?
这部分我主要做统计建模,我曾利用pandas+scipy.optimize写过一个极大似然估计算法,计算每只球队的进攻、防守参数。然后预测博彩公司开出的赔率。


最后说下,这些库我怎么学习的。
看官方文档,读别人写的项目,自己写项目。遇到技术上的问题就去问googleStack Overflow

机器学习的理论,我是看统计学习方法 (豆瓣)Coursera Andrew Ng,因为有统计学基础,这部分大约只花了三个月。随后我找到Python的sklearn库学习编写机器学习代码。推荐看这位Jake Vanderplas的github,作为sklearn贡献者之一,近几年在Pycon上做了对sklearn的介绍。有条件的可以看下面的youtube,看不了请直接看他的github上几个Pycon的notebook。当然看sklearn官方文档也非常棒。
youtube.com/watch?


Python入门我是靠这些:
Python | Codecademy
Udacity build a search engine
Dive Into Python
然后随大流写了一阵子爬虫熟悉Python。


有问题了再补充吧。
5#
科赛网Kesci  2级吧友 | 2018-9-20 02:08:20 发帖IP地址来自

Python是种高级动态编程语言,1991年,由Guido van Rossum创建发行。应用范围从Web开发到数据科学再到DevOps。

它注重简洁、易读性高、可拓展性强,尤其在数据科学领域,可以很好的支撑商业分析(探索性分析、数据可视化)、机器学习(数据清洗、算法建模)、深度学习(神经框架搭建)等场景。因此大部分的数据工作者愿意选用Python开展工作,数据分析新手也会考虑通过Python入门数据分析。


科赛kesci.com目前聚集了数万名数据人才,通过与他们的密切交流,我们发现:虽然Python本身对零基础数据分析新手非常友好,但他们中的大部分也曾面临过「数据分析从入门到放弃」的世纪难题。

分析背后的原因,归纳起来主要是:

  1. 亲手搭建本地编程环境的繁琐工程量、过程中冒出的各种安装Bug,非常容易让初学者丧失学习兴趣(特别是非计算机相关专业出身的朋友);
  2. 面对网络公开分享的大量数据分析相关知识、学习教程,不知该如何甄别、筛选;
  3. 好不容易啃完教程、学会编程,发现当面对真实商业数据分析问题时,脑袋一片空白,无从下手。


但其实,我们都有机会让数据知识的学习、数据分析工具与人的交互体验变得更好一点。


Part1:零基础新手的必备基础知识

Python在人工智能、机器学习领域受到火热追捧,很大程度上在于它拥有非常庞大的第三方库,以及强大的通用编程性能。因此,快速掌握Python进行数据分析,就是学习Python各种第三方库、工具包的过程。

对于新手,能掌握好:Python关键代码以及Pandas、Numpy、Matplotlib、Seaborn这四个基本工具包,便能独立完成一些简单的数据分析工作了。

说明:机器学习的Scikit-Learn相关学习材料我们正在搬运中,敬请期待!


Week1

学习内容:Pandas

说明:是个能快速简单实现数据操作、整合及可视化的工具库

  1. 科赛 x 机器之心 从零上手Python关键代码
  2. Pandas基础命令速查表
  3. 这十套练习,教你如何使用Pandas做数据分析

Week2

学习内容:Numpy

说明:是做科学计算最基础的库。针对n维向量及Numpy类型数组,提供了多种便于提升运算速度的功能

  1. Numpy快速上手指南-- 基础篇
  2. Numpy快速上手指南--- 进阶篇
  3. 这100道练习,带你玩转Numpy

Week3

学习内容:Matplotlib

说明:Matplotlib的设计理念是能够用轻松简单的方式生成强大的可视化效果,然而它是一个低端库,相比于其他高端的库,需要去写更多的代码来实现可视化效果。

  1. 从零开始学Python【1】--matplotlib(条形图)
  2. 从零开始学Python【2】--matplotlib(饼图)
  3. 从零开始学Python【3】--matplotlib(箱线图)

Week4

学习内容:Seaborn

说明:关注于统计模型的可视化,可以提供热力图等多种效果去描绘数据的整体分布情况。

  1. seaborn可视化学习之 categorial visualization
  2. seaborn可视化之timeseries & regression & heatmap
  3. seaborn可视化学习之distribution visualization


如何学习

  1. 就以上单个学习内容,可以在科赛完成登录后,直接点击「Fork」键即可将该项目内容收至个人K-Lab工作专区,点击「运行」键即可在K-Lab的交互式编程界面,体验「边敲代码边运行边掌握知识」的实践化学习场景。
  2. 我们在官网「项目」栏目里创建了「DATA TRAIN|数据分析学习计划」,后面会持续更新。


Part2:选择体验良好的数据分析编程环境

我们都知道「工欲善其事,必先利其器」的重要性。这里必须隆重安利下:K-Lab在线数据分析协作平台

零数据工程问题

K-Lab是款在线数据分析协作平台,用户在完成登录后均能拥有个人独享的K-Lab工作专区,免费享受2核8G的高性能云计算资源。 同时已经为你集成了Python3、Python2、R三种主流编程语言环境(随你挑选语言),同步内置100+常用数据分析工具包,可以直接调用。意味着你完成登录后,可以直接在云端学习编程语言,开展数据分析

交互式编程设计
  1. 数据分析领域内,传统的集成开发环境(IDE)正被取代。Jupyter、JupyterLab和RStudio便是这一趋势的杰出例子。
  2. 计算型叙述正被广泛地创造出来。实时运行的代码、叙事性的文本和可视化将被整合在一起,方便数据工作者使用代码和数据来讲述故事。

K-Lab是提供基于Jupyter Notebook的在线数据分析服务,延续采用交互式编程的设计方法,让数据分析整个过程与结果统一。

Part3:用真实商业数据应用项目检验能力

学习Python的最终目的,是为了掌握数据分析技能,拥有解决实际工作或日常生活中与数据分析相关问题的能力

对于高等院校在校生以及期望转型为数据工作者的人群,行业内真实的生产级数据资源是难以获取的,企业内部数据化创新应用解决方案的学习案例是稀缺的


因此,我们同步在科赛官网开放「金融行业数据算法训练营」,选用往期「前海征信“好信杯”大数据算法大赛」为案例,拆解出学习教程,为数据分析进阶爱好者提供真实行业数据实战检验。

看到这里,或许大家会想我并不懂金融咋办呢?其实我们已经考虑到了,该案例的优点就在于:

  • 数据资源非常丰富且开放使用。作为平安旗下专业第三方商业征信机构,提供了4万条信用贷款业务、4千条现金贷业务数据。
  • 业务复杂度低,应用场景具有普适性。通过“信用贷款”业务,建立“现金贷”业务的信用评分模型”。非常容易理解,对金融业务理解要求低。

同时,我们配备作品在线提交及测评系统,将根据事先设定的「测评标准」进行排名并实时更新。方便你对自我数据分析能力进行合理评估,并持续优化、提升。


万事始行难,期待你的坚持与蜕变!

6#
阿里云云栖社区  6级职业 | 2018-9-20 02:08:21 发帖IP地址来自

给亲推荐套免费的学习资料!帮大家零基础学Python!

阿里云大学特邀鱼C工作室为大家分享的一套Python学习内部资料!

感兴趣的话可以学习下!

学习地址:click.aliyun.com/m/1000

课程介绍:

本系列教程面向零基础的同学,是一个深入浅出,通俗易懂的Python3视频教程。

前半部分主要讲解Python3的语法特性,后半部分着重讲解Python3在爬虫、Tkinter、Pygame游戏开发等实例上的应用。整个系列共16个章节,前边13个章节从一个小游戏引入Python,逐步介绍Python的语法以及语言特色。最后3个章节为案例的演示,是前边内容的总结和提高。

课程目标:

  • Python入门
  • Python实践
  • Python开发
  • Python爬虫
  • Python游戏开发
  • Python全栈开发

更多技术干货敬请关注云栖社区知乎机构号:阿里云云栖社区 - 知乎

7#
匿名用户   | 2018-9-20 02:08:22 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
8#
燕大吓  2级吧友 | 2018-9-20 02:08:24 发帖IP地址来自

最佳答案

不管学习什么新的东西,效率最低但是又不可或缺的环节就是看教科书了。虽然看书的过程可能会很无聊,但是过一遍书至少能对整个知识框架有个大体的把握。我最早知道 Python 还是在《黑客与画家》这本书中看到的,书里面有一章节是讲编程语言的,作者很推荐把 python 作为学习编程的入门语言。我当时是把《简明 Python 教程》给过了一边,后来又看了一遍《深入python》,这里特别推荐《深入 Python》,除了介绍 python 的基本特性之外,还介绍了诸如函数编程、正则表达式、处理 HTML 和 XML等高级用法。除了看书,上公开课也是挺不错的,视频教学本来就比自己啃教科书有意思,而且完成课程作业也能锻炼动手编程能力。我上过两门不错的公开课,一门是莱斯大学在 Coursera 上开的《Python交互式编程导论》,一边学 python,一边写些小游戏,肯定不会觉得无聊;另一门就是 MIT 在 edX 上开的《计算机科学及python编程导论》,它是 MIT edX系列课程(XSeries)中的第一课,系列课程共两门,除了这门课以外还有《计算思维及数据科学导论》,不过第二门就没有上过了。《简明 Python 教程》《深入 Python》《Python交互式编程导论》《计算机科学及python编程导论》

最后:我有建立一个python学习交流群,在群里大家相互帮助,相互关心。相互分享知识,多一个人多一个想法,只有人多的时候遇到问题才会有更多的人帮你解决问题,如果你也是愿意分享,不是单纯的伸手党我欢迎你来群里,先在搜索框里面加483在加上546 最后是416 这样你就可以找到组织大家一起来分享

快速学习python交流总群:619307290 >483546416

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:24326
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP