自学数据分析需要看哪些书(从初级到高级)的?

论坛 期权论坛 期权     
陈晓   2018-9-24 01:04   105973   8
分享到 :
0 人收藏

8 个回复

倒序浏览
2#
张溪梦 Simon  4级常客 | 2018-9-24 01:04:14 发帖IP地址来自
从入门到精通:互联网数据分析的书籍清单!

任何一个技能的学习,都有从浅到深的过程,数据分析也不例外。因此我把推荐书籍划分成几个段位,更便于大家挑选。

在列书单之前,先介绍一本:我们一直在做互联网行业数据分析知识的普及,目前我们已经做了 15 期「GrowingIO 数据分析公开课」,面向产品经理、运营等等,这里是我们整理出来的「互联网增长的第一本数据分析手册」:



这是一本神奇的书。
产品经理用它来分析数据、拆解指标,实现流程的良性运转;
市场运营用它来解析数据、确定方法,实现运营效果最大化。
30%注册率的提升,90%的客户留存,硅谷数据之神手把手教你实践增长黑客。
翔实的分析方法,真实案例与心得,GrowingIO 团队的创业实战分享都在这里了!

严格意义上这不算是一本书,但是能够手把手教你如何做数据分析。

获取完整书籍下载,点击 互联网增长的第一本数据分析手册


下面是数据分析从入门到精通书籍推荐:


Part 1 | 入门版

适合对数据分析的入门者,对数据分析没有整体概念的人,常见于应届毕业生,经验尚浅的转行者。

深入浅出数据分析 (豆瓣):HeadFirst 类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。

谁说菜鸟不会数据分析 (豆瓣):不仅讲解了一些常见的分析技巧,并附带 Excel 的一些知识以及数据分析在公司中所处的位置,对职场了解亦有一定帮助。

赤裸裸的统计学 (豆瓣):作者年轻时是个追求学习意义的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。

同样类似的书籍还有「统计数字会撒谎 (豆瓣)」,这本书知名度要高点,不过我还没看…


Part 2 | 进阶版

具有一定的行业针对性,要求具备一定的分析常识,适合网站分析师,商业分析师以及数据产品经理。

精通 Web Analytics 2.0 (豆瓣):此书虽老,但其中很多思想和流量分析的案例仍然很有借鉴意义,现在纸质书只能上淘宝买旧书了。

与此类似的有「网站分析实战 (豆瓣)」,是国内一本讲网站分析的书,没有上面经典,但胜在新出,很多案例和理念都有及时的更新。

深入浅出统计学 (豆瓣):Headfirst 类书籍,可以帮助你快速了解统计方面的知识。

数据化管理:洞悉零售及电子商务运营 (豆瓣):黄成明著,讲解在企业中应用数据的例子,读完受益匪浅,里面举的很多例子都很接地气。虽说偏向于零售业管理,但大道归一,可适用于很多行业,当时依据里面的理念规划了美团外卖面向 BD 的数据产品。

MySQL 必知必会 (豆瓣):这本也是我当年学习 SQL 的入门书,薄册子一本,看起来很快。SQL 是个性价比很高的技能,简单而强大。任何想进一步提高自己数据分析技能的产品/运营/分析师 同学,都建议点亮 这个技能点。

互联网增长的第一本数据分析手册:我司 GrowingIO 出的一本数据分析的增长手册(封面和目录见下图),为大家提供常见的分析手段讲解,如漏斗分析,同期群分析等等。可点击书籍名字在 GrowingIO 技术论坛中免费下载。


Part 3 | 高阶版

更高阶的数据相对来说专业性较强了,如涉及到企业内部数据治理,数据结合的业务分析,数据可视化等。当然,还有数据挖掘算法之类的更深入的东西,这块没有研究就不瞎推荐了。

决战大数据 (豆瓣):阿里巴巴前数据副总裁车品觉老师所著,讲解了阿里巴巴在企业内部治理数据过程中的心得,所讲“存-通-用”数据管理三板斧和“从数据化运营到运营数据”,字字珠玑,可堪借鉴。

精益数据分析 (豆瓣):此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。

The Wall Street Journal Guide to Information Graphics (豆瓣),华尔街日报负责商业分析的人做的可视化指南,精华且实用,我之前在公众号上写过读书笔记「华尔街日报是这样做数据可视化的(1)」,可供大家参考。

《数据仓库经典教程》:网上有人整理出来的资料,优点是简单明了,不像正常的数据仓库教材厚厚一本。


Part 4 | 推荐关注

在知乎上有不少数据分析及 Growth 的大牛,在这里推荐几位我熟悉的,经常会写一些相关的文章:

覃超,前 Facebook 早期工程师,关于增长黑客写了许多优秀的文章;

邹昕,Facebook 用户增长数据分析,在数据分析方面很有见解;

范冰,「增长黑客」一书作者,人非常有趣,同时也非常推荐「增长黑客」这本书;

曾加,蚂蚁金服 BI-数据分析,数学方面的牛人;

何明科,专注于数据和互联网产品,许多回答很值得细看。



本文作者陈新涛,GrowingIO - 硅谷新一代数据分析产品 产品经理。
3#
Lincoln  2级吧友 | 2018-9-24 01:04:15 发帖IP地址来自
热诚推荐看过的几本经典。

一、数据分析入门:
电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。
推荐理由同上,适合入门者的经典教材。
R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。
作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。
作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。

入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。


先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。


二、数据分析进阶:
作者Cathy O’Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。

Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。

很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。

2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。

作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。



OK,这几本够看一阵了,有时间再更新。

欢迎关注我存储知识的地方:预见未来——Han Hsiao的知乎专栏Foresee
4#
Leven  2级吧友 | 2018-9-24 01:04:16 发帖IP地址来自

整体来讲,数据分析的学习可以分为三大块内容:


1.分析工具(技能)

初级的:EXCEL,SPSS等

深入的:SAS,R,MATLAB(公司少用),python(偏开发)等任选一种即可

分析工具的学习,可以买本经典的教材,如《EXCEL入门大全》、spss(某度下张文彤)、《R in action》也不错,主要是多实践案例。

另外,简单取数能力还是要具备的,熟练SQL,网站看看SQL基本语法就行,主要熟悉数据库和表。

工具是一个基本的前提,扎实的应用能达到快速解决问题的效果。


2.商业知识(业务)

这个是你想从事行业的商业知识(包括基础理论知识、工作中学习的业务知识),例如想进入金融行业,那么你一定要对金融的基础知识较为熟悉,对基本的经济学知识熟悉。大学教材,外国经典著作都可以看看。

业务决定数据分析的深度,这个是灰常重要的,越深入数据分析这行,越会发现其重要性。


3.思维方式(逻辑)

没有一个好的逻辑,想必做事一定做不明白,特别是在沟通过程中,浪费的时间很多,思考的方式、表达的方式、呈现的方式都跟你的逻辑有关,《金字塔原理》是一本不错的书,也可以百度一下麦肯锡的相关书籍

良好的思维逻辑:想清楚,说明白,做对事


整体而言,数据分析工作对综合能力要求是较高的,想做好这份工作不是一时半会的事,需要耐心,多思考,多实践,多总结。

5#
网易云  5级知名 | 2018-9-24 01:04:19 发帖IP地址来自

学习数据分析的目的来看,从浅入深、从理论到实践,分为几个阶段:

1:理论阶段:数理知识和思维逻辑,此处是是否深入理论研究的入口;

2:场景应用阶段:了解数据分析应用场景,此处是是否能够将知识转换为价值的入口;

3:实操工具层面:学习和熟悉各类数据分析工具,此处是能够将价值变现的入口。


对于前两个部分的内容,前面的一些回答者回答的有一些书我已经看过了,非常值得推荐的,还有一些英文的书我还没看过,准备也看一下,比如:@张溪梦 Simon @ Lincoln等人的回答,很有可取之处,大家可以参照,但是在回答里面并没有看到有对数据分析工具进行介绍的回答,那我就第三个问题进行一下补充。

对于实操工具层面,这个没有初高级的书可以参照,就是一个产品使用的时间和了解的程度,简单的产品能够快速上手,学习速度快,复杂的产品学习速度肯定会下降。数据分析不是简单的将数据进行分析就直接得出结论的一种方式,其中还包含对分析结果的展示,展示部分可以在数据分析工具中直接进行,但是目前来看,数据分析类工具对于数据分析的能力比较强,诸如建模、预测分析等等,但是在数据可视化上却没有很支持,在R中有一些包可以实现使用简单的语句就进行数据分析结果的可视化,但是依然很复杂,在python中,同样的pandas等中都有画图的包,但是也是相对比较复杂,参数设置也相当麻烦,所以这里为大家推荐一个数据分析结果可视化的SaaS平台-网易有数。


其优点有以下几点:

1:数据源导入简单方便,支持几乎所有的数据源,可以设置抽取、缓存等等。

2:拖拽式数据可视化,傻瓜式操作,不需要经过专业的学习和培训,业务人员也可以直接使用。

3:可以提供多人协同作业,可以进行分享、驾驶舱等多项分享功能,有公共文件夹可以进行报表一起改。

4:提供中国式的报告方式,让报告更加接地气。

附图几张网易有数的报告案例:






如果想要了解更详细的信息可进入网易有数官网,点击可免费试用

6#
猫咪爱吃冰  1级新秀 | 2018-9-24 01:04:20 发帖IP地址来自
岗回答了一个类似的了,再回答一遍吧~~
《精益数据分析》强烈推荐之~~
这主要是针对创业者还有一些企业投资人的一本书,里面的内容很专业,同时作者用一切企业家真实生动的案例,加上专业的数据分析的方法相结合,步步深入,可以说通俗易懂,科学小白和数据盲都可以看的明白,我看的时候感觉收获还蛮多。
就是这个精益数据分析-【加】阿利斯泰尔·克罗尔;本杰明·尤科维奇
7#
hui sun  2级吧友 | 2018-9-24 01:04:21 发帖IP地址来自
准备好你的决心和智商。 如果只是想挣点钱,可以先看看其他的。
如果你坚持下来了,你会发现钱只是附带收获。
8#
刘卫乐  4级常客 | 2018-9-24 01:04:22 发帖IP地址来自

要学会讲故事,学会吹牛和看书一样重要!

9#
数据分析电子书  2级吧友 | 2018-9-24 01:04:23 发帖IP地址来自

第1本《谁说菜鸟不会数据分析入门篇》

很有趣的数据分析书!基本看过就能明白,以小说的形式讲解,很有代入感。包含了数据分析的结构化思维、数据处理技巧、数据展现的技术,很能帮我们提升职场竞争能力。找不到工作的,学好了它,自然没问题。


第2本《拯救你的Excel数据的分析、处理、展示(动画版)》

一本用手机看的Excel操作书,大部分例子都配置了二维码,手机扫扫就能看,基本上可以躺着把书学了。所有数据的分析、处理也都带了职场范例(有会计、HR、销售场景),很贴合实际。拯救我们小白的Excel,职场加薪不是梦想!


第3本《Excel图表之道:如何制作专业有效的商务图表》

职场大牛的书,教我们做图表的,好看到不能再好看。可以设计和制作达到杂志级质量的、专业有效的商务图表。相信平时我们很难做到吧,看了你就知道,也许一切没那么难。


第4本《绝了!Excel可以这样用:数据分析经典案例实战图表书》

挺好的一个系列,都是Excle常用的技巧,适合销售和HR。也是职场故事,很接地气,带视频的,全都是Excel数据分析的常用理念和方法。


第5本《深入浅出数据分析》

深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。


第6本《MySQL必知必会》

如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。


第7本《深入浅出统计学》

大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。


第8本《网站分析实战》

互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营!


第9本《深入浅出Python》

还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然!


第10本《Python学习手册》

对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。


第11本《利用Python进行数据分析》

这本书是你学习python不二之选,对着书,着重学习numpy,pandas两个包!每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。


第12本《R语言实战》

R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。


第13本《统计学:从数据到结论》

这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。


第14本《深入浅出SQL》

带你进入SQL语言的心脏地带,从使用INSERT和SELECT这些基本的查询语法到使用子查询(subquery)、连接(join)和事务(transaction)这样的核心技术来操作数据库。到读完《深入浅出SQL》之时,你将不仅能够理解高效数据库设计和创建,还能像一个专家那样查询、归一(normalizing)和联接数据。你将成为数据的真正主人。


第15本《数据挖掘导论》

这本书绝对是一本良心教材,拿到手从第一章开始阅读,能看多少就看多少。但是要尽量多看点,因为此书你可能要看一辈子的~~


第16本《算法导论中文版》

本书将严谨性和全面性融为一体,深入讨论各类算法,并着力使这些算法的设计和分析能为各个层次的读者接受。算法以英语和伪代码的形式描述,具备初步程序设计经验的人就能看懂;说明和解释力求浅显易懂,不失深度和数学严谨性。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:187
帖子:9
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP