我看你骨髓清奇,是个学数据分析的奇才。

本文转自知乎

作者:邹昕

—————————————————————————————————————————————————————

整理一些数据分析入门的学习资料,顺便送几本书,有兴趣的请看文章最后。

【0】入门互联网数据分析

不同行业不同公司要求会很不一样,比如说银行做数据分析、建模会要求 SAS/SQL,而互联网行业数据分析只要会 SQL 就可以了。

再比如说小公司可能会要求还会 R/Python 什么的,但是稍微中型一点的公司则可能只需要会 SQL 就行了。

乍一看有点奇怪,但其实也不奇怪,因为大一点的公司基础设施 (infra) 做得好,很多事情比如说 A/B test 这种都自动化了,不需要专门写代码。

接下来的内容都以中型以上互联网公司为例,讲讲如何准备工作需要的三个维度:技术,数据分析方法,行业知识。

【1】技术

技术方面 SQL 是最基本的,也是最重要的。

几个可以学习 SQL 的网站,基本上不会有什么太大的区别

https://community.modeanalytics.com/sql/tutorial/introduction-to-sql/

https://sqlzoo.net/

中文版的 https://www.w3cschool.cn/sql/

一些可以练习的网站:

http://www.programmerinterview.com/index.php/database-sql/advanced-sql-interview-questions-continued-part-2/

重点需要注意的:where / group by / order by / left join / right join / inner join / null / not null / having / distinct / like / union / avg / sum / min / max

像 rankover 这种已经算是挺高级的了。

当然除了 SQL 之外,Excel 也是要会一点的,比如说做个图,算算总合、平均之类的,稍微复杂点的数据透视表 (pivot) 就够了。

如果 SQL 上手比较快,时间充裕,那就练练 Tableau, 主要目的是看看都有什么样的图表,感受一下各自适用什么样的场景。

具体怎么做图不是非常重要,真要用的时候搜索一下现学就好了。

Tableau 很贵,所以下个试用版的就可以了,然后试用期学点最基本的就可以了。

说到数据可视化,再提一下这个 blog,作者写了《Storytelling with Data》:

http://www.storytellingwithdata.com/

【2】数据分析方法

经常被问到学习数据分析推荐哪些书,通常答案是我没看过什么数据分析的书,大部分时候是搜索整合各种网上的资源,后来仔细想了想,还是有一些的。

Case in point. 经典的管理咨询的书,哪个版本的都无所谓了,印象中大概看了一半左右。好像是因为懒,所以没看完,也因为套路都是类似的,看一半也就差不多可以了。

Introduction to Probability Models by Sheldon M. Ross. 应该是出到第 11 版了,但内容应该区别不大,看第一章就可以了,需要搞清楚条件概率,这个概念还是有点重要的。

Storytelling with Data,中文版《用数据讲故事》,作者也就是前面提到的 http://storytellingwithdata.com 的作者。

然后再找本统计基础的书(随便哪本教科书都差不多,实在不行的话把 wiki 上统计长条目下的多看几遍也可以),不要太纠结于理论、证明,时刻记住你要能把这些概念解释给不懂统计的人听,解释不清楚的东西你自己搞清楚了,效果也要大打折扣。

搞清楚几种常见的分布,假设检验,假阳性,假阴性,区别估算,显著性差异,p-value,平均值,中位数,p1/p25/p50/p75/p99,相关性,因果性,幸存者偏差,大数定律,80/20 等等。

Thinking, Fast and Slow. 当科普书看看就好,如果看不下去的话那就看《牛奶可乐经济学》。

【3】行业知识

很不幸,这一部分就真的没有特别有针对性的书可以看的了,基本都靠搜索,总结,思考,再搜索,总结,思考。。。

如果平时对互联网、科技行业相对比较关注,这一部分会上手很快,了解一些基本概念,试用一些产品,基本上 20 天可以达到一个入门的程度。

【3.1】试用相关的产品

所有互联网公司都强调员工要使用自己的产品,也就是所谓 dogfooding,这是提高产品思维最有效的办法,没有之一。

比如 Airbnb 会每个季度提供一定额度的金额让员工去度假的时候可以用上,住 Airbnb 上的房源,Uber 会给员工提供 credit 打 Uber 的,Facebook 会给员工提供 credit 在 Facebook 上做广告,通常来说每个季度几百块的样子。

通过这种方式员工可能会发现一些 bug,或者提供一些产品相关的反馈等等。

很显然,即使你不是上述公司的员工,你仍然是可以使用他们的产品,想想他们为什么样这么做,有什么可以改进的。

以 google map 为例,有一个功能是在达到目的地的时候,会显示出目的地的街景。那么接下来可以有一系列的问题。

为什么要显示出街景?方便用户辨认目的地。

除了显示街景还可以显示什么?可以显示附近停车场,或许目的地本身是没有停车场的,那么用户需要停车的话如果能自动给用户一些选择或许是一个不错的功能。

假设要做这么一个功能的话,什么情况下应该显示呢?

比如显然应该只有在用户在开车的时候才应该显示,那么如何辨别用户之前是开车而不是走路?

比如假如有目的地有停车场的话,那就不需要显示,这又如何辨别?

如果要显示停车场,又需要显示哪些信息?比如停车场的距离?价格?开放时间?

假设做了这么一些新的功能出来了,又如何验证效果是否好?A/B test?如何选 metrics?选用哪些用户?

类似的问题可以一直问下去,多进行类似的思维训练,对积累行业相关知识,训练产品思维是很有帮助的。

而且这种积累并不是说一定要坐在桌子前开始慢慢想,形成习惯了之后,使用产品的过程中会自然而然的想到这些。

比如上面的例子就是在一次导航完发现 google map 自动显示了目的地的街景而想到的。

数据分析的工作除了需要技术上的打磨,如何训练分析过程中的思路,也就是 analytical/critical thinking也是非常重要的一环。

很有效的一个办法就是碰到一个问题的时候,至少问自己5个为什么,不断深入,剥丝抽茧,问题也自然越来越明朗了。

【3.2】善用搜索引擎

信息爆炸的时候,如何搜索信息、汇总、提炼出有用的信息变得尤其重要。具体关于如何使用 google的一些技巧,这篇文章就不细说了。

另外,墙内的同学们,试试FQ或者用 Bing 吧。

除此之外,知乎和 quora 上都聚集了大量互联网相关从业人员,很多问答也是与此相关的,至于能不能找到你想要的信息,搜索技巧就很重要了。

【3.3】跟行业前辈交流

这里面的行业前辈可以是已经在行业里工作的师兄师姐(有时候是师弟师妹),也可以是这个行业里并没有什么关系的人。

那么如何结识这样的人,并且让他/她愿意帮助你呢?Linkedin 是一个很好的地方。就我个人来说,我很愿意帮助有一定准备的同胞。

注意是有一定准备,自己花了一定时间进行积累思索,让问题更有针对性,效果也会更好。

如果不直接认识在这个领域工作的人,很有可能也是可以通过你的好友间接认识的,此外还有一些社交网站,诸如微信群、知乎等,也可以认识不少行业大牛。

比如曾经有人问

@曾加

,作为十几万粉的知乎大V,最好的变现方式是什么?

他回答的大意是,通过这样一些资源认识更多的行业大牛,不断增强自己,这是最好的“变现方式”, 就是这个意思。

还有一个很好的办法是通过各种线下聚会,比如美国这边尤其是湾区比较常见的 meetup,不时会有各个行业的活动。

这些活动上通常可以跟业内人士聊聊他们做的东西,请教一些问题,而且一般他们也会宣传他们的招人计划,可谓一举两得。

【3.4】网络资源

不管你是处在世界的哪个地方,只要有网络,也就意味着你可以接入到世界上无数的公开课、行业领头人物的分享。

但是信息太多,也就意味着如何精简挑选变得更加的困难。

这里我分享一下过去几年来我总结的一些资源,以及简单的讲一下推荐的理由。

【3.5】书籍

Zero to One by Peter Thiel -- 从0到1

The Hard Thing about Hard Things by Ben Horowitz -- 创业维艰

这两本书是讲创业的,都有中文版。如果你还没看过,又想从事互联网行业的话,一定要看一下。虽然是讲创业的,但是却可以让人退一步,在一个更高的角度理解如何做好产品。

【3.6】网站

http://jwegan.com/

Pinterest 的一个用户增长工程师的 blog,很多各种产品开发的思路、实验、分析。

https://www.kissmetrics.com/

产品思维里重要的一面,metrics metrics metrics。看名字你应该就能猜出来我为什么推荐这个网站了。

https://medium.com/

各种科技相关资讯。

http://firstround.com/review/

同上。

http://www.slideshare.net/

LinkedIn 旗下的网站,有大量专业人士分享的 slides (幻灯片)。

视频资源

https://www.youtube.com/channel/UCxIJaCMEptJjxmmQgGFsnCg

硅谷最出名的 YC 创业孵化器在斯坦福的讲课,中文版的看这里:

http://startupclass.club/

【3.7】微信/知乎推荐(排名不分先后)

张溪梦

微信公众号:GrowingIO

https://www.zhihu.com/people/simonzhang1

LinkedIn 前 Business Analytics 的大头创办的公众号,现在在国刚创业数据分析服务。

曹政

微信公众号:caozsay

https://www.zhihu.com/people/cao-zheng

心得分享

朱赟

微信公众号:AngelaTalk

Airbnb 工程师,硅谷技术、文化、故事、职业发展等。

曾加

微信公众号:PlusZeng

https://www.zhihu.com/people/zengjiaplus

蚂蚁数据分析

何明科

https://www.zhihu.com/people/he-ming-ke

做过投资做过互联网产品;目前专注于数据和互联网产品中。

chenqin

https://www.zhihu.com/people/chenqin

知乎数据帝

路人甲

微信公众号:一个程序员的日常

https://www.zhihu.com/people/sgai/

空白白白

https://www.zhihu.com/people/jiafeimao/

数据咨询

原文地址:https://www.cnblogs.com/luoluo-123/p/10126642.html

时间: 2024-11-09 00:57:00

我看你骨髓清奇,是个学数据分析的奇才。的相关文章

单页应用SPA做SEO的一种清奇的方案

单页应用SPA做SEO的一种清奇的方案 网上有好几种单页应用转seo的方案,有服务端渲染ssr.有预渲染prerender.google抓AJAX.静态化...这些方案都各有优劣,开发者可以根据不同的业务场景和环境决定用哪一种方案.本文将介绍另一种思路比较清奇的SEO方案,这个方案也是有优有劣,就看读者觉得适不适合了. 项目分析 我的项目是用react+ts+dva技术栈搭建的单页应用,目前在线上已经有几十个页面,若干个sdk和插件在里面. 考虑想用服务端渲染来做seo,但是我的项目已经开发了这

国外网络穿透到国内看国内优酷爱奇艺等视频

为了方便国外的华人.留学生能像国内一样,看国内的视频资源,我们推出了此服务. 购买后,店主给您账号,在电脑或手机上配置一下,就可以访问国内视频网站了,不需要安装任何第三方软件,安全可靠. 支持Windows.MacOS.Android.iOS的系统. 请需要的朋友前往淘宝购买,淘宝购买地址:https://item.taobao.com/item.htm?id=531298130051

20200321—思路清奇—脑洞好大—天马行空的心情随笔

上学的时候,读书读到怀疑人生,学这些理论到底有啥用,纯粹是为了功利而搞科研. 工作的时候,嗯,真香,读书简直太特喵有用了.虽然很多以前的公式定理全忘了,但是思想方法论的玩扔,全在脑子里生根发芽了.这大概就是:早岁读书不甚解,晚年醒事有奇功. 闲言少叙,来张书单,一本一本啃吧. 链接来自上海大学教授戴世强的科学网博客: 学习漫谈(51):为年青学子开一张科学方法论读物清单 http://blog.sciencenet.cn/blog-330732-461601.html 再说点题外话:方法论这个东

画风清奇!盘点各编程语言中有趣的开源项目!

生活不易,编程苦闷,不如“人为制造”点趣味,让日子过得更加有玩味感. 本文参考了一些项目推荐,整理了一些编程语言中个人认为比较有意思,也相对实用的开源项目,每个语言列的都不多,感兴趣的有空可以试试看. 一.Go 1.Gobot Gobot 是一个机器人.无人机和物联网框架,提供在同一时间合并多个不同设备的简单且强大的解决方案. Gobot 目前共支持18个不同的平台,它包含一个 cppp.io 兼容的 RESTful API 来查询在群中运行的任何连接.设备或机器人的状态,还能够直接向设备和机器

【转】看完这个你的位运算学得就差不多了

位运算应用口诀 清零取反要用与,某位置一可用或 若要取反和交换,轻轻松松用异或 移位运算 要点 1 它们都是双目运算符,两个运算分量都是整形,结果也是整形.     2 " < <" 左移:右边空出的位上补0,左边的位将从字头挤掉,其值相当于乘2.     3 ">>"右移:右边的位被挤掉.对于左边移出的空位,如果是正数则空位补0,若为负数,可能补0或补1,这取决于所用的计算机系统.     4 ">>>"

编程模拟自然(九):元胞自动机

序 旧书有云:发鸠之山,其上多柘木.有鸟焉,其状如乌,文首.白喙.赤足,名曰精卫,其鸣自詨. 一日,精卫游于码海,溺而不返,后常衔西山之木石,以堙于海.有诗为证: 万事有不平,尔何空自苦: 长将一寸身,衔木到终古? 我愿平码海,身沉心不改: 码海无平期,我心无绝时. 呜呼!君不见,西山衔木众鸟多,鹊来燕去自成窠! (前情提要:主角元乘坐返回舱降落到了码海上,随后遇到了个鸟人...) “咳咳,远道的客人,我名精卫XIV,乃是先祖精卫鸟的第十四代后裔...”鸟人作自我介绍 “...你是谁,从哪里来又

如何在GPT格式下创建EFI和MSR分区(安装WIN10/WIN8.1)

如何在GPT格式下创建EFI和MSR分区(安装WIN10/WIN8.1) 前言 本文将总结如何在GPT格式的磁盘下安装win10系统,总结下折腾了本屌两天的鬼东西.老本子用了4年了,想换个笔记本,了解了很多品牌,戴尔.宏基.联想.未来人来.微星.神舟.华硕.惠普.最后被华硕的一款本子所吸引!然后去找各大论坛和电商,当然还有实体店了解这款号称 史上最轻薄的ROG笔记本.都说这本子过于轻薄,散热差了些,但综合个人需求,终于,忍痛下手了!那么,接下来的几个月,坐等吃馒头度过. 来一波图养养眼!    

GAP平台前进之路

马斯科特(ma_scott)毕业于三流大学,在大学中学习了java,SQL,数据结构等理论知识,怀揣着技术改变人生,自己改变世界的梦想进入了程序员的队伍.当时正处BS开发的浪潮,系统前端使用jsp,javascript,后端javaBean,MVC模式搞定一切.马斯科特在开发中乐此不疲,感觉开发很容易. 这时卖桃君(MacTalk)闪了出来,对马斯科特说:“少年,我看你骨骼清奇.根骨极佳,必是不出事的开发奇才.你加入平台部,一起来维护GAP平台吧.”马斯科特摸了摸鼻子,“GAP平台是什么?”卖桃

【图灵学院】Java架构师要掌握哪些技能?你所不知的十五条秘密

苦苦工作累积经验,却还是奋战在一线的"菜鸟"码农,不知道成为Java架构师要掌握哪些技能?熬不完的夜,想要升职加薪?看了很多书还是写不出最高效的代码,花了很多钱学习网课还是不见成效?遇到我图灵学院江南老师那就对了,少侠我看你骨骼清奇,是个奇才,请收下我深藏已久的升(kui)职(hua)宝典. 成为Java架构师要掌握哪些技能?请看下面这十五条: 1.想成为Java架构师,首先你要是一个高级java工程师,熟练使用各种框架,并知道它们实现的原理: 2.掌握jvm虚拟机原理.调优,懂得jv