摘要: 想找一份数据科学家的工作?这是个正确的决定! 哈佛商业评论最近刊登了一篇由Thomas Davenport 和 D.J. Patil 共同撰写的文章,称数据科学家是二十一世纪最性感的工作。 但是你要怎么进入这个行业呢? 许多资源也许会让你以为,成为一个数据科学家需要全方面掌握一些领域,例如软件开发,数据修改,数据库,统计学,机器学习和数据可视化。
想找一份数据科学家的工作?这是个正确的决定!
哈佛商业评论最近刊登了一篇由Thomas Davenport 和 D.J. Patil 共同撰写的文章,称数据科学家是二十一世纪最性感的工作。
但是你要怎么进入这个行业呢?
许多资源也许会让你以为,成为一个数据科学家需要全方面掌握一些领域,例如软件开发,数据修改,数据库,统计学,机器学习和数据可视化。
不必担心。以我作为一个数据科学家的经验,事实并非如此。你不需要尽可能快地学习值得一生知道与数据相关的信息和技能。相反,要学会仔细阅读数据科学类工作的描述。这将使你能够申请你已经拥有必要技能的工作,或者去掌握你想要匹配的工作的特定数据技能。
◆ ◆ ◆
4种数据类型工作
数据科学家是经常被用做描述那些截然不同的工作的一个总称。这里有四种类型的数据科学工作:
一、数据科学家是住在旧金山的数据分析师
除了开玩笑之外,实际上在有一些公司担当数据科学家就等同于担当一个数据分析师。你的工作可能包括从MySQL数据库中提取数据,成为一个Excel数据透视表的大师,并且生成基础的数据可视化(例如,线状和柱状图)。你有时分析A/B测试的结果或者主要负责你们公司的Google分析账户。像这样的公司对有抱负的数据科学家是一个摸到窍门的好地方。一旦你对你日常职责有所了解,一个像这样的公司会是一个尝试新事物和提升技能的好环境。
二、请查看我们的数据!
似乎有许多公司达到了拥有大量流量(越来越多的大量数据)的地步,并且他们寻求某人来建立公司需要向前迈进的大量数据基础设施。他们也在寻找某人提供分析。你会看到招聘公告在“数据科学家”和“数据工程师”下列出。由于你是最初的数据招聘(的一员),这里可能有许多短期内绝佳的机会,使你是一个统计学或者机器学习专家变得次要。
一个有软件工程背景的数据科学家可能在这样的公司表现突出,更重要的是数据科学家对生产代码做出了有意义的数据贡献并提供了基本的见解和分析。初级数据科学家的指导机会可能在这样的公司不太丰富。因此,你会有很大的机会去闪耀和成长通过火的考验,但会有更少的指导,你可能会面临更大的下滑或停滞的风险。
三、我们是数据,数据是我们
有许多公司,数据(或者数据分析平台)就是他们的产品。在这种情况下,数据分析或机器学习将是相当激烈的。这可能是一个有正式的数学、统计、或物理背景的人的理想情况,并希望能继续走一个更学术的道路。相比于他们回答公司的经营问题,这种类型的数据科学家可能更侧重于生产大数据驱动的产品。属于这一群体的公司可能是面向消费者的公司,这些公司拥有大量的数据或是提供基于数据的服务。
四、数据驱动的大规模的非数据公司
很多公司都属于这个类型。在这种类型的公司里,你会加入一个由其它数据科学家组成的已有的团队。你面试的公司关心数据,但可能不是一个数据公司。同样重要的是你可以进行分析,触碰产品代码,可视化数据,等等。一般来说,这些公司要么找通才,要么他们正在填补一个特定的他们觉得自己的团队缺乏的职位,如数据可视化或机器学习。当在这些公司的面试时,一些更重要的技能是熟悉对 “大数据”的工具设计(例如,Hive 或者 Pig)和处理杂乱的、“现实生活”的数据集的经验。
希望这能给你对于 “数据科学家”这个职位有多宽泛有一个认识。四种上述公司的“人格”是寻求不同的技能、知识和经验水平。尽管如此,这些招聘职位都很可能会说是“数据科学家”,所以仔细观察一下你的工作描述,对于你会加入什么样的团队有一个认识,并了解需要发展什么技能。
◆ ◆ ◆
你应该培养的8大数据科学核心技能
1、基本工具(Basic Tools):无论你面试的是什么类型的公司,你都会被期望知道如何使用该行业的工具。这意味着你应该知道一种统计编程语言(如R或Python)和一种数据库查询语言(如SQL)。
2、基本统计(Basic Statistics):至少对统计数据有基本了解对成为数据科学家至关重要。一个面试官曾经告诉我,他面试的许多人甚至不能说出P值(p-value)的正确定义。
你应该熟悉统计检验、分布、最大似然估计等。请回想一下你的基础统计课程!不仅机器学习的情况是如此,一个更重要的关于你统计知识的方面是理解不同的技术在什么时候是(或不是)一个有效的方法。统计对所有的公司类型都很重要,特别是数据驱动的公司,这些公司的产品不是以数据为中心的,但产品利益相关者将依靠你的帮助做出决策和设计/评估实验。