4类数据科学工作和8个让你被录用的技能

原文链接

摘要: 想找一份数据科学家的工作?这是个正确的决定! 哈佛商业评论最近刊登了一篇由Thomas Davenport 和 D.J. Patil 共同撰写的文章,称数据科学家是二十一世纪最性感的工作。 但是你要怎么进入这个行业呢? 许多资源也许会让你以为,成为一个数据科学家需要全方面掌握一些领域,例如软件开发,数据修改,数据库,统计学,机器学习和数据可视化。

想找一份数据科学家的工作?这是个正确的决定!

哈佛商业评论最近刊登了一篇由Thomas Davenport 和 D.J. Patil 共同撰写的文章,称数据科学家是二十一世纪最性感的工作。

但是你要怎么进入这个行业呢?

许多资源也许会让你以为,成为一个数据科学家需要全方面掌握一些领域,例如软件开发,数据修改,数据库,统计学,机器学习和数据可视化。

不必担心。以我作为一个数据科学家的经验,事实并非如此。你不需要尽可能快地学习值得一生知道与数据相关的信息和技能。相反,要学会仔细阅读数据科学类工作的描述。这将使你能够申请你已经拥有必要技能的工作,或者去掌握你想要匹配的工作的特定数据技能。

◆ ◆ ◆

4种数据类型工作

数据科学家是经常被用做描述那些截然不同的工作的一个总称。这里有四种类型的数据科学工作:

一、数据科学家是住在旧金山的数据分析师

除了开玩笑之外,实际上在有一些公司担当数据科学家就等同于担当一个数据分析师。你的工作可能包括从MySQL数据库中提取数据,成为一个Excel数据透视表的大师,并且生成基础的数据可视化(例如,线状和柱状图)。你有时分析A/B测试的结果或者主要负责你们公司的Google分析账户。像这样的公司对有抱负的数据科学家是一个摸到窍门的好地方。一旦你对你日常职责有所了解,一个像这样的公司会是一个尝试新事物和提升技能的好环境。

二、请查看我们的数据!

似乎有许多公司达到了拥有大量流量(越来越多的大量数据)的地步,并且他们寻求某人来建立公司需要向前迈进的大量数据基础设施。他们也在寻找某人提供分析。你会看到招聘公告在“数据科学家”和“数据工程师”下列出。由于你是最初的数据招聘(的一员),这里可能有许多短期内绝佳的机会,使你是一个统计学或者机器学习专家变得次要。

一个有软件工程背景的数据科学家可能在这样的公司表现突出,更重要的是数据科学家对生产代码做出了有意义的数据贡献并提供了基本的见解和分析。初级数据科学家的指导机会可能在这样的公司不太丰富。因此,你会有很大的机会去闪耀和成长通过火的考验,但会有更少的指导,你可能会面临更大的下滑或停滞的风险。

三、我们是数据,数据是我们

有许多公司,数据(或者数据分析平台)就是他们的产品。在这种情况下,数据分析或机器学习将是相当激烈的。这可能是一个有正式的数学、统计、或物理背景的人的理想情况,并希望能继续走一个更学术的道路。相比于他们回答公司的经营问题,这种类型的数据科学家可能更侧重于生产大数据驱动的产品。属于这一群体的公司可能是面向消费者的公司,这些公司拥有大量的数据或是提供基于数据的服务。

四、数据驱动的大规模的非数据公司

很多公司都属于这个类型。在这种类型的公司里,你会加入一个由其它数据科学家组成的已有的团队。你面试的公司关心数据,但可能不是一个数据公司。同样重要的是你可以进行分析,触碰产品代码,可视化数据,等等。一般来说,这些公司要么找通才,要么他们正在填补一个特定的他们觉得自己的团队缺乏的职位,如数据可视化或机器学习。当在这些公司的面试时,一些更重要的技能是熟悉对 “大数据”的工具设计(例如,Hive 或者 Pig)和处理杂乱的、“现实生活”的数据集的经验。

希望这能给你对于 “数据科学家”这个职位有多宽泛有一个认识。四种上述公司的“人格”是寻求不同的技能、知识和经验水平。尽管如此,这些招聘职位都很可能会说是“数据科学家”,所以仔细观察一下你的工作描述,对于你会加入什么样的团队有一个认识,并了解需要发展什么技能。

◆ ◆ ◆

你应该培养的8大数据科学核心技能

1、基本工具(Basic Tools):无论你面试的是什么类型的公司,你都会被期望知道如何使用该行业的工具。这意味着你应该知道一种统计编程语言(如R或Python)和一种数据库查询语言(如SQL)。

2、基本统计(Basic Statistics):至少对统计数据有基本了解对成为数据科学家至关重要。一个面试官曾经告诉我,他面试的许多人甚至不能说出P值(p-value)的正确定义。

你应该熟悉统计检验、分布、最大似然估计等。请回想一下你的基础统计课程!不仅机器学习的情况是如此,一个更重要的关于你统计知识的方面是理解不同的技术在什么时候是(或不是)一个有效的方法。统计对所有的公司类型都很重要,特别是数据驱动的公司,这些公司的产品不是以数据为中心的,但产品利益相关者将依靠你的帮助做出决策和设计/评估实验。

原文链接

时间: 2024-10-21 06:01:51

4类数据科学工作和8个让你被录用的技能的相关文章

一名3年工作经验的java程序员应该具备的技能

一名3年工作经验的Java程序员应该具备的技能,这可能是Java程序员们比较关心的内容.我这里要说明一下,以下列举的内容不是都要会的东西—-但是如果你掌握得越多,最终能得到的评价.拿到的薪水势必也越高. 1.基本语法 这包括static.final.transient等关键字的作用,foreach循环的原理等等.今天面试我问你static关键字有哪些作 用,如果你答出static修饰变量.修饰方法我会认为你合格,答出静态块,我会认为你不错,答出静态内部类我会认为你很好,答出静态导包我会对你很满

中科院外籍院士姚期智:科学家与科学之路

    ■姚期智   我从事科学工作几十年,也认识了很多杰出的科学家.我自己觉得科学家的生涯很有收获,当科学家是一个非常好的体验,从中可以品尝到巨大的乐趣. 首先,我要谈一谈什么是科学家,科学家做什么样的事情.在此,我想引用大文豪萧伯纳在一个剧本里说的几句话:“有的人看到已经发生的事情,问‘为什么会这样’.我却梦想一些从未发生的事情,然后追问‘为什么不能这样’.” 这句话脍炙人口,很多人用不同的方法引述.我觉得这句话正可以用来代表科学里面的两种主要 精神.属于第一种的,看到自然现象,想办法解释为

命令行中的数据科学

目录 前言 XIII 第1章 简介 1 1.1 概述 1 1.2 数据科学就是OSEMN 2 1.2.1 数据获取 2 1.2.2 数据清洗 2 1.2.3 数据探索 3 1.2.4 数据建模 3 1.2.5 数据解释 3 1.3 插入的几章 4 1.4 什么是命令行 4 1.5 为什么用命令行做数据科学工作 6 1.5.1 命令行的灵活性 6 1.5.2 命令行可增强 6 1.5.3 命令行可扩展 7 1.5.4 命令行可扩充 7 1.5.5 命令行无处不在 7 1.6 一个现实用例 8 1.

哪些数据科学技能是雇主所需要的

这是一个好消息,如果你希望在2016年找一份数据科学的工作-在该领域职位空缺的数量正在不断增加,企业希望利用大数据来获得竞争优势.但事实上,找一份梦寐以求的数据科学工作就意味着你要具备一些技能的组合,你可能会惊讶学习哪些技能是雇主所最需要的. 最近,人们在CrowdFlower上针对Linkedin的3490个数据科学职位做了分析,并对最常出现的21个技能进行了排序.有些结果并不那么令人惊讶-SQL排在最前,而其它的结果可能是数据科学领域不断发展的领先指标. 如上所述,SQL是最常见的技能,在L

禅与摩托车修理艺术...(假设.验证.真理.科学)

…… …… …… “在科学的殿堂里有许多深宅大院……有各种人住在其中,而他们住在这儿的动机也是形形色色,五花八门.有些人倾心于科学是因为有优越的智力,科学成了他们独有的活动,在其中他们得到了生动的经验,也满足了他们的野心.有一些人则完全是为了实用的目的,而将自己思考的产物献在祭坛上.如果上帝派来的天使将上面两种人从殿里驱逐出去,那么殿里很显然会空旷许多,但是里面仍然会住着一批古今人物……如果殿里只住着前述两种人,那么它就只不过是一座空木屋,只有四处攀爬的蔓草……那些获得天使青睐的人……有些古怪.

(面试感悟)一名3年工作经验的程序员应该具备的技能

前言 因为和同事有约定再加上LZ自己也喜欢做完一件事之后进行总结,因此有了这篇文章.这篇文章大部分内容都是面向整个程序员群体的,当然因为LZ本身是做java开发的,因此有一部分内容也是专门面向咱们java程序员的. 简单先说一下,LZ坐标杭州,13届本科毕业,算上年前在阿里巴巴B2B事业部的面试,一共有面试了有6家公司(因为LZ不想请假,因此只是每个晚上去其他公司面试,所以面试的公司比较少),其中成功的有4家,另外两家失败的原因在于: 1.阿里巴巴B2B事业部的面试,两轮技术面试都过了,最后一轮

《数据科学入门》pdf格式下载免费电子书下载

<数据科学入门>pdf格式下载免费电子书下载 https://u253469.ctfile.com/fs/253469-300325729更多电子书下载: http://hadoopall.com/book 内容简介 数据科学是一个蓬勃发展.前途无限的行业,有人将数据科学家称为"21世纪头号性感职业".本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识--数学和统计学. 作者选择了功能强大.简单易学的Python语言环境,亲手搭

数据科学行业已被挤爆?4点建议献给准备入行的小白

数据科学家被称为"21世纪最性感的职业",也被认为是最容易找工作的职业,但如今,真实情况如何呢? 数据科学刚刚度过了它的黄金五年.自2012年以来,这个行业发展迅速.它几乎完整经历了Gartner技术成熟度曲线的每个阶段. 度过了初期使用阶段.有关AI和偏见的负面新闻.Facebook等公司的第二三轮风投.现在的数据科学正处于高增长使用阶段:即使是银行.医疗保健公司和落后市场五年的其他100强企业,也在招聘机器学习中的数据科学岗位. 但现实正在发生巨大的变化. 来自captech基金的

学习《数据科学入门》中文PDF+英文PDF+源代码

数据科学是一个蓬勃发展.前途无限的行业,有人将数据科学家称为"21世纪头号性感职业".本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识--数学和统计学.作者选择了功能强大.简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好.简洁易读的实现范例. 学习后可以: 学到一堂Python速成课: 学习线性代数.统计和概率论的基本方法,了解它们是怎样应用在数据科学中的: 掌握如何收集.探索.清理.转换和操作数据: 深入理解