学习大数据,你的职业是如何规划的?

作为IT类职业中的“大熊猫”,大数据人才(数据工程师,数据分析师,数据挖掘师,算法工程师等)、在国内人才市场可谓是一颗闪耀的新星。由于刚刚出于萌芽阶段,这个领域出现很大的人才缺口。

1 大数据人才做什么?

2 需要具备的能力

2.1 精通SQL

2.2 数据模型技能

2.3 ETL设计

2.4 架构项目

3 知识体系

机器学习基础

机器学习工具

3.1 大数据通用处理平台

3.2 分布式存储

3.3 资源调度

3.4 机器学习工具

3.5 数据分析/数据仓库(SQL类)

3.6 消息队列

3.7 流式计算

3.8 日志收集

3.9 编程语言

3.10 数据分析挖掘

3.11 数据可视化

3.12 机器学习

4 大数据人才的职业发展

4.1 薪酬待遇

4.2 职业发展路径

1 大数据人才做什么?

大数据是眼下非常时髦的技术名词,与此同时自然也催生出了一些与大数据处理相关的职业,通过对数据的挖掘分析来影响企业的商业决策。大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要。

大数据开发学习有一定难度,零基础入门首先要学习Java语言打基础,一般而言,Java学习SE、EE,需要约3个月的时间;然后进入大数据技术体系的学习,主要学习Hadoop、Spark、Storm等,从零基础到精通学习大数据扣扣群606859705分享大数据学习资源,有大佬指导学习,学习路线清晰

因此,分析历史、预测未来、优化选择,这是大数据人才在“玩数据”时最重要的三大任务。通过这三个工作方向,他们帮助企业做出更好的商业决策,找出最优化的结果。

2 需要具备的能力

2.1 精通SQL

如果英语是业务的交流工具,那么SQL就是数据的交流工具。一个不会流利的英语的业务人员能有多大的成就?不管任何技术时代的产生和更替,SQL一直是数据的通用语。数据工程师应该有能用SQL表达任何‘相关子查询’和窗口函数复杂度的技术能力。对数据工程师来说初始SQL/DML/DDL简单到根本没有难度。即使是没有接触过SQL的人,他也能读懂并明白数据库的执行计划,了解所有步骤,知道程序怎么被调用,连接算法的不同和执行计划内的分布式维度。

2.2 数据模型技能

作为一个数据工程师,有对实体-关系模型的认知反射,规范化的清晰认识,权衡反规范化的敏锐直觉。数据工程师应该熟悉维度建模及相关概念与术语。

2.3 ETL设计

能够写出有效率、有弹性的、“可发展”的ETL任务是一个关键。

2.4 架构项目

就如任何一个领域的专家的专业技能一样,数据工程师需要一个较高层次的综括,对大多数的工具,平台,库,和其他供他支配的资源的了解。认识到不同类型的数据库、计算引擎、流处理器、消息队列、工作流协调器、序列化格式及其他相关技术的属性、用例、微妙之处。在设计解决方案的时候,他应该有能力选择即将要使用的技术,并有一个构想去协调怎么使他们一起更好地工作。

3 知识体系

3.1 大数据通用处理平台

Spark

Flink

Hadoop

3.2 分布式存储

HDFS

3.3 资源调度

Yarn

Mesos

3.4 机器学习工具

Mahout

Spark Mlib

TensorFlow (Google 系)

Amazon Machine Learning

DMTK (微软分布式机器学习工具)

3.5 数据分析/数据仓库(SQL类)

Pig

Hive

kylin

Spark SQL,

Spark DataFrame

Impala

Phoenix

ELK

ElasticSearch

Logstash

Kibana

3.6 消息队列

Kafka(纯日志类,大吞吐量)

RocketMQ

ZeroMQ

ActiveMQ

RabbitMQ

3.7 流式计算

Storm/JStorm

Spark Streaming

Flink

3.8 日志收集

Scribe

Flume

3.9 编程语言

Java

Python

R

Ruby

Scala

3.10 数据分析挖掘

MATLAB

SPSS

SAS

3.11 数据可视化

R

D3.js

ECharts

Excle

Python

3.12 机器学习

机器学习基础

聚类

时间序列

推荐系统

回归分析

文本挖掘

决策树

支持向量机

贝叶斯分类

神经网络

深度学习

机器学习工具

Mahout

Spark Mlib

TensorFlow (Google 系)

Amazon Machine Learning

DMTK (微软分布式机器学习工具)

4 大数据人才的职业发展

4.1 薪酬待遇

作为IT类职业中的“大熊猫”,大数据人才的收入待遇可以说达到了同类的顶级。国内IT、通讯、行业招聘中,有10%都是和大数据相关的,且比例还在上升。在美国,大数据工程师平均每年薪酬高达17.5万美元,而据了解,在国内顶尖互联网类公司,同一个级别大数据工程师的薪酬可能要比其他职位高20%至30%,且颇受企业重视。

4.2 职业发展路径

由于大数据人才数量较少,因此大多数公司的数据部门一般都是扁平化的层级模式,大致分为数据分析师、资深研究员、部门总监3个级别。大公司可能按照应用领域的维度来划分不同团队,而在小公司则需要身兼数职。有些特别强调大数据战略的互联网公司则会另设最高职位—如阿里巴巴的首席数据官。这个职位的大部分人会往研究方向发展,成为重要数据战略人才。另一方面,大数据工程师对商业和产品的理解,并不亚于业务部门员工,因此也可转向产品部或市场部,乃至上升为公司的高级管理层。

原文地址:https://blog.51cto.com/14342636/2417802

时间: 2024-10-05 05:06:41

学习大数据,你的职业是如何规划的?的相关文章

为何零基础也可学习大数据技术?

随着大数据在国内的发展,大数据相关人才出现了供不应求的状况,大数据分析师更是被媒体称为"未来发展前景良好的职业之一".大数据分析师的薪酬比同等级职位高20%.而如何成为大数据时代的弄潮儿,掌握当下紧缺的软件技能是关键,那么,零基础该怎样学习大数据呢? 大数据作为当下呼声特别高的IT技术,想学大数据的朋友已经从一个变成两个,从两个变成三个,但是计数单位,也是从个到百到千到万,接下来还可能更高.大数据的学习容易吗?门槛低,想学的都可以展开大数据的学习,那么该怎么入门呢? 1 何谓大数据 其

学习大数据需要具备四种条件?你具备几种?

现在学习大数据的越来越多了,可是你知道学习大数据需要什么条件吗?我来说说四个必备条件. 大数据现已成为年×××展的趋势,很多人纷纷挑选学习大数据,想要进入大数据职业.大数据技术体系巨大,包含的常识较多,体系的学习大数据能够让你全面把握大数据技术.学习大数据需求把握哪些常识? 1.学习大数据首先要学习Java根底 怎样进行大数据学习的快速入门?学大数据课程之前要先学习一种核算机编程言语.Java是大数据学习需求的编程言语根底,由于大数据的开发根据常用的高档言语.而且不论是学习hadoop,仍是数据

转型进入IT行业,0基础学习大数据开发需要什么基础?

IT行业发展速度快,市场需求大,而且,程序员薪酬高.福利待遇高,成为很多从业者向往的职业,当然,也刺激了很多非计算机专业的从业者进入该领域.转行进入IT行业在最近的几年一直是个热门,那么对于0基础的求学者,入行大数据开发需要什么基础呢? 在很多人眼中大数据都是一个高端的行业,而且,一联想到IT.数据,很多人就开始纠结,学习大数据开发是否需要数学.英语等基础呢?是不是0基础就无法真正的学懂大数据开发呢? 首先:数学.英语不是限制,逻辑思维是关键 学程序开发,入行IT领域要有一定的逻辑思维能力,而逻

自学成才的数据科学家告诉你5个学习大数据的正确姿势!

对于数据科学来说,现在是发展的黄金时期.这是个新领域,但增长迅速,同时数据科学家的缺口也很大,据说他们的平均年薪可以达到10万美元.哪里有高薪,哪里就吸引人们,但是数据科学技能的差距意味着许多人需要努力学习.      第一步当然是询问“我怎么学习数据科学”,这个问题的答案往往是一长串的课程和书籍阅读,从线性代数到统计数据,这几年我也是这样学习过来的.我没有编程背景,但我知道我喜欢处理数据. 我比较不能理解在完全没有理解别人的背景时就给他一份长长的书单或者技能表.这就类似于一个老师给你一堆教科书

一步一步学习大数据系列

概要 一步一步学习大数据系列 包括: 一步一步学习大数据系列之 Linux 一步一步学习大数据系列之 Linux 01-Linux 系统安装 02-Linux 图形界面及文件系统结构介绍 03-局域网工作机制和网络地址配置 04-vmware 虚拟网络的配置 05-Linux 网络配置及 CRT 远程连接06- Linux常用命令 09-SSH免密登录配置. 10-CRT 工具设置 11 -more service- chkconfig 命令12.Linux软件安装 一步一步学习大数据系列之 H

贵阳如何学习大数据?大数据学习路线安排

很多朋友不知道怎么入手学习大数据,今天科多大数据带你进入大数据的世界. 一.Hadoop入门,了解什么是hadoop 1.Hadoop产生背景 2.Hadoop在大数据.云计算中的位置和关系 3.国内外Hadoop应用案例介绍 4.国内Hadoop的就业情况分析及课程大纲介绍 5.分布式系统概述 6.Hadoop生态圈以及各组成部分的简介 7.Hadoop核心MapReduce例子说明 二.分布式文件系统HDFS,是数据库管理员的基础课程 1.分布式文件系统HDFS简介 2.HDFS的系统组成介

学习大数据需要Java基础吗?

近几年,很多人都听到过一个名词"大数据"也有一部分人选择学习了解大数据,那么大数据到底是什么,学习大数据需要有Java基础吗? 推荐一个大数据学习交流群 119599574每天晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 如果要学习大数据,不管你是零基础,还是有一定的基础,都应该知道在学大数据之前一定要懂至少一种计算机编程语言,因为大数据的开发离不开编程语言,不仅要懂,还要精通! 大数据到底是

0基础学习大数据你需要了解的学习路线和方向

现在大数据这么火,各行各业想转行大数据,那么问题来了,该往哪方面发展,哪方面最适合自己? 首先从字面来了解一下大数据 大数据 (巨量数据集合(IT行业术语)) 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的信息资产. 大数据的5V特点(IBM提出):Volume(大量).Velocity(高速).Variety(多样).Value(低价值密度).Veracit

小白怎么学习大数据

大数据时代,你在干什么?大家都知道数据本身并没有什么价值,由于分析方法的存在,使得海量的数据变得如同一座永远开采不完的矿,是金矿还是银矿,得看你怎么分析和怎么利用了,和小编一起来了解一下怎么学习大数据吧. 要有一颗敢于不断学习的心 推荐一个大数据学习群 119599574晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 方法/步骤 [了解自身学习大数据的目的]每个人都有自己的想法,学习大数据的目的是什么,是