数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别?

商务智能。商务智能工程师是商业智能行业的工程师。从需求分析师到数据仓库架构师、ETL工程师、数据分析工程师、报表开发工程师、数据挖掘工程师等,都可以称为BI工程师。
ETL工程师:从事系统编程、数据库编程和设计,掌握各种常用编程语言的专业技术人员。也称为数据库工程师。

盲目地解释数据仓库的概念可能并不有趣。让我们从不同的角色开始。

老板:我是一家手机公司的老板。今天我要向董事会汇报。我将准备一份关于用户增长、用户保留率、用户活动以及过去三年中我手机中每个应用程序的使用率的报告。如果下面没有BI,我将被迫这样做。

我是一个非技术性的商务智能。我每天阅读竞争产品分析报告,看到双十一的销量,看到各种评论,知道我的产品有哪些缺点和优势,分析南北地区差异,国内外客户的偏好,总之,我有很强的行业解读能力和数据解读能力。在手机领域,我能画出非常漂亮的图表和PPT。今天老板让我做报告。我还需要刷我的脸,以找到ETL工程师,以帮助我用完报告的数据。基于这些数据,我想给出一定的解释,为什么这个月的手机销售不如上个月,为什么用户流失越来越严重,等等。

很多小伙伴,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习Qun:775908246,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系。

ETL工程师:我是食品链最底层的一个压力很大的ETL工程师。我可以编写shell,可以使用hadoop/hive/hbase,还可以使用超复杂的逻辑编写SQL。今天,无法单独计算数据的BI,让我再运行一些数据。我想让她提一下需求流程,但她说这是老板想要的(操作中使用的杀手锏)!!为了紧急处理,我不得不放下工作,为她运行数据。我花了半个小时为她运行数据,希望能有所不同。

众所周知,大数据工程师是大数据开发工程师。主要从事大数据平台建设。它要求实践者拥有Java基础。它还需要以下技术能力:hadoop、hive、hase、flume、storm、kafka、spark等。它是一个非常大的技术集群。

如果你认为我每天都这样做,那你就错了。我通常的工作不只是完成分配给我的任务。我还负责数据ETL流程、数据建模、定时任务分配,有时还负责Hadoop集群的维护等。我必须这样做。每样东西都可以单独拿出来写一本书。

以ETL流程为例,您需要将来自不同数据库、不同服务器的不同业务日志的原始数据规范化为相同的格式。您需要在分隔符上达成一致,然后将其导入分布式文件系统hdfs。甚至您需要定义业务系统的数据格式来制定规范。在数据收集之后,您还可以获得中间表、数据过滤、统一格式、统一ID和维度。度统一,通过不同的数据现象来执行数据,完成后,你会得到一些数据,如日报和周报,这时你需要根据需要将数据组织成一定的格式,然后引导mysql或hbase等。

总之,您只需要收集、处理和导入和导出各种数据。

但是这些数据仓库非常简单,ETL工程师有太多的空间可以玩。

1、通常,boss–>bi–>etl会给出报告。商务智能可以直接计算中间的数据吗?SQL太复杂了,所以你能标记所有数据吗,BI,甚至老板可以选择他想要的任何东西?
2、ETL工程师可以自动化数据收集、标准化业务日志格式和配置所有内容,但这些都基于N+1。这就是说,今天发生的事明天一定要看。有没有一个系统可以使数据分析实时或准实时?提到双十一屏幕,只有当Ma在12号到达时,他才能知道他已经做了多少交易而不拆分这些数据。
3、目前,大多数分析系统都是基于离线计算(hadoop/odps)。这里有个问题。如果您希望在Operation或BI中看到数据,则必须先放慢脱机速度,然后才能看到它。是否有一个系统可以支持您使用任何更大的数据量和更复杂的逻辑以毫秒为单位生成数据?
我没有提到算法工程师,大数据操作工程师等等。数据仓库的概念非常广泛,但在面对大型数据应用时却不值得一提。

如果我们对数据的价值进行分层,有很多方法可以进行分层。我只列出一种方法,有些人有五个等级。

第一层:为老板提供决策支持,如传统的财务报表
第二层:为运营提供决策支持,如淘宝运营商,这些运营商完全数字化。
第三层:为产品提供支持。例如,产品经理每天都会在报告中查看其中一个按钮的位置。
第四层:生产数据,如直接对接广告系统产生收入,如直接对接推荐系统为用户推荐产品,实现数千人,然后,例如,使用移动应用直接推送不同用户的消息。
第五层:大数据交换,直接受益于数据生成
大多数公司都能达到前两个层次已经很好了,如果能达到第三个层次,就已经很有说服力了,要达到第四和第五个层次,国内互联网公司不超过2家,大数据应用太大了。

原文地址:http://blog.51cto.com/14189799/2347733

时间: 2024-11-06 16:57:21

数据仓库工程师、大数据开发工程师、BI工程师、ETL工程师之间有什么区别?的相关文章

月薪30-50K的大数据开发工程师们,他们背后是如何学习的

推荐一个大数据学习群 119599574晚上20:10都有一节[免费的]大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享, 这两天小编去了解了下大数据开发相关职位的薪资,主要有hadoop工程师,数据挖掘工程师.大数据算法工程师等,从平均薪资来看,目前大数据相关岗位的月薪均在2万以上,随着项目经验的增长工资会越来越高. 那么对于新手来说,应该如何开始学习,才能够早日的实现月薪2万多的目标.就小编了解的来说,新手一般需要一年以上的时间才能够达

做了五年大数据开发工程师总结的的大数据学习路线

先扯一下大数据的4V特征: 数据量大,TB->PB 数据类型繁多,结构化.非结构化文本.日志.视频.图片.地理位置等: 商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来: 处理时效性高,海量数据的处理需求不再局限在离线计算当中. 现如今,正式为了应对大数据的这几个特点,开源的大数据框架越来越多,越来越强,先列举一些常见的: 文件存储:Hadoop HDFS.Tachyon.KFS 离线计算:Hadoop MapReduce.Spark 流式.实时计算:Storm

大数据开发初学者该怎么做?

经常有初学者在问,自己想往大数据方向发展,该学哪些技术,学习路线是什么样的,觉得大数据很火,就业很好,薪资很高.如果自己很迷茫,为了这些原因想往大数据方向发展,也可以,那么我就想问一下,你的专业是什么,对于计算机/软件,你的兴趣是什么?是计算机专业,对操作系统.硬件.网络.服务器感兴趣?是软件专业,对软件开发.编程.写代码感兴趣?还是数学.统计学专业,对数据和数字特别感兴趣.. 其实这就是想告诉你的大数据的三个发展方向,平台搭建/优化/运维/监控.大数据开发/设计/架构.数据分析/挖掘.请不要问

离线和实时大数据开发实战

离线和实时大数据开发实战 目 录 前言 第一篇 数据大图和数据平台大图 第1章 数据大图 2 1.1 数据流程 2 1.1.1 数据产生 3 1.1.2 数据采集和传输 5 1.1.3 数据存储处理 6 1.1.4 数据应用 7 1.2 数据技术 8 1.2.1 数据采集传输主要技术 9 1.2.2 数据处理主要技术 10 1.2.3 数据存储主要技术 12 1.2.4 数据应用主要技术 13 1.3 数据相关从业者和角色 14 1.3.1 数据平台开发.运维工程师 14 1.3.2 数据开发.

学习大数据必须了解的大数据开发课程大纲

大数据开发最核心的课程就是Hadoop框架,几乎可以说Hadoop就是大数据开发.这个框架就类似于Java应用开发的SSH/SSM框架,都是Apache基金会或者其他Java开源社区团体的能人牛人开发的贡献给大家使用的一种开源Java框架. Java语言是王道就是这个道理,Java的核心代码是开源的,是经过全球能人牛人共同学习共同研发共同检验的,所以说Java是最经得住检验的语言,而且任何人都可以学习Java核心技术并且使用核心技术开发出像android一样的系统和Hadoop一样的框架.如果把

大数据学习:hive篇,入门学习大数据开发

大数据开发之路漫漫其修远兮,吾将上下而求索.对于很多入门学习大数据开发的小伙伴,可能第一个接触到的,是我们的大数据领域的数据仓库工具hive.在大数据生态中,hive一般作为数据仓库来使用. Hive本身是不做数据存储的,它是构建在分布式存储系统HDFS之上,我们平常看到的表数据其实本质上来说还是HDFS的文件. Hive把这些HDFS数据文件,通过元数据规则映射为数据库的表,并且可以提供SQL操作的功能.Hive总体结构比较简单,总体有三个组件:用户接口.元数据系统.驱动器.用户通过用户接口来

大数据开发学习路线整理

参考博客:做了五年大数据开发工程师总结的的大数据学习路线 大数据的4V特征: 1.        数据量大,TB->PB 2.        数据类型繁多,结构化.非结构化文本.日志.视频.图片.地理位置等: 3.        商业价值高,但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来: 4.        处理时效性高,海量数据的处理需求不再局限在离线计算当中. 常见的大数据的开源框架: l  文件存储:Hadoop HDFS.Tachyon.KFS l  离线计算:

为什么要学习React,学习React在大数据开发上有什么好处

为什么要学习React,学习React在大数据开发上有什么好处 分享之前我还是要推荐下我自己创建的大数据学习资料分享群716581014,这是全国最大的大数据学习交流的地方,2000人聚集,不管你是小白还是大牛,小编我都挺欢迎,今天的源码已经上传到群文件,不定期分享干货,包括我自己整理的一份最新的适合2018年学习和零基础入门教程,欢迎初学和进阶中的小伙伴. 如何学习React 如果你是一个 React (或者前端) 新手, 出于以下的原因, 你可能会对这个生态圈感到困惑: React 的目标群

掌握Spark机器学习库 大数据开发技能更进一步 高清无密

掌握Spark机器学习库 大数据开发技能更进一步 "大数据时代"已经不是一个新鲜词汇了,随着技术的商业化推广,越来越多的大数据技术已经进入人们的生活.与此同时,大数据技术的相关岗位需求也越来越多,更多的同学希望向大数据方向转型.本课程主要讲解Spark机器学习库,侧重实践的讲解,同时也以浅显易懂的方式介绍机器学习算法的内在原理.学习本课程,可以为想要转型大数据工程师或是入行大数据工作的同学提供实践指导作用.欢迎感兴趣的小伙伴们一起来学习. 第1章 初识机器学习 在本章中将带领大家概要了