SQL存在已经有半个世纪的历史了,在今天它仍然被很多商业界所选用。其最主要原因是SQL的数据查询语言易操作。当SQL被建立在IBM上,他们的目标是创建一种能识别英语的语言。对于新用户来说,一旦你掌握了每个关键词的命令和意义,那么SQL会变得非常简单易读。
SQL允许更快和更容易的访问数据,而不是创建一个Python脚本或Excel电子表格。然而,经常被忽视的一个好处是,一旦你知道一个迭代的SQL,那么在捡起其他的迭代就变得微不足道,它打开了各种数据管理技术。接下来,我将在下文详细分析各个职位的好处和原因:产品经理、数据分析师、数据科学家和数据工程师。
产品经理
产品经理主要负责其产品的成功,并要了解用户与产品在各个领域的使用情况。但能够详细回答这些问题往往是很困难的一件事,我们常常必须要依靠数据分析师,才能得到这些答案。虽然有分析工具,如Mixpanel和谷歌分析,但这些不能捕获所有产品的相关细节。因此,学习SQL会让你花最少的开销,获得更多的关于产品的一些细节。
数据分析师
许多数据分析师最初使用Excel进行数据管理和分析。这绝对是没错的,因为Excel比SQL迭代分析更加灵活。Excel在可伸缩性领域中表现的并不擅长。而所有的Excel的用户都会遇到可伸缩性的问题,并且当遇到较大的CSV文件时,容易导致Excel的崩溃。那么,当使用SQL后,你就不必担心伸缩性问题了,并且你将有能力分析比以前更大的数据集。
数据科学家
数据科学家花90%的时间来清理数据和10%的时间分析数据。数据科学家最大的问题不是算法或缺乏领域知识,而是需要快速获得干净的数据。新的数据科学家,特别是有计算机科学背景的,更倾向于使用多种脚本语言来获取和处理数据。这种方法往往比使用专门为数据访问和操作的工具使用起来更加繁琐、费时、易碎。学习SQL,让你成为更加自力更生的数据科学家,并允许你扩大可访问数据源的范围以及它可以更轻松的迭代。
数据工程师
数据工程师是每个数据管道的骨干。他们在每个数据管道中进行对数据的收集、摄取、存储、加工,他们好比是建筑师、建设者和维护者。数据工程师担负着所有的繁重工作,让其他人都能安全、高效的访问数据。对于工程师来说,掌握SQL是非常有必要的,因为关系和分析数据库与SQL接口将继续成为最受欢迎的。MySQL、PostgreSQL、Redshift、BigQuery、DashDB 和Hive都属于这一类。不同于其他三组,数据工程师不仅需要掌握写查询,他们还需要知道如何通过SQL来管理数据库。由于数据工程师往往被看做系统专家,所以还需要知道如何优化查询性能。