行业牛人和开源软件改变技术世界

Google在很长一段时间里都是技术圈内的顶尖技术的代名词。外界也不清楚Google是怎么完成一些不可能完成的任务的。当年,大家光是想象Google怎么保存那些海量的索引,是怎么做到的都不知道。所以大家想象Google里面每个工程师都是百年一遇的大神吧。

直到后来,Jeff Dean的三篇论文Google File System,MapReduce和BigTable一发布,大家才注意到,原来Google有个Systems and Infrastructure Group,有个Jeff Dean大神。原来他们把处理海量数据的方法,写成了内部系统,Google的工程师,不需要是神,只要学会这套工具,就可以操纵海量的数据了。

但是,可惜的是,Jeff Dean和Google只开放了他们的思想,但是没开放内部工具出来。这时候,一个叫做Doug Cutting的大神站了出来。

Doug Cutting是Lucene的作者,他当年曾在多家公司做搜索,还曾经在Apple做过搜索,他觉得业界缺乏一个开源的好用的搜索引擎内核。他就写了Lucene,Lucene是现在广泛使用的Elastic Search的内核。可以说,现在你在全世界的很多网站内点搜索,都是Lucene在支撑。仅当年我们创业的时候,因为我们在用Lucene,所以,我们的客户跑在Lucene上的搜索量就有几千万。

Doug Cutting把Jeff Dean的思想实现了出来,做了一个开源软件叫做Hadoop。Hadoop兴起后,其实分析处理海量数据,就变成了一个人人都可以做的事情(买得起机器就可以),从而产生了一场大数据的革命。

我举这个例子什么意思?就是Google很牛逼,Google在04-5年就有能力非常高效的分析处理海量数据。在那个时间点,能做Google量级的事情的人没有几个,这是非常有技术含量的。但是Jeff Dean一公布具体思想,这个技术含量就骤减。但是,仍旧是很有技术含量的。等到Doug Cutting把Hadoop做出来,分析处理海量数据的门槛实际上就降低到了会编译和搭建这个Java开源项目就可以了。

当然,有一些领域内的东西,即使有了开源软件,由于你对领域知识的匮乏,你仍旧很难高效的开发。比如Lucene,非常好用,但是Lucene是一个底层引擎,如果你对倒排索引的各种细节不够清楚,你直接用Lucene开发出好用的搜索是很难得。所以,当时我做了一个Cypress系统,用XML/HTTP请求把Lucene完全封装起来,用户不用懂倒排索引的任何细节就可以用好搜索了。后来流行的Elastic Search,跟我的设计思路如出一辙,唯一的区别是,他用JSON来做数据传输的格式,我用XML。一般团队使用Lucene,可能需要几个月才能做一个可用的搜索,用Cypress或者Elastic Search,一天就够了。

在这些牛人和开源工具的作用下,很多原来无比高大上,也没有几个人可以做的领域,很快就变成了随便一个工程师都可以学会的东西。

实际上,中国的大多数技术公司,核心还是业务,而不是技术,技术的价值在于良好的保障业务。公司真正赚钱是靠业务。美国呢,大公司里面技术比重更高的公司要多一些。但是,也有大量的公司,核心业务并不是技术本身。

在这样公司里面实现业务逻辑的工程师是主流。他们虽然非常重要,但是他们做的事情,价值不是技术含量,而是能不能完美的满足业务需求。

作者:郝培强
链接:https://zhuanlan.zhihu.com/p/22646254

来自为知笔记(Wiz)

时间: 2024-12-25 09:02:27

行业牛人和开源软件改变技术世界的相关文章

Twitter背后用到了哪些开源软件与技术?

如果没有开源软件,Twitter将不会存在.你发送和接收的每一个Tweet在移动端和PC端发送的过程中,都会需要开源软件.我们非常好奇Twitter使用了多少开源软件.除此之外,我们想要知道开源对Twitter公司的文化产生了什么影响. 我们采访了Twitter公司主管开源的Manager Chris Aniszczyk,来和我们大家分享Twitter的开源故事.Aniszczxk将会在本月的LinuxCon(8月29日至31日,在San Diego,CA)上做主题演讲: The open so

开源软件之七宗罪以及背后的阴谋

开源软件之七宗罪以及背后的阴谋 jopen 2012-10-29 11:31:22 ? 发布 摘要:我们每天使用着大量的开源软件,我们歌颂她赞美她.当有人站出来说一句开源不好 肯定会激起N多人站出来批评.然后给你列举出N多开源的好处和闭源的坏处. 我们每天使用着大量的开源软件,我们歌颂她赞美她.当有人站出来说一句开源不好 肯定会激起N多人站出来批评.然后给你列举出N多开源的好处和闭源的坏处. 首先我不反对开源,本文只是无聊时候的自己一点思考.想喷的各位请看完再喷.谢谢 自从开源运动发起以后.各种

阿里的开源思想:与世界讨论中国的互联网技术与场景

自从2015年11月阿里巴巴集团宣布正式加入Apache基金会以来,阿里技术已经向Apache捐赠了三个开源项目,分别是JStorm.RocketMQ和Weex.其中Weex于2016年12月15日正式捐赠给Apache基金会.而RocektMQ有望成为首个来自中国的Apache互联网中间件顶级子项目,Weex则有望成为来自中国的移动开发顶级子项目. 截止到2016年9月,阿里已经开源115个项目,加入了FSF基金会.Apache基金会.Linux 基金会和Xen顾问团队.阿里云还是MySQL开

软件生产线技术、开源软件声明、源码下载地址

软件生产线指生产软件的软件,先利用建模工具软件用图解的形式给出应用系统的系统模型,之后自动生成应用系统可执行程序,自动完成建立应用系统的工作.它能有效提高应用系统开发效率,减少软件开发成本,提高软件设计质量,实现软件设计规范化与标准化,降低系统维保费用,是实现软件工业化生产的基础之一. 管理信息系统软件生产线3.0版内容包括:软件生产线建模工具.数据库桌面系统.管理信息系统软部件库三部分内容. 软件生产线建模工具模型图包括用例图.数据结构部件图.系统结构部件图.组件图.时序图. 用例图用于需求分

关于开源软件和闭源软件我个人Naive的看法

对开源软件来个可能会引发争议的观点:对于绝大多数的软件产品来说,1)闭源的软件产品的技术含量要比开源的要大得多.2)大多数的开源软件都在抄闭源的商用软件. 我来回答我制造的话题. 首先,我先表达一下开源软件的伟大,并向开源的人们致于我最真诚的敬意.但,即使这样,我们也要很客观的承认大多数开源软件是存在大量问题的.就像我这个人主观上并不喜欢微软和IBM,但是我必需要承认,没有微软和IBM,计算机这个行业不会有今天这样的爆炸.(插曲:我94年上大学选的专业是计算机科学,当时很多人都觉得计算机专业是一

100款开源软件

不知道这些你就OUT了!100款开源软件 好的软件可以极大提高工作效率,完成一些不可能完成工作.然而我们也常常为选择哪款软件而头疼,本次为大家推出的100款软件都是经过整理分类的,而且最重要的是100款软件都是开源免费且使用于Linux环境下,大部分都可以直接从官网上下载使用.如果你完全没有接触过以下我介绍的这100款软件,我只能说一句你OUT了! 图:100款软件分类图 接下来将要介绍的100款开源应用程序,是我花了很多时间为大家整理的,这些软件对大家来说是很有用的.我希望通过这100款软件告

关于软件开发人员如何提高自己的软件专业技术方面的具体建议

“又是一年毕业时”,看到一批批学子离开人生的象牙塔,走上各自的工作岗位:想想自己也曾经意气风发.踌躇满志,不觉感叹万千……本文是自己工作6年的经历沉淀或者经验提炼,希望对所有的软件工程师们有所帮助,早日实现自己的人生目标.本文主要是关于软件开发人员如何提高自己的软件专业技术方面的具体建议,前面几点旨在确定大的方向,算是废话吧.谨以此文献给那个自己为你奉献3年青春与激情的开发团队.还有团队成员:PPL.YT.YK .TYF.LGL.CHL.CDY.CB.DPD. 1. 分享第一条经验:“学历代表过

2014 年最热门的国人开发开源软件 TOP 100

不知道从什么时候开始,很多一说起国产好像就非常愤慨,其实大可不必.做开源中国六年有余,这六年时间国内的开源蓬勃发展,从一开始的使用到贡献,到推出自己很多的开源软件,而且还有很多软件被国外的认可.中国是开源不可忽视的力量. 而我们这个榜单也是从这些国人开发.主要参与开发或者基于国外开源软件进行改进并形成独立版本的软件中,根据该软件的访问.收藏.下载等多个角度,从而得出前 100 名最受欢迎的开源软件.我们所评选出来的软件并非同类型,尽管放在一起不是很科学,但我们仍希望通过我们的视角让大家对国内一些

2014 年最热门的国人开发开源软件 TOP 100 - 开源中国社区

不知道从什么时候开始,很多一说起国产好像就非常愤慨,其实大可不必.做开源中国六年有余,这六年时间国内的开源蓬勃发展,从一开始的使用到贡献,到推出自己很多的开源软件,而且还有很多软件被国外的认可.中国是开源不可忽视的力量. 而我们这个榜单也是从这些国人开发.主要参与开发或者基于国外开源软件进行改进并形成独立版本的软件中,根据该软件的访问.收藏.下载等多个角度,从而得出前 100 名最受欢迎的开源软件.我们所评选出来的软件并非同类型,尽管放在一起不是很科学,但我们仍希望通过我们的视角让大家对国内一些