原文链接:http://highscalability.com/blog/2014/7/2/why-does-data-need-to-have-sex.html
--------------------------------------------------------------------------------------------------------------------------------------
数据需要具备和其他数据以全新的方式进行合并的能力才能达到其最大价值。从这个意义上讲,数据需要做爱。
这就是我为什么在前一篇文章的标题“数据不需要自由,但需要做爱”中用到了“做爱”这个词。我并不是想做一个标题党。
性是将不同数据集(基因组)合并在一起的最自然的方式。并以此创造一个在不断变化环境中有可能生存下来的新事物。
当前,数据被封锁在围墙高筑的花园中,因而不能发挥出他们本来的作用。我们该怎样将数据从围墙后面“哄骗”出来呢?答:用钱!这就是为什么我之前说“数据并不需要自由”。那我们怎么赚钱呢?答:通过市场!那我们又能给市场带来什么新产品?答:数据!将不断产生的数据转变为产品的服务需要什么呢?答:钱!
你看,这不就是一个循环么。服务通过它们和用户的关系产生了数据。这些数据可以出售赚钱从而盈利来继续维持这样的服务。而这样的服务又可以产生更多的数据。
那为什么我们需要在乎数据需不需要做爱呢?
让我们回头看看历史吧,我们会发现几乎所有的事情都和资源如何在不同的年代被开发利用相关。整个人类史的发展几乎都被资源的搜索和开发所决定。在这些周期中,人类发掘了大量的财富。当时每当一个资源衰竭的时候,人们就去寻找新的资源。而当这个又快用光的时候,他们又会去寻找新的资源直到他们找到一个可以维持生存的新的地方。
而这些和用光了的资源相关的就地方很快就衰落了。作为一个旅行者,我曾经注意到曾经由于资源带来繁华的地带最后只能依赖旅游业来发展了。
数据也和历史上的其他资源一样,尽管当前数据还不被看做是一种资源。这种情况看起来就像渔民们动用船和堡垒费劲千辛万苦来捕鱼,但是他们不将这些鱼放在开放市场上销售。这显然将限制财富的产生,但是如果这些东西统统都作为巨大价值链的一部分进入市场的话,大量的人将过上体面的生活。
如果我们将数据看做资源池,由于自然资源就要耗尽了,我们具有能力切换到这种非自然资源来继续人类史上的资源勘探的大循环。
这会起作用么?我也不知道,但是这种想法是值得探索的。
为什么数据需要做爱