大数据有多可怕？科学家成功在DNA上编写sql，或能实现永生

几年前，连研究人员都不愿使用DNA来存储数据，觉得这么做太超前了，不具有任何实用价值。而在前不久，科学家宣称可以使用合适的软件和生化模块来扩展PostgreSQL，并在DNA上运行SQL，一时间关于大数据与生命科学的讨论甚嚣尘上。

对大多数人而言，DNA数据存储是一项非常神奇的技术。在自然界，亿万年来，各种生物都是利用DNA携带的遗传信息来保证物种的繁衍生息。其实早在上世纪60年代，就有科学家提出了利用DNA存储信息的想法。

而现在，生命科学大数据整个话题已经火了很长时间了，小编也一直关注这方面的动态，今年早些时候还有人宣布将16G的维基百科储存进了一个DNA分子，前不久有人说代谢分子也能存储数据，甚至有人提出用质谱的等等。虽说科学技术需要超前的想象力，但是科学也必须要正视任何现实，以及它所带来的一切影响与后果。

首先，很多人奇怪为什么要用DNA这种生物质来储存数据？

其实原因很简单，传统存储系统的存储能力和更新速率已经远远落后了，这么说可能很多人都没有概念，举个例子，大约30年后，也就是2040年左右，全球将产生3× 10²?的数据量。

这个数据有多大呢，大约等于3万亿个1TB的硬盘，这么说好像还不具体，假如这些硬盘中全部存放了5分钟一首的mp3音乐，那么全球70亿人一起昼夜不分地听这些音乐需要1000亿年才能听完。

可是按照现在传统存储系统的升级速度，30年后这些数据将无处容身，现在传统硬盘已经达到了超负载的状态下，我们庆幸还有云端可以存储海量数据，那么30年、50年后呢？

正是因为这个原因，很多人把目光聚集到了DNA这种生物化学质上，因为它足够稳定、足够庞大，在很多人眼中DNA就像是古老的神灵，质朴地如大自然一样神秘而强大，书本可能会消失、硬盘可能会消失、云端可能会消失，但是DNA不会，因此选择DNA作为数据存储的良性载体看上去是相当明智和有前途的。

此外， DNA 能作为信息载体，主要基于它这种聚合物的组合复杂性，在极端温度、压力和机械力的条件下，分子记忆比电子记忆更稳定，所以分子存储还可以让人们告别云储存，使离线存储大量数据成为可能，从而保护数据安全，不被黑客随意攻击。

生物存储很难做到吗？难点是什么？

前面已经提到，现在很多实验已经成功将数据存入到DNA中了，甚至有人将全本的古兰经储存在了自己的身体中，可见这种技术已经实现了从0到1的突破，但是它仍然面临着更加艰难的困境：

1、成本问题。制约科学技术发展和推动科学技术发展的都是成本问题，目前来说DNA存储的技术成本相当之大，其投入之多让很多机构都无法承担。就拿2002年完整基因组测序工作来说，当时集中了20个研究所的专家，利用这些研究所所配置的基础设施，经历13年，投入30亿美元获得了约30亿核苷酸序列。

基因测序

但是成本问题毕竟是与技术成熟程度相辅相成的，随着未来研究人员不断开发方法，处理大数据的量、速度和可变性方面的问题将不再受到成本的制约。

2、读写速度。目前来说不管是DNA的存储速率还是读写速率都不及普通的传统硬盘，说出来可能有人会大跌眼镜，只有4M每秒，也许有人会说这种速度连我家的网速都比不上，读写速率的话就更不用多说了，这也是现在DNA存储技术急需解决的问题。

但是有报道称，传统的 DNA 测序产品已经在生物技术市场上销售，可以读取 DNA 数据，这一全新的序列技术用例将有助于提高速度，其真实性就不得而知了。

3、准确率问题。目前科学家声称的DNA存储技术的数据准确率大约在99%，这个数字放在传统存储系统中也许无关紧要，但是如果是放在人体的DNA中就显得远远不够了。因为人们目前已知的人体内部DNA、信息遗传、分子代谢等问题不过是冰山一角，1%的数据差别也许会导致非常严重的后果。

无论是数据丢失还是数据差误，只要一旦有漏洞就足以引发人们巨浪一般的恐慌，更不要说未来的黑客也许会利用DNA数据技术对人体本身发起攻击，其后果已经是难以预估了。

回到问题，生命科学究竟能否带来新的数据革命？

答案是肯定的，但不是现在，也许是20年后，也许是50年后，也许是100年后，也许永远不会。

例如，DNA 数据已经被研究人员用作为分子识别，正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐，帮助科学家研究如何对抗耐药性和防止癌症转移。

例如，数据也许可能跟随DNA一起遗传给下一代，比如通过人造海马体完成了短时记忆向长期储存记忆的转换，这项技术可以完成对人脑记忆的备份，并复制到其他人的大脑中。

例如，这种DNA数据科学是否有可能实现“永生”的人类终极目标？原来信息竟然可以通过神经代代相传，加之这次 DNA 可以存储海量数据，不知道这是不是另一种「永生」的方式呢？

还有很多很多，留给人们想象的空间是无限的，不可否认的是生命科学也为数据发展带来了新的思路和空间，我们无法阻止这种趋势，我们唯一能做的，就是期待他们不会践踏人类不容侵犯的边界和底线。

原文地址：https://www.cnblogs.com/laoA188/p/11314423.html

时间： 2024-11-04 02:32:16

大数据有多可怕？科学家成功在DNA上编写sql，或能实现永生

首先，很多人奇怪为什么要用DNA这种生物质来储存数据？

生物存储很难做到吗？难点是什么？

回到问题，生命科学究竟能否带来新的数据革命？

大数据有多可怕？科学家成功在DNA上编写sql，或能实现永生的相关文章

告诉你：阿里巴巴的大数据有多可怕？

大数据学习之HDFS基本API操作（上）06

大数据：Spark Core（二）Driver上的Task的生成、分配、调度

数据自生长机制：数博会揭示大数据成功的新逻辑

论大数据的十大局限

chinacloud大数据新闻

Hadoop！ | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

2016——大数据版图

大数据Hadoop生态圈：Pig和Hive