几年前,连研究人员都不愿使用DNA来存储数据,觉得这么做太超前了,不具有任何实用价值。而在前不久,科学家宣称可以使用合适的软件和生化模块来扩展PostgreSQL,并在DNA上运行SQL,一时间关于大数据与生命科学的讨论甚嚣尘上。
对大多数人而言,DNA数据存储是一项非常神奇的技术。在自然界,亿万年来,各种生物都是利用DNA携带的遗传信息来保证物种的繁衍生息。其实早在上世纪60年代,就有科学家提出了利用DNA存储信息的想法。
而现在,生命科学大数据整个话题已经火了很长时间了,小编也一直关注这方面的动态,今年早些时候还有人宣布将16G的维基百科储存进了一个DNA分子,前不久有人说代谢分子也能存储数据,甚至有人提出用质谱的等等。虽说科学技术需要超前的想象力,但是科学也必须要正视任何现实,以及它所带来的一切影响与后果。
首先,很多人奇怪为什么要用DNA这种生物质来储存数据?
其实原因很简单,传统存储系统的存储能力和更新速率已经远远落后了,这么说可能很多人都没有概念,举个例子,大约30年后,也就是2040年左右,全球将产生3× 10²?的数据量。
这个数据有多大呢,大约等于3万亿个1TB的硬盘,这么说好像还不具体,假如这些硬盘中全部存放了5分钟一首的mp3音乐,那么全球70亿人一起昼夜不分地听这些音乐需要1000亿年才能听完。
可是按照现在传统存储系统的升级速度,30年后这些数据将无处容身,现在传统硬盘已经达到了超负载的状态下,我们庆幸还有云端可以存储海量数据,那么30年、50年后呢?
正是因为这个原因,很多人把目光聚集到了DNA这种生物化学质上,因为它足够稳定、足够庞大,在很多人眼中DNA就像是古老的神灵,质朴地如大自然一样神秘而强大,书本可能会消失、硬盘可能会消失、云端可能会消失,但是DNA不会,因此选择DNA作为数据存储的良性载体看上去是相当明智和有前途的。
此外, DNA 能作为信息载体,主要基于它这种聚合物的组合复杂性,在极端温度、压力和机械力的条件下,分子记忆比电子记忆更稳定,所以分子存储还可以让人们告别云储存,使离线存储大量数据成为可能,从而保护数据安全,不被黑客随意攻击。
生物存储很难做到吗?难点是什么?
前面已经提到,现在很多实验已经成功将数据存入到DNA中了,甚至有人将全本的古兰经储存在了自己的身体中,可见这种技术已经实现了从0到1的突破,但是它仍然面临着更加艰难的困境:
1、成本问题。制约科学技术发展和推动科学技术发展的都是成本问题,目前来说DNA存储的技术成本相当之大,其投入之多让很多机构都无法承担。就拿2002年完整基因组测序工作来说,当时集中了20个研究所的专家,利用这些研究所所配置的基础设施,经历13年,投入30亿美元获得了约30亿核苷酸序列。
基因测序
但是成本问题毕竟是与技术成熟程度相辅相成的,随着未来研究人员不断开发方法,处理大数据的量、速度和可变性方面的问题将不再受到成本的制约。
2、读写速度。目前来说不管是DNA的存储速率还是读写速率都不及普通的传统硬盘,说出来可能有人会大跌眼镜,只有4M每秒,也许有人会说这种速度连我家的网速都比不上,读写速率的话就更不用多说了,这也是现在DNA存储技术急需解决的问题。
但是有报道称,传统的 DNA 测序产品已经在生物技术市场上销售,可以读取 DNA 数据,这一全新的序列技术用例将有助于提高速度,其真实性就不得而知了。
3、准确率问题。目前科学家声称的DNA存储技术的数据准确率大约在99%,这个数字放在传统存储系统中也许无关紧要,但是如果是放在人体的DNA中就显得远远不够了。因为人们目前已知的人体内部DNA、信息遗传、分子代谢等问题不过是冰山一角,1%的数据差别也许会导致非常严重的后果。
无论是数据丢失还是数据差误,只要一旦有漏洞就足以引发人们巨浪一般的恐慌,更不要说未来的黑客也许会利用DNA数据技术对人体本身发起攻击,其后果已经是难以预估了。
回到问题,生命科学究竟能否带来新的数据革命?
答案是肯定的,但不是现在,也许是20年后,也许是50年后,也许是100年后,也许永远不会。
例如,DNA 数据已经被研究人员用作为分子识别,正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐,帮助科学家研究如何对抗耐药性和防止癌症转移。
例如,数据也许可能跟随DNA一起遗传给下一代,比如通过人造海马体完成了短时记忆向长期储存记忆的转换,这项技术可以完成对人脑记忆的备份,并复制到其他人的大脑中。
例如,这种DNA数据科学是否有可能实现“永生”的人类终极目标?原来信息竟然可以通过神经代代相传,加之这次 DNA 可以存储海量数据,不知道这是不是另一种「永生」的方式呢?
还有很多很多,留给人们想象的空间是无限的,不可否认的是生命科学也为数据发展带来了新的思路和空间,我们无法阻止这种趋势,我们唯一能做的,就是期待他们不会践踏人类不容侵犯的边界和底线。
原文地址:https://www.cnblogs.com/laoA188/p/11314423.html