大数据有多可怕?科学家成功在DNA上编写sql,或能实现永生

几年前,连研究人员都不愿使用DNA来存储数据,觉得这么做太超前了,不具有任何实用价值。而在前不久,科学家宣称可以使用合适的软件和生化模块来扩展PostgreSQL,并在DNA上运行SQL,一时间关于大数据与生命科学的讨论甚嚣尘上。

对大多数人而言,DNA数据存储是一项非常神奇的技术。在自然界,亿万年来,各种生物都是利用DNA携带的遗传信息来保证物种的繁衍生息。其实早在上世纪60年代,就有科学家提出了利用DNA存储信息的想法。

而现在,生命科学大数据整个话题已经火了很长时间了,小编也一直关注这方面的动态,今年早些时候还有人宣布将16G的维基百科储存进了一个DNA分子,前不久有人说代谢分子也能存储数据,甚至有人提出用质谱的等等。虽说科学技术需要超前的想象力,但是科学也必须要正视任何现实,以及它所带来的一切影响与后果。

首先,很多人奇怪为什么要用DNA这种生物质来储存数据?

其实原因很简单,传统存储系统的存储能力和更新速率已经远远落后了,这么说可能很多人都没有概念,举个例子,大约30年后,也就是2040年左右,全球将产生3× 10²?的数据量。

这个数据有多大呢,大约等于3万亿个1TB的硬盘,这么说好像还不具体,假如这些硬盘中全部存放了5分钟一首的mp3音乐,那么全球70亿人一起昼夜不分地听这些音乐需要1000亿年才能听完

可是按照现在传统存储系统的升级速度,30年后这些数据将无处容身,现在传统硬盘已经达到了超负载的状态下,我们庆幸还有云端可以存储海量数据,那么30年、50年后呢?

正是因为这个原因,很多人把目光聚集到了DNA这种生物化学质上,因为它足够稳定、足够庞大,在很多人眼中DNA就像是古老的神灵,质朴地如大自然一样神秘而强大,书本可能会消失、硬盘可能会消失、云端可能会消失,但是DNA不会,因此选择DNA作为数据存储的良性载体看上去是相当明智和有前途的。

此外, DNA 能作为信息载体,主要基于它这种聚合物的组合复杂性,在极端温度、压力和机械力的条件下,分子记忆比电子记忆更稳定,所以分子存储还可以让人们告别云储存,使离线存储大量数据成为可能,从而保护数据安全,不被黑客随意攻击。

生物存储很难做到吗?难点是什么?

前面已经提到,现在很多实验已经成功将数据存入到DNA中了,甚至有人将全本的古兰经储存在了自己的身体中,可见这种技术已经实现了从0到1的突破,但是它仍然面临着更加艰难的困境:

1、成本问题。制约科学技术发展和推动科学技术发展的都是成本问题,目前来说DNA存储的技术成本相当之大,其投入之多让很多机构都无法承担。就拿2002年完整基因组测序工作来说,当时集中了20个研究所的专家,利用这些研究所所配置的基础设施,经历13年,投入30亿美元获得了约30亿核苷酸序列。

基因测序

但是成本问题毕竟是与技术成熟程度相辅相成的,随着未来研究人员不断开发方法,处理大数据的量、速度和可变性方面的问题将不再受到成本的制约。

2、读写速度。目前来说不管是DNA的存储速率还是读写速率都不及普通的传统硬盘,说出来可能有人会大跌眼镜,只有4M每秒,也许有人会说这种速度连我家的网速都比不上,读写速率的话就更不用多说了,这也是现在DNA存储技术急需解决的问题。

但是有报道称,传统的 DNA 测序产品已经在生物技术市场上销售,可以读取 DNA 数据,这一全新的序列技术用例将有助于提高速度,其真实性就不得而知了。

3、准确率问题。目前科学家声称的DNA存储技术的数据准确率大约在99%,这个数字放在传统存储系统中也许无关紧要,但是如果是放在人体的DNA中就显得远远不够了。因为人们目前已知的人体内部DNA、信息遗传、分子代谢等问题不过是冰山一角,1%的数据差别也许会导致非常严重的后果。

无论是数据丢失还是数据差误,只要一旦有漏洞就足以引发人们巨浪一般的恐慌,更不要说未来的黑客也许会利用DNA数据技术对人体本身发起攻击,其后果已经是难以预估了。

回到问题,生命科学究竟能否带来新的数据革命?

答案是肯定的,但不是现在,也许是20年后,也许是50年后,也许是100年后,也许永远不会。

例如,DNA 数据已经被研究人员用作为分子识别,正被用于大大加快化学工程、材料科学和纳米技术等领域的研究步伐,帮助科学家研究如何对抗耐药性和防止癌症转移。

例如,数据也许可能跟随DNA一起遗传给下一代,比如通过人造海马体完成了短时记忆向长期储存记忆的转换,这项技术可以完成对人脑记忆的备份,并复制到其他人的大脑中。

例如,这种DNA数据科学是否有可能实现“永生”的人类终极目标?原来信息竟然可以通过神经代代相传,加之这次 DNA 可以存储海量数据,不知道这是不是另一种「永生」的方式呢?

还有很多很多,留给人们想象的空间是无限的,不可否认的是生命科学也为数据发展带来了新的思路和空间,我们无法阻止这种趋势,我们唯一能做的,就是期待他们不会践踏人类不容侵犯的边界和底线。

原文地址:https://www.cnblogs.com/laoA188/p/11314423.html

时间: 2024-08-27 00:53:14

大数据有多可怕?科学家成功在DNA上编写sql,或能实现永生的相关文章

告诉你:阿里巴巴的大数据有多可怕?

阿里巴巴在纽交所的成功上市,引发了互联网对阿里及马云的赞誉狂潮.而关于阿里的股权结构及其外企身份的讨论,则成为这场舆论狂欢中的一种异样的音调. 作为一位公共管理的研究者,我更喜欢从公共管理的视角来审视阿里巴巴的成长.在此,我只想谈一个问题:从国家的信息安全的角度看,阿里的大数据有多可怕. 先讲一个发生在美国的真实的故事:几年前,一个美国家庭收到了一家商场投送的关于孕妇用品的促销劵,由于很明显促销劵是冲着这个家庭中的那位16岁 女孩来的,女孩的父亲觉得受到了侮辱,于是怒气冲冲地找到了这家商场讨说法

大数据学习之HDFS基本API操作(上)06

1 package it.dawn.HDFSPra; 2 3 import java.io.FileNotFoundException; 4 import java.io.IOException; 5 import java.net.URI; 6 import java.net.URISyntaxException; 7 import java.util.Arrays; 8 9 import org.apache.hadoop.conf.Configuration; 10 import org.

大数据:Spark Core(二)Driver上的Task的生成、分配、调度

1. 什么是Task? 在前面的章节里描述过几个角色,Driver(Client),Master,Worker(Executor),Driver会提交Application到Master进行Worker上的Executor上的调度,显然这些都不是Task. Spark上的几个关系可以这样理解: Application: Application是Driver在构建SparkContent的上下文的时候创建的,就像申报员,现在要构建一个能完成任务的集群,需要申报的是这次需要多少个Executor(可

数据自生长机制:数博会揭示大数据成功的新逻辑

在大数据领域,我国已经出现4家估值超过100亿美元的超级独角兽企业,分别是蚂蚁金服(估值750亿美元).滴滴出行(估值500亿美元).美团点评(估值178.8亿美元).今日头条(估值103亿美元),4家估值之和占我国大数据独角兽总估值比例达到67.1%. 2017年5月27日,在贵阳数博会上,北京市长城企业战略研究所(简称"长城战略咨询")发布了<2016中国大数据独角兽企业发展报告>(简称<报告>).根据该<报告>,2016年中国大数据(准)独角兽

论大数据的十大局限

“忽如一夜春风来,千树万树梨花开”,似乎在一夜之间,大数据就红遍了南北半球,,大数据被神化得无处不在,无所不包,无所不能.这里面有认识上的原因,也有故意忽悠的成份.笔者以为,越是在热得发烫的时候,越是需要有人在旁边吹吹冷风.在这里谈大数据的十大局限性,并非要否定其价值.相反,只有我们充分认识了大数据的特点和优劣势,才能更加有效地对其进行采集.加工.应用,充分挖掘和发挥其价值.         1.数据噪声:与生俱来的不和谐 大数据之所以为大数据,首先是因为其数据体量巨大.然而,在这海量的数据中,

chinacloud大数据新闻

2015年大数据发展八大趋势   (0 篇回复) “数据很丰满,信息很骨感”:Sight Machine想用大数据的方法,打碎两者间的屏障   (0 篇回复) 百度携大数据"圈地"证券业 "BAT"开启互联网金融新战场   (0 篇回复) 码农的春天到了?   (0 篇回复) 浪潮大数据一体机出招 装备科研“最强大脑”   (0 篇回复) 方物软件承担国家“核高基”重大专项研发   (2 篇回复) 2013互联网大会透露的热点与新趋势   (1 篇回复) 大数据从幕

Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户

你正在使用过时的浏览器,Amaze UI 暂不支持. 请 升级浏览器 以获得更好的体验! 深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 “昔我十年前,与君始相识.” 一瞬间Hadoop也到了要初中择校的年龄了. 十年前还没有Hadoop,几年前国内IT圈里还不知道什么是Hadoop,而现在几乎所有大型企业的IT系统中有已经有了Hadoop的集群在运行了各式各样的任务. 2006年项目成立的一开始,“Hadoop”这个单

2016——大数据版图

编者注:原文是 FirstMark Capital 的 Matt Turck 的文章.本文全面总结了大数据领域的发展态势,分析觉得虽然大数据作为一个术语似乎已经过气.可是大数据分析与应用才刚刚開始兴起,在与 AI.人工智能等新兴技术的结合下,大数据的机会或许要比大家想象的还要大.2016年 大数据版图高清版可到此处下载. 在喜新厌旧的技术初创企业界.已有 3年 历史 "大数据" 听起来似乎已经过气了. 尽管 Hadoop 在 2006年 已经出来.但 "大数据" 这

大数据Hadoop生态圈:Pig和Hive

前言 Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台. Pig为复杂的海量数据并行计算提供了一个简 易的操作和编程接口,这一点和FaceBook开源的Hive一样简洁,清晰,易上手! 一.Pig概述 Pig包括 两部分 1:用于描述数据流的语言,称为 Pig Latin (拉丁猪,个人翻译) 2:用于运行PigLatin程序的 执行环境 .一个是 本地 的单