鄂维南院士谈大数据:市场非理性、活动多信息量少

“我们的市场是无理性的发展。现在开的会非常多、新闻非常多,新闻里面真正的信息量非常少,整个市场的发展是非理性的。”这是北京大数据研究院院长、中科院院士、北京大学教授鄂维南在2016中关村大数据日活动暨京津冀大数据协同发展高峰论坛对当前中国大数据行业特点所谈到观点。

2016年12月12日,2016中关村大数据日活动暨京津冀大数据协同发展高峰论坛在中关村国家自主创新示范区展示中心会议中心召开。本次活动以“数据驱动创新、智慧引领未来”为主题,聚焦京津冀大数据协同发展,近千名大数据领域的企业领袖、业界专家、知名学者等齐聚一堂,共话京津冀在大数据产业的快速发展。

鄂维南院士在发言中指出中国大数据行业现在有五大特点。除了市场无理性发展外,其它特点还包括:大数据得到从政府部门到企业界的全社会各级的重视,鄂维南笑称“连我妈打电话给我的时候都问大数据做得怎么样了”;大数据市场非常大,需求大、空间大;最困难的大数据问题在中国,但这也是科研人员非常好的条件,“不需要看人家的问题,把自己问题解决好了,我们的科研创新也就走在最前面”;人才非常紧缺,科研队伍整体来说相对落后,大数据算法人才非常少,理念跟不上等等。

在谈到北京发展大数据的优势时,鄂维南院士认为北京有非常好的人才基础、企业基础和市场基础。在人才基础方面,尽管现有的大数据人才非常少,但北京有很好的数学、计算机、统计教学教育基础,以及北大、清华、北工、首经贸等院校,可以把相关人才很快引导到大数据领域。鄂维南院士以二次大战为例,在二战前美国战斗机无法与日本战斗机相比,但美国有很好的工业基础,在下决心参与二战后就很快可以利用雄厚的工业基础转换过来。类似的,虽然现有大数据人才不多,但是可以把其它已有的数学、计算机、统计等等相关学科人才快速转变过来。

当然,现实中还存在不少问题。首先是大数据领域科研创新的动力不足。这体现在:科研人员不落地现象比较严重,仅发表学术论文无法对社会对经济发展起到真正的作用;科研人员倾向于什么事情都自己做,这样只能做小项目,思维不开阔;缺乏有效的产学研基础,现有的机制效率远远不够。其次是人才聚集、人才培养远不能满足需求。特别是从人才聚集的角度来说,在中国做大数据必须要瞄准一流的人才,但现在引进一流的人才比较困难,而在体制内培养学生、人才,也有很多固有的限制。第三是缺乏引领性的组织机构,比如缺乏具有责任感的企业和具有号召力及实际能力的龙头企业和研究机构,能够为整个中国的大数据发展做筹划。第四是缺乏有效的产学研合作模式。

那么如何利用大数据行业和北京的特点优势,尽快使北京成为国际大数据领域的引领者之一?北京大数据研究院就是用体制创新和机制创新来应对这个挑战。作为独立的法人单位,北京大数据研究院成立于2015年8月27日,由中关村管委会、海淀区政府、北京大学、北京工业大学四方共同筹建。北京大数据研究院是国内首个整合了政府、大学和市场三方面资源的大数据研究机构,目标是吸引国际一流大数据研究人员来京发展,用五到十年的时间建成国际一流的大数据人才培养、科研创新和产业化平台,成为中国乃至世界大数据产业发展的一面旗帜。

北京大数据研究院将发挥北京大学和北京工业大学在数学、统计、计算机科学等基础领域以及金融、交通、生物医疗等应用领域的研究优势,进行人才培养与科学研究。同时,成立股份制的技术成果转化中心,围绕金融、交通、医疗、移动互联网等各行业大数据应用需求,与各企业共同开展大数据共性关键技术研发、行业大数据分析和成果转化。另外还将建立纯市场化的大数据创业企业孵化机制和载体,与大数据领军企业、知名创业投资机构合作,支持研究院的应用技术研发人员带着研发成果创业,培育一批大数据领域技术创新型企业。

在培养大数据人才方面,人民大学、北京大学、中国科学院大学、中央财经大学、首都经济贸易大学五所高校于2014年5月联合成立了大数据分析硕士培养协同创新平台,并与政府部门和产业界签署合作协议,联合培养大数据分析应用型人才,首期实验班已经于2014年秋季开学。北京大数据协会会长、首都经贸大学大数据与统计科学研究院院长纪宏表示,该硕士实验班首届毕业生已经被企业一抢而空,第二届毕业生也已经全部被预订。北京大数据协会副会长、南开大学统计研究院副院长王兆军表示,大数据属于综合学科,涉及统计、运筹与优化、计算机以及各行业与产业知识,人才培养难度较大,目前属于探索阶段。

除了高校联合起来培养人才外,京津冀三地的产学研机构也联合起来加快大数据人才培养。在本次2016中关村大数据日活动暨京津冀大数据协同发展高峰论坛上成立的京津冀大数据产业协同创新平台,定位于促进京津冀大数据产学研协同创新的资源共享、监测评价和试点示范等,重点探索创新三地大数据人才联合培养、大数据人才引进、流动与共享、大数据人才创新创业等试点示范,为京津冀大数据产业发展提供人才与智力支撑,尤其是利用京津冀在人才和产业方面的优势,推动以科技创新为动力的大数据产业发展和学科建设。

在中关村管委会的指导支持下,京津冀大数据产业协同创新平台由北京大数据研究院发起成立,北京大学、清华大学、中国人民大学、北京工业大学、南开大学、天津大学、河北大学、河北工业大学等科研院校,京东、360、滴滴、亚信、普林科技等企业,中关村大数据产业联盟、北京软件和信息服务协会、天津市软件行业协会、河北省软件与信息服务协会等联盟协会联合成立。

本次2016中关村大数据日活动还发布了2016京津冀大数据产业地图。《京津冀大数据产业地图》由北京大数据研究院联合中关村大数据产业联盟、明略数据、网智天元和数据堂共同制作,首批收录了北京(779家)、天津(66家)和河北(21家)共866家京津冀大数据企业单位,展示了京津冀大数据在基础架构、数据资源、应用服务和支撑服务这四大产业链中的分布和企业名录。

本次活动上,北京大学时空大数据协同创新平台、方正信产大数据战略合作、中航工业电子采购平台大数据服务、北京供销大数据战略合作等项目正式签约,将有力推动京津冀大数据产业协同创新平台建设。(文/宁川,微信号:CloudTechTime)

时间: 2024-10-07 15:30:39

鄂维南院士谈大数据:市场非理性、活动多信息量少的相关文章

交易服务助力大数据产业生态系统完善 ——北京软件和信息服务交易所总裁胡才勇谈大数据产业生态系统建设

据有关预测,未来三年内,我国大数据市场将以每年超过60%的速度增长,预计到2017年市场规模将达到37.9亿美元.面对爆炸式增长的市场,面对不远处诱人的"大蛋糕",我国大数据产业生态系统是否做好了准备?目前,我们不得不担忧地看到:在整个大数据产业链条上,标准缺失!制度缺失!相关交易服务配套的缺失! 一个"赤裸裸的问题" 今年4月,国内大数据标准工作组刚刚组建,北京软件和信息服务交易所(以下简称"软交所")总裁胡才勇作为工作组的重要成员之一参与了大

浅谈大数据技术

忽如一夜春风来,无人不谈大数据.大数据就像前两年的云计算一样,是一个时下被炒得很火的概念.那么什么是大数据,大数据是如何定义的,大数据处理技术有哪些,大数据能给我们带来什么益处?虽然我不知道现在这些概念是如何被炒作的,但是作为一名互联网行业的从业者,作为一个大数据技术的实践者,根据自己的理解和经验发表一点浅显的认识,理解肯定有不到位之处请大家批评指正. 无论是大数据技术还是云计算技术,其实这些技术都不是突然冒出来的,而是随着互联网技术的发展,人们把现有的技术加以整合,总结,概括出来并冠一个新名字

华为领跑中国政务大数据市场

华为领跑中国政务大数据市场在全球权威的咨询与服务机构IDC最新发布的<IDC MarketScape:中国政务大数据管理平台2018 厂商评估>报告中,华为位居领导者象限领先位置.华为云政务大数据解决方案凭借过硬的综合实力和技术创新,在市场表现与现有能力两大维度均排名第一.华为领跑中国政务大数据市场为了推进"互联网+政务服务"的落地,全国各地都在加快政务大数据的建设,打通流程.部门.地域的壁垒,实现数据的高效自由的流动和共享.华为携手合作伙伴为客户提供从IT基础设施到应用的

MES应慎谈大数据

突然之间,“工业4.0”.“中国制造2025”.“大数据”.“智能制造”.“智慧工厂”等词汇变得流行起来,仿佛不谈新词汇就变得落伍了,仿佛传统MES已经不适应新时代了. 可是真的是这样的吗?真的有几个人能把这些新词汇说清楚吗? 以我个人多年做MES项目的经验,我觉得中国制造现在还处在工业2.0,顶多在工业2.5,多数的企业还远远没有实现自动化,更不要说智能化. 要想直接走工业4.0,实现弯道超车,这是一个很丰满的理想,但是却受到基础设施.成本.人才.管理体系等诸多因素的制约,因而很难落地. 比如

张小龙谈“大数据五种开源处理技术”

概述 现在市场上有超过25万个开源技术出现了.如何选择?让我们一起看下5种激动人心的大数据技术. Storm 和Kafka是未来数据流处理的主要方式,它们已经在一些大公司中使用了,包括 Groupon,阿里巴巴和The Weather Channel等. Storm,诞生于Twitter,是一个分布式实时计算系统.Storm 设计用于处理实时计算,Hadoop主要用于处理批处理运算. kafka是由LinkedIn研发的一款消息系统,作为一个数据处理的管道基础部分存在于系统中.当你一起使用它们,

浅谈大数据的发展:问题和挑战

  目前,几乎所有世界级的互联网企业,都将业务触角延伸至大数据产业. 无论社交平台逐鹿.电商价格大战还是门户网站竞争,都有它的影子.大数据,正由技术热词变成一股社会浪潮,影响社会生活的方方面面. 何谓大数据?大数据或称巨量资料,是指所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取.管理.处理.并整理成为帮助企业经营决策更积极目的的资讯.(在 维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的<大数据时代>中,大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法)大

浅谈大数据

大数据概述 一.大数据是什么? 大数据目前没有一个严格的定义,但是我们可以举出很多具体的例子!例如:互联网上的网页数据.社交网站上的用户交互数据(如新浪微博).物联网中产生的活动数据(如智能家居).电话网络中的话单数据(如移动语音详单)等等都是大数据的具体表现. 二.大数据的三个特征 1.数据量大小–大容量 我们现在常说大数据,到底有多大呢?先看一组公式: 1024GB = 1TB;1024TB = 1PB;1024PB=1EB;1024EB=1ZB;1024ZB=1YB. 在淘宝上,每天新增的

浅谈大数据和hadoop家族

按照时间的早晚从大数据出现之前的时代讲到现在.暂时按一个城市来比喻吧,反正Landscape的意思也大概是”风景“的意思. 早在大数据概念出现以前就存在了各种各样的关于数学.统计学.算法.编程语言的研究.讨论和实践.这个时代,算法以及各种数学知识作为建筑的原料(比如钢筋.砖块),编程语言作为粘合剂(比如水泥)构成了一座座小房子(比如一个应用程序),形成了一小片一小片的村庄(比如一台服务器).这个时代村与村之间还没有高速公路(GFS, HDFS, Flume, Kafka等),只有一条泥泞不好走的

任何抛开业务谈大数据量的sql优化都是瞎扯

周三去某在线旅游公司面试.被问到了一个关于数据量大的优化问题.问题是:一个主外键关联表,主表有一百万数据,外键关联表有一千万的数据,要求做一个连接. 本人接触过单表数据量最大的就是将近两亿行历史数据(某运营商一业务一年数据)做查询,所有查询相关列必须做索引,而且还要保证不会出现全表扫描情况.也从来没有试过把这么多数据全部拿出来放内存中.只好回答说“再怎么做优化估计都不行,这数据量太大了,性能肯定吃不销.我只能告诉尽可能的添加过滤条件,不要一次用这么多的数据来做连接,能分批做就分批做吧”. 面试人