微软Azure已开始支持hadoop,对于有需要弹性大数据运算的公司可能是个好消息。据悉,近期微软已提供一个预览版的Azure HDInsight(Hadoop on Azure)服务,运行在Linux操作系统上。与对应的Windows一样,Azure HDInsight on Linux服务也是构建在Hortonworks Data Platform(HDP)之上。HDInsight与Apache Hadoop全面兼容,同时集成了微软自己的商业智能工具,例如Excel、SQL Server和PowerBI。正如对Windows版本所做的,微软计划将针对Linux HDInsight版本开发的后端代码贡献给Apache社区,微软方面这样表示。
微软向Linux用户提供Hadoop on Azure服务
目前HDInsight支持的唯一Linux版本是Ubuntu(在虚拟机中),是由Canonical提供支持的。微软现在已经开始提供Storm for Azure HDInsight。Storm是一种开源的流分析平台,已经从2014年10月开始针对Azure HDInsight进行预览。
微软的Azure机器学习服务现在已经全面提供。微软在2014年6月预览了Azure ML,允许开发者和数据科学家更快速地构建和部署应用,并且能够访问应用编程接口和服务,例如推荐、异常检测以及预测,通过Machine Learning Marketplace。
微软将使用Hadoop连接器把自己的NoSQL Azure服务、DocumentDB与HDInsight进行集成。这使得DocumentDB要么是运行Hadoop查询的一个输入源,要么是输出Hive、Pig和MapReduce工作可以发送到的地方。
数据集成提供商Informatica已经支持在Azure上的Linux和Windows Server虚拟机中提供自己的Informatica Cloud Agent技术。Informatica通过Azure Marketplace提供Cloud Agent,实现Informatica技术和各种Azure数据服务之间的连接。
目前Azure机器学习预览定价将从2015年3月31日开始生效。从2015年4月1日开始,所有新的和现有的Azure机器学习订购用户都将自动转换到标准版本,相应计费,不需要用户干预。那些不希望迁移的现有用户可以在2015年4月1日开始删除他们的工作区。
微软表示,从Azure网站提供的免费版Auzre机器学习没有变化也不收费。
虽然已经支持hadoop,但对于任何商用环境,还是需要多一份谨慎。