初探BigInsights(1)

之前的文章《IBM BigInsights -- 基于 Hadoop 的数据分析平台》介绍了IBM大数据分析平台BigInsights,在Hadoop的基础上IBM增加了额外的模块提供更广泛的数据分析。对于想了解下BigInsight是个什么东西?能做什么的同学,IBM也提供了BigInsights的虚拟机版本。对于那些想大概了解Hadoop,但又不想手动去搭建Hadoop平台的同学来说,BigInsight虚拟机也是个不错的选择。

首先到IBM官网下载 https://www-01.ibm.com/marketing/iwm/iwm/web/reg/download.do?source=swg-beta-iibob&S_PKG=dl&lang=en_US&cp=UTF-8&dlmethod=http, 下载“iibi3002_QuickStart_Single_VMware.7z”,用VMware Workstation打开,开机后如下界面,可以看到是基于SUSE的。

第一次启动时会做文件系统检查

选择语言

同意License

输入用户名密码,默认的用户名密码及端口号如下

之后会看到如下界面

双击桌面的Start Biginsights,启动BigInsight服务,或者使用脚本启动


[email protected]:~> /opt/ibm/biginsights/bin/start-all.sh            
[INFO] DeployCmdline - [ IBM InfoSphere BigInsights Quickstart Edition ]            
[INFO] Progress - Start hdm            
[INFO] @bivm.ibm.com - hdm started, pid 4363            
[INFO] Progress - 8%            
[INFO] Progress - Start zookeeper            
[INFO] HdmUtil - Install configuration has changed in the system, reloading...            
[INFO] @bivm.ibm.com - zookeeper started, pid 4618            
[INFO] Deployer - zookeeper service started            
[INFO] Progress - 17%            
[INFO] Progress - Start hadoop            
[INFO] @bivm.ibm.com - namenode started, pid 4829            
[INFO] @bivm.ibm.com - secondarynamenode started, pid 5363            
[INFO] @bivm.ibm.com - datanode started, pid 5713            
[INFO] Progress - 19%            
[INFO] Deployer - Waiting for Namenode to exit safe mode...            
[INFO] Deployer - Waiting another 5 seconds for namenode to exit safemode.  Check the namenode log for details.            
[INFO] Deployer - HDFS cluster started successfully            
[INFO] Progress - 20%            
[INFO] Progress - 21%            
[INFO] @bivm.ibm.com - jobtracker started, pid 6468            
[INFO] @bivm.ibm.com - tasktracker started, pid 6888            
[INFO] Progress - 25%            
[INFO] Deployer - MapReduce cluster started successfully            
[INFO] Progress - Start catalog            
[INFO] DB2Operator - Starting DB2 Instance db2inst1 on node bivm.ibm.com. Database to be activated BIDB            
[INFO] DB2Operator - DB2 node bivm.ibm.com is started with process ID 7672            
[INFO] DB2Operator - Database BIDB has been activated            
[INFO] Progress - 33%            
[INFO] Progress - Start hbase            
[INFO] Deployer - check zookeeper services, make sure zookeeper service is started before start hbase service            
[INFO] @bivm.ibm.com - hbase-master(active) started            
[INFO] @bivm.ibm.com - hbase-regionserver started            
[INFO] Deployer - hbase service started            
[INFO] Progress - 42%            
[INFO] Progress - Start hive            
[INFO] DB2Operator - Starting DB2 Instance db2inst1 on node bivm.ibm.com. Database to be activated BIDB            
[INFO] DB2Operator - DB2 Instance db2inst1 is already running on node bivm.ibm.com with process ID 7672            
[INFO] DB2Operator - Database BIDB has already been activated            
[INFO] @bivm.ibm.com - hive-web-interface started, pid 10001            
[INFO] @bivm.ibm.com - hive-server2 started, pid 10587            
[INFO] Progress - 49%            
[INFO] Progress - 50%            
[INFO] Progress - Start bigsql            
[INFO] Deployer - Starting Big SQL Scheduler     : OK            
Starting Big SQL               : OK            
Starting Big SQL v1            : OK (pid 17836)

[INFO] @bivm.ibm.com - scheduler started          
[INFO] @bivm.ibm.com - bigsql-server started            
[INFO] @bivm.ibm.com - bigsql-server-v1 started, pid 17836            
[INFO] Deployer - FMP pids file written            
[INFO] Progress - 58%            
[INFO] Progress - Start oozie            
[INFO] Deployer - Run oozie command as:oozie            
[INFO] @bivm.ibm.com - oozie started, pid 19082            
[INFO] Progress - 67%            
[INFO] Progress - Start console            
[INFO] Deployer - starting pigserver, logging to /var/ibm/biginsights/sheets/logs/bigsheets-console-pigserver.out            
[INFO] Deployer - Server waslp-server is not running.            
[INFO] Deployer - Starting server waslp-server.            
[INFO] Deployer - Server waslp-server started with process ID 19488.            
[INFO] Deployer - BigInsights Management Console started, pid 19488            
[INFO] Progress - 75%            
[INFO] Progress - Start httpfs            
[INFO] @bivm.ibm.com - httpfs-server started, pid 19975            
[INFO] Deployer - httpfs service started            
[INFO] Progress - 83%            
[INFO] Progress - Start monitoring            
[INFO] Deployer - Start monitoring...            
[INFO] Deployer - Starting monitoring agent on bivm.ibm.com as user monitoring            
[INFO] @bivm.ibm.com - monitoring started, pid 21613            
[INFO] Deployer - monitoring service started            
[INFO] Progress - 92%            
[INFO] Progress - Start alert            
[INFO] Deployer - start alert management service...            
[INFO] Deployer - Server waslp-server is not running.            
[INFO] Deployer - Starting server waslp-server.            
[INFO] Deployer - Server waslp-server start failed. Check server logs for details.            
[INFO] Progress - 100%            
[INFO] DeployManager - Start; SUCCEEDED components: [hdm, zookeeper, hadoop, catalog, hbase, hive, bigsql, oozie, console, httpfs, monitoring, alert]; Consumes : 2148290ms

大概10分钟后启动完毕,然后可以使用命令行查看BigInsight各项服务的状态

[email protected]:~> /opt/ibm/biginsights/bin/status.sh

另外,桌面上还有BigInsight Shell,

比如双击桌面的HBase Shell,就可以直接进入shell

用浏览器打开BigInsight Web界面,http://192.168.133.135:8080/

分布式文件系统HDFS的web界面

接下来的文章我们会通过几个实验来了解BigInsight具体是怎么工作的。

BigInsight Knowledge Center 更多内容请参考:

http://www-01.ibm.com/support/knowledgecenter/SSPT3X_3.0.0/com.ibm.swg.im.infosphere.biginsights.product.doc/doc/using.html%23task_edc_xhj_3n?lang=zh

时间: 2024-10-13 08:04:41

初探BigInsights(1)的相关文章

进阶之初探nodeJS

一.前言 在"初探nodeJS"随笔中,我们对于node有了一个大致地了解,并在最后也通过一个示例,了解了如何快速地开启一个简单的服务器. 今儿,再次看了该篇随笔,发现该随笔理论知识稍多,适合初级入门node,固萌生一个想法--想在该篇随笔中,通过一步步编写一个稍大一点的node示例,让我们在整体上更加全面地了解node. so,该篇随笔是建立在"初探nodeJS"之上的,固取名为"进阶之初探nodeJS". 好了,侃了这多,那么我们即将实现一个

从273二手车的M站点初探js模块化编程

前言 这几天在看273M站点时被他们的页面交互方式所吸引,他们的首页是采用三次加载+分页的方式.也就说分为大分页和小分页两种交互.大分页就是通过分页按钮来操作,小分页是通过下拉(向下滑动)时异步加载数据. 273这个M站点是产品推荐我看的.第一眼看这个产品时我就再想他们这个三次加载和翻页按钮的方式,那么小分页的pageIndex是怎么计算的.所以就顺便看了下源码. 提到看源码时用到了Chrome浏览器的格式化工具(还是朋友推荐我的,不过这个格式化按钮的确不明显,不会的话自行百度). 三次加载和分

[转载]HDFS初探之旅

转载自 http://www.cnblogs.com/xia520pi/archive/2012/05/28/2520813.html , 感谢虾皮工作室这一系列精彩的文章. Hadoop集群(第8期)_HDFS初探之旅 1.HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上.它所具有的高容错.高可靠性.高可扩展性.高

MongoDB初探系列之二:认识MongoDB提供的一些常用工具

在初探一中,我们已经可以顺利的将MongoDB在我们自己的机器上跑起来了.但是在其bin目录下面还有一些我们不熟知的工具.接下来,将介绍一下各个小工具的用途以及初探一中MongoDB在data文件夹下创建的文件的用途. 1.bin目录下面的各种小工具简介及使用方式 bsondump.exe 用于将导出的BSON文件格式转换为JSON格式mongo.exe mongoDB的客户端 mongod.exe 用于启动mongoDB的Server mongodump.exe 用于从mongodb数据库中导

Asynchronous Pluggable Protocols 初探

Asynchronous Pluggable Protocols,异步可插入协议,允许开发者创建可插协议处理器,MIME过滤器,以及命名空间处理器工作在微软IE4.0浏览器以及更高版本或者URL moniker中.这涉及到Urlmon.dll动态链接库所公开(输出)的可插协议诸多功能,本文不进行深入的原理讲解,只对它其中之一的应用进行解析,那就是如何将一个应用程序注册为URL协议. 应用场景: tencent协议: 当我们打开"tencent://message/?uin=要链接的QQ号 &qu

重新认识HTML,CSS,Javascript 之node-webkit 初探

今天我们来系统的.全面的 了解一下前端的一些技术,将有助于我们写出 更优秀的 产品 出来. 什么是HTML? HTML 是用来描述网页的一种语言. HTML 包含一些根节点,子节点,文本节点,属性节点,组成, 它通过一系列预定义标签来描述网页结构,如: <title>This is title</title> ,这个表明该网页的标题是 This is title. 什么是CSS? CSS 指层叠样式表 (Cascading Style Sheets),它描述浏览器显示如何显示htm

java进阶06 线程初探

线程,程序和进程是经常容易混淆的概念. 程序:就是有序严谨的指令集 进程:是一个程序及其数据在处理机上顺序执行时所发生的活动 线程:程序中不同的执行路径,就是程序中多种处理或者方法. 线程有两种方法实现 一:继承Thread 覆盖run方法 package Thread; public class Thread1 { public static void main(String[] args){ MyThread1 thread1=new MyThread1(); thread1.setName

数据加密解密初探

在一次网络通信或者是进程通信中,如果传输数据采用明文的方式,那么很容易被第三方"窃听"到,安全性难以保障. 而所谓加密是让数据从明文变成密文,传输过程中是密文,传送过去之后对方接收到的也是密文.--可以理解为密文就是乱码,看不出内在的任何意义,通常也都是逐位对应的. 在接收方接收到密文之后只有把它还原为原来的样子才可以理解对方说的具体是什么,此过程就叫做解密. 所谓系统的安全要实现的目标应该包括:机密性-confidentiality,完整性-integrity 和可用性-availa

Key/Value之王Memcached初探:三、Memcached解决Session的分布式存储场景的应用

一.高可用的Session服务器场景简介 1.1 应用服务器的无状态特性 应用层服务器(这里一般指Web服务器)处理网站应用的业务逻辑,应用的一个最显著的特点是:应用的无状态性. PS:提到无状态特性,不得不说下Http协议.我们常常听到说,Http是一个无状态协议,同一个会话的连续两个请求互相不了解,他们由最新实例化的环境进行解析,除了应用本身可能已经存储在全局对象中的所有信息外,该环境不保存与会话有关的任何信息.之所以我们在使用ASP.NET WebForm开发中会感觉不到Http的无状态特