phoenix 利用CsvBulkLoadTool 批量带入数据并自动创建索引

需要先创建表：

CREATE TABLE IF NOT EXISTS population (  state CHAR(2) NOT NULL,  city VARCHAR NOT NULL,  population BIGINT  CONSTRAINT my_pk PRIMARY KEY (state, city));

在phoenix 目录下执行

hadoop jar /home/phoenix-4.6.0-HBase-1.0-bin/phoenix-4.6.0-HBase-1.0-client.jar org.apache.phoenix.mapreduce.CsvBulkLoadTool -t POPULATION -i /datas/us_population.csv

-t ：tableName

-i: input file 文件必须在hdfs文件上。

后查询表数据是空。

问题： ERROR mapreduce.CsvBulkLoadTool: Error Wrong FS: file:/home/hadoop/tmp/partitions_101bd67a-ec2c-4808-bc9f-bf4cd6ea74b9, expected: hdfs://node11:9000 occurred submitting CSVBulkLoad

参数意义：

-a,--array-delimiter <arg> Array element delimiter (optional)
-c,--import-columns <arg> Comma-separated list of columns to be
imported
-d,--delimiter <arg> Input delimiter, defaults to comma
-e,--escape <arg> Supply a custom escape character, default is
a backslash
-g,--ignore-errors Ignore input errors
-h,--help Show this help and quit
-i,--input <arg> Input CSV path (mandatory)
-it,--index-table <arg> Phoenix index table name when just loading
this particualar index table
-o,--output <arg> Output path for temporary HFiles (optional)
-q,--quote <arg> Supply a custom phrase delimiter, defaults
to double quote character
-s,--schema <arg> Phoenix schema name (optional)
-t,--table <arg> Phoenix table name (mandatory)
-z,--zookeeper <arg> Supply zookeeper connection details
(optional)

时间： 2024-12-29 23:17:17

phoenix 利用CsvBulkLoadTool 批量带入数据并自动创建索引的相关文章

SqlServer 利用游标批量更新数据

原文:SqlServer 利用游标批量更新数据 SqlServer 利用游标批量更新数据 Intro# 游标在有时候会很有用,在更新一部分不多的数据时,可以很方便的更新数据,不需要再写一个小工具来做了,直接写 SQL 就可以了 Sample# 下面来看一个实际示例: Copy -- 声明字段变量 DECLARE @RegionCode INT; DECLARE @RegionName NVARCHAR(64); DECLARE @ProvinceId INT; -- 声明游标 DECLARE P

Sql Server利用游标批量清空数据表

先吐槽一下,由于公司要为新客户部署一个全新的系统,然而公司并没有空库,所以只能把正在线上运行的数据库给备份,然后清空相关数据下面分享一下我在做清空数据库时写的一个批量清空数据表的方法思路:查询出该库下的所有表根据表名(系统相关数据表取名都是有规律的)筛选出需要清空的表下面,上代码 1 USE [DataBase] 2 GO 3 DECLARE @name varchar(50) 4 DECLARE @count int 5 set @count=0 6 DECLARE contact_c

多表利用DIH批量导入数据并建立索引注意事项

如果希望同时对多个表进行全文检索,那我们该如何处理呢?利用DIH导入数据并建立索引时.schema.xml中配置了uniqueKey为id <uniqueKey>id</uniqueKey> 如果多表主键都为id的话索引会被覆盖  <entity name="case" pk="id" query="SELECT id,title

mysql利用存储过程批量插入数据

最近需要测试一下mysql单表数据达到1000W条以上时增删改查的性能.由于没有现成的数据,因此自己构造,本文只是实例,以及简单的介绍. 首先当然是建表: CREATE TABLE `fortest` ( `ID` INT(30) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, `IP` VARCHAR(32) NOT NULL, `OID` VARCHAR(15) DEFAULT NULL) 其次,构建存储过程: DELIMITER $$

mongo 自动创建索引导致应用连接超时

2016年10月16日一个周末的时光遇到了一个很是让人恼火的问题!tomcat总是抛出连接超时问题错误,让人甚是恼火啊!!! 报错信息如下: [2016-10-15 18:30:58] 113578459 INFO - ----- PermissionsInterceptor ----- - 登录人pin--------WUJIE 十月 15, 2016 6:30:58 下午 com.mongodb.DBApiLayer$Result killCursor 警告: can't clean 1

SQL Server 执行计划利用统计信息对数据行的预估原理以及SQL Server 2014中预估策略的改变

前提本文仅讨论SQL Server查询时, 对于非复合统计信息,也即每个字段的统计信息只包含当前列的数据分布的情况下, 在用多个字段进行组合查询的时候,如何根据统计信息去预估行数的. 利用不同字段的统计信息做数据行数预估的算法原理,以及SQL Server 2012和SQL Server 2014该算法的差异情况, 这里暂时不涉及复合统计信息,暂不涉及统计信息的更新策略及优化相关话题,以及其他SQL Server版本计算方式. 统计信息是什么简单说就是对某些字段的数据分布的一种描述,让SQ

Django 批量插入数据、自定义分页器、多表关系的建立及Form组件（待更新。。。）

目录 django批量出入数据自定义分页器创建多对多表关系的建立 form组件 form组件钩子函数一.django批量出入数据视图函数: from app01 import models # 向表中插入1000条数据 def index(request): # 方式1: # for i in range(1000): # models.Book.objects.create(title='第%s本书'%i) # book_Queryset = models.Book.objects

【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化（转载）

原文地址:http://blog.csdn.net/zwan0518/article/details/11972853 目录(?)[-] 一查询优化 1创建索引 2缓存的配置 3slow_query_log分析 4分库分表 5子查询优化二数据转移 21插入数据如今随着互联网的发展,数据的量级也是撑指数的增长,从GB到TB到PB.对数据的各种操作也是愈加的困难,传统的关系性数据库已经无法满足快速查询与插入数据的需求.这个时候NoSQL的出现暂时解决了这一危机.它通过降低数据的安全性,减少对事务

利用OLEDB+SqlClient实现EXCEL批量导入数据

以下是几个自己写的类 /// <summary> /// 取得Excel对象 /// </summary> /// <param name="strConn">OLEDB连接字符串</param> /// <param name="sql">SQL语句</param> /// <returns></returns> public static DataTable GetE

猜你喜欢

hiho1095（二分）

题目连接:https://hihocoder.com/problemset/problem/1095 应该是之前在哪看的代码.不像是我写的.. 1 #include <iostream> ...

python一段代码感受一下

class T(): def aa(self): write = 1 print '123' class B(): def hehe(self) ...

sublime text 快速补全

关于补全,其实有很多,记录一些常用的在这里,忘记了可以查找 nav>ul>li <nav> <ul> < ...

hibernate建表一对多多的一方控制一的一方

一对多单向<one-to-many>通过calss操作student 外键在student表中,所以外键由student维护<many-to-one>通过student操作c ...

产品管理常用思维

1.分解问题的方法 (1)鱼骨图 (2)思维导图 (3)对比矩阵 2.二八原则,寻找关键问题 3.执行操作优先级步骤 4.用ppt做原型 5.28天养成一个习惯:将习惯分解成每一天需要做的事情 6.思 ...

ThinkPHP3.2.3扩展之生成PDF文件（MPDF）

目前是PHP生成PDF文件最好的插件了,今天介绍下在ThinkPHP3.2.3里如何使用. 先安照路径放好如图. 下面是使用方法 public function pdf(){ //引入类库 Vendo ...

百度地图获取地址信息由纬度和经度

谁是通过谷歌的坐标呼叫与谷歌api 近来的罗总能找到谷歌server. 因此,要找到百度的发现, 住址http://developer.baidu.com/map/webservice-geocod ...

NVIDIA Jetson TK1学习与开发（四）：一些细节问题

本文把自己在学习或开发Jetson TK1过程中遇到的一些细节性的问题罗列出来,并提供解决方案. 首先就是wiki上提供的一些注意事项,网址:http://elinux.org/Jetson_TK1 ...

spring aop（四）

直接找到解析aop标签的方法: 1 protected void parseBeanDefinitions(Element root, BeanDefinitionParserDelegate del ...

洛谷 P2717 寒假作业

题目背景 zzs和zzy正在被寒假作业折磨,然而他们有答案可以抄啊. 题目描述他们共有n项寒假作业.zzy给每项寒假作业都定义了一个疲劳值Ai,表示抄这个作业所要花的精力.zzs现在想要知道,有多少 ...

国家网信办会同相关部门关闭一批旅游网站wb

杨钰是邵阳市绥宁县的一名苗族歌手,苗族名"阿苗千千",她用自己与众不同的美妙声音,将家乡的苗歌屡次唱上央视,唱响<星光大道><我要上春晚><中国民歌大 ...

linux中重定向学习总结

文件标识符是从0到9结束的整数,指明了与进程有关的特定数据流源.当Linux系统启动一个进程(该进程可能用于执行Shell命令)时,将自动为该进程打开三个文件:标准输入.标准输出和标准错误输出,分别由 ...

RHEL5.8安装Oracle11g

1.安装环境[[email protected] ~]# uname -r2.6.18-308.el5[[email protected] ~]# cat /etc/issueRed Hat Ente ...

duplicate symbol _OBJC_METACLASS_$ 报错记录

duplicate symbol _OBJC_METACLASS_$_TabbarButton in: /Users/hw201406/Library/Developer/Xcode/DerivedD ...

格式工厂(二) Lambda

版权声明:本文为博主原创文章,未经博主允许不得转载. 这次主要介绍C++11的Lambda语法,一个非常给力的语法 1.组成 : [...导入符号](...参数)mutable(可改写) throw ...

动态加载和卸载 DLL

using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...

用Maven建立动态web工程

今天我想谈谈Maven.它是一个非常强大的工具.如果你知道怎样去用它,那么你将用最少的精力获得最大的结果.通常情况下Maven帮助你管理工程,包括依赖库.建立进程等等......但是这篇文章我将展示给 ...

新博客地址

https://longstreet.blog.ustc.edu.cn/ 新博客地址 https://longstreet.blog.ustc.edu.cn/ 新博客地址 https://longs ...

Ubuntu 下disk清理保护

用久了ubuntu的人,很多人会忽然出个提示:磁盘空间不足1G! 然后分析半天..最近也碰到类似问题,记录如下: 一:.xsession-errors.old 可以在终端看到主用户目录下有这么一个隐藏 ...

LZH_IJKPlayer-一个最简单使用的视频播放器，集成于bilibili开源直播播放器(ijkplayer)

随着视频直播APP的迅速发展,许多APP也都会加入直播的功能,提高用户量.在网上也是寻找了许多直播的播放器,无意间发现Bilibili开源了一款播放器ijkplayer,想从最开始的步骤集成 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.