什么是sqoop?

1.什么是sqoop？

---SQL to HDFS 的工具

---利用JDBC连接关系型数据库

---Sqoop的获取

2.导入Oracle数据库表中指定的列

sqoop import --connect jdbc：oracle:thin:@ip地址：端口号：orcl --username scott --password tiger --table emp --columns‘empno,ename,sal‘ -m 1

3.导入Oracle数据库表中指定的表，并且指定分隔符和HDFS的路径

sqoop import --connect jdbc：oracle:thin:@ip地址：端口号：orcl --username scott --password tiger --table emp --columns‘empno,ename,sal‘ -m 1 --targer-dir ‘/sqoop/data1‘ --fields-terminatde-by‘**‘

4.导入Oracle数据库表中的数据，并使用query语句

sqoop import --connect jdbc：oracle:thin:@ip地址：端口号：orcl --username scott --password tiger --query ‘select * from emp where deptno=10 and $CONDITIONS‘ -m 1 --targer-dir ‘/sqoop/data1‘ --fields-terminatde-by‘**‘

5.使用sqoop导入关系型数据库中的数据到hive中

时间： 2024-08-24 01:52:24

什么是sqoop?的相关文章

解决sqoop报错Invalid number; item = ITEM_UNICODE

报错栈: java.sql.SQLException: Invalid number; item = ITEM_UNICODE at com.intersys.jdbc.SysList.getInt(SysList.java:1735) at com.intersys.jdbc.CacheResultSet.getInt(CacheResultSet.java:247) at org.apache.sqoop.lib.JdbcWritableBridge.readInteger(JdbcWrit

sqoop同步mysql到hdfs

链接:http://pan.baidu.com/s/1gfHnaVL 密码:7j12 mysql-connector version 5.1.32 若在安装版本过程遇到些问题,可参考http://dbspace.blog.51cto.com/6873717/1875955,其中一些问题的解决办法下载并安装: cd /usr/local/tar -zxvf sqoop2-1.99.3-cdh5.0.0.tar.gzmv sqoop2-1.99.3-cdh5.0.0 sqoop添加sqoop2到系

解决sqoop报错：SQLServerException: 将字符串转换为 uniqueidentifier 时失败。

报错栈: Error: java.io.IOException: Cannection handler cannot recover failure: at org.apache.sqoop.mapreduce.db.SQLServerDBRecordReader.nextKeyValue(SQLServerDBRecordReader.java:169) at org.apache.hadoop.mapred.MapTask$NewTrackingRecordReader.nextKeyVal

sqoop 使用笔记

好久没有更新自己技术博客,现在开始工作了,把自己遇到的问题写到这里边来主要把自己的问题写出来,分享给大家 sqoop 导入数据时候有时候会遇到mysql 中有sql 中的关键字这时候如果直接导出到hive 中会出现错误例如下面的例子这时候会出现错误可以使用--query 来解决问题例如 : sqoop-import -D mapreduce.map.memory.mb=256 -D mapreduce.map.java.opts=-Xmx128m --connect ''--us

Sqoop 脚本开发规范（实例手把手带你写sqoop export和sqoop import）

首先,先明确,为什么Sqoop需要规范的脚本开发呢? 答:是因为,Sqoop import HDFS/Hive/HBase这些都是手动.但是在实际生产里,有时候,需要用脚本来完成. 比如,通过shell脚本来操作对Sqoop.Hive.HBase.MapReduce.HDFS.Spark.Storm等各种. Sqoop 脚本开发规范目录规范 1.目录结构体系 /home/hadoop(开发用户)/app/djt(数据来源.业务)/sh/sqoop 示例:/home/hadoop/app/djt

Apache的HBase与cdh的sqoop集成（不建议不同版本之间的集成）

1.修改sqoop的配资文件 2.从mysql导入到hbase(import) bin/sqoop import \ --connect jdbc:mysql://linux-hadoop3.ibeifeng.com:3306/sqoop \ --username root \ --password 123456 \ --table tohdfs \ --hbase-create-table \ --hbase-table s1 \ --hbase-row-key id \ --column-f

[Sqoop]Sqoop使用

Sqoop的本质还是一个命令行工具,和HDFS,MapReduce相比,并没有什么高深的理论. 我们可以通过sqoop help命令来查看sqoop的命令选项,如下: 16/11/13 20:10:17 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6 usage: sqoop COMMAND [ARGS] Available commands: codegen Generate code to interact with da

sqoop job local 和 Cannot initialize Cluster 问题

hadoop版本:Hadoop 2.3.0-cdh5.0.0 sqoop版本:Sqoop 1.4.4-cdh5.0.0 配置好sqooop-env.xml: #Set path to where bin/hadoop is available export HADOOP_COMMON_HOME=/my/hadoop #Set path to where hadoop-*-core.jar is available export HADOOP_MAPRED_HOME=/my/hadoop/shar

sqoop相关整理记录

生产背景: 在从mysql导入到hive中,遇到如下问题: 1) 源mysql和集群机器不在同一个网段中,导致执行导入命令,网络连接失败. 2) 某些字符导入到hive中,出现报错终止. 2.1 sqoop使用的JDBC-connector 版本太低(更换版本). 从hive导出到mysql中,遇到如下问题: 1)某些字符插入mysql,出现报错终止. 1.1 可能mysql本身编码的限制,某些字符不支持,比如uft8和utf8mb4 1.2 sqoop使用的JDBC-connector 版

spark+hadoop+sqoop+hive平台bug解决方法

bug集锦 1. hadoop平台datanode无法启动: 原因: 由于多次hdfs namenode -format导致dfs/data/current/version中的cluserID与当前的cluserID不统一,通过查看hadoop/logs中的datanode日志文件查看到此错误. 解决方法: 1). 修改每台节点上的/dfs/current/version文件中的cluserID的值为当前的值(当前值可以通过hadoop/logs日志文件中的报错获得). 2). 每次format

猜你喜欢

SiteMesh, SpringMVC, Shiro 配置

1. 首先在在web.xml文件中,加入SiteMesh和shiro的过滤器,保证SiteMesh的过滤器配置放在shiro的过滤器后面,不然的话,shiro的标签不能正确处理. <?xml v ...

【HDOJ】5057 Argestes and Sequence

树状数组,其实很简单.只是MLE. 1 #include <iostream> 2 #include <cstdio> 3 #include <cstring> 4 ...

es6中的promise对象

Promise是异步里面的一种解决方案,解决了回调嵌套的问题,es6将其进行了语言标准,同意了用法,提供了`promise`对象, promise对象有三种状态:pending(进行中) .Resol ...

nginx 伪静态 rewrite

前一段时间领导让我用nginx做个伪静态,实现效果如下: 原URL http://www.domain.com/abc/def.jsp?x=1&y=2&z=3 转换为http://ww ...

HAproxy指南之haproxy重定向配置（案例篇）

前面我们讲到了haproxy利用acl来实现haproxy动静分离,如果此时有这样一个需求,客户端请求xx.a.com,需要将请求转发到xx.b.com,又例如当客户端访问出错,我们需要将错误code ...

封装ios静态库碰到的一些问题（二）

在静态库建立好了之后呢,于是应用程序就引用它,加上拷贝的h文件,但是引用之后Build之后提示很多sybmbol 重复于是进行检查,确实由于是从其他工程修改过来的,很多基础库都引用了,删除之,最后就 ...

typeof 、Object.prototype.toString和 instanceof

数据类型 js 基本类型包括:Undefined symbol null string boolean number js 引用类型包括:object array Date RegExp typeo ...

Mysql存储emoji表情的两种方式

最近在做数据迁移,原先有一个字段的类型为clob,迁移后的字段类型为varchar,blob转化成字符串数据后,发现有emoji表情存在,导致数据迁移失败.失败的原因是mysql数据库中设置的utf- ...

每天一个Linux命令（14）--head命令

head 与 tail 就像它的名字一样的浅显易懂,它是用来显示开头或结尾某个数量的文字区块,head 用来显示档案的开头至标准输出中,而 tail 想当然的就是查看档案的结尾啦. 1.命令格式: h ...

item系列

#__setitem__赋值方法,在进行obj[name]=value时,会触发执行该方法#__delitem__删除方法,在进行del obj[name],就会触发执行该方法#__getitem__ ...

selenium2中关于Python的常用函数

driver = webdriver.Chrome(chromeDriver) 1.返回当前会话中的cookies:driver.get_cookies() 2.根据cookies name查找:dr ...

18.AspxGridView服务器端重要属性与方法

AspxGridView服务器端重要属性属性名数据类型中文说明 DataSource Object 数据源.所支持的数据源类型包括:SqlDataSource.ObjectDataSource. ...

http://you.ctrip.com/events/beijing1/4101947.html http://you.ctrip.com/CommunitySite/Activity/Hom ...

/dev/random vs /dev/urandom

If you want random data in a Linux/Unix type OS, the standard way to do so is to use /dev/random or ...

divmod(a,b)函数是实现a除以b，然后返回商与余数的元组、eval可以执行一个字符串形式的表达式、exec语句用来执行储存在字符串或文件中的Python语句

1 #!/usr/bin/env python 2 a = 10/3 3 print(a) 4 #divmod计算商与余数 5 r = divmod(10001,20) 6 print(r) 7 #e ...

ios开发 xcode6以上安装Alcatraz管理插件

在终端上输入如下命令即可完成安装: curl -fsSL https://raw.github.com/supermarin/Alcatraz/master/Scripts/install.sh | ...

Linux Mint 17 下安装搜狗拼音输入法

Linux Mint不像Ubuntu那样默认配置了中文输入法,需要我们自己安装,下面给出安装方法及输入法所需依赖: sudo add-apt-repository ppa:fcitx-team/nig ...

JMeter学习（七）聚合报告之 90% Line 正确理解

90% Line 参数正确的含义: 虽然,我的上面理解有一定的道理,显然它是错误的.那看看JMeter 官网是怎么说的? 90% Line - 90% of the samples took no m ...

Spring RMI (Spring 远程方法调用)

所需jar包...? 不纠结,一股脑儿全导! 先放结构图如下,客户端和服务端都在一个项目中.也可以把服务端的xxx导成jar包放到新的客户端项目中去. 1. 服务端 2.

hibernate QBC日期查询

使用QBC方式查询数据库,如果查询条件包含日期,则比较难以处理,尤其是在不是简单的在某个日期之前,或在某个日期之后的情况时,不能用hibernate常用方式,要用原生sql语句执行查询. 1.hibe ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.018 s.