记一次从oracle到hive的历史数据迁移（一）

介绍一下具体场景

需要从现有在用的oracle中将历史数据迁移出来并导入到hive中，存在几个问题：1、现有oracle数据库在使用无法整个库导出，数据库服务器没有权限；2、由于各个数据提供方的各次升级，oracle数据库采取添加字段而不删除字段的方式更新，而hive中建立的表数据结构要按新的来，也就是说oracle导出的数据到hive表中需要做字段对应。

决定先将oracle导入到另一个oracle中，将oracle中表字段和hive中的表字段进行比对得到各个的对应关系，之后写对应的sqoop语句对应利用ETL流程安装账期一天一天导入。

从一个oracle到另一个oracle导入的方案，利用大神写出的sqluldr2 工具用来导出数据，导入利用

sqlldr 命令导入到另一个库表中。

导出的具体命令

sqluldr2.bin user=root/[email protected] query="select /*+ parallel(8) */ * from table " head=no File=/data/oracle/tmp/file 导出到本地目录

导入的具体命令

sqlldr root/[email protected]@ip:1521/tnsname control=/data/oracle/shell/xxx.ctl

data=/data/oracle/tmp/file

log=/data/oracle/log/file.log errors=0 rows=100000 bindsize=1024000000 direct=y;

xxx.ctl 是用来指定导入表的字段和分割符如下写法

load data

truncate into table tablename

Fields terminated by ‘,‘ #文件的列分隔符

TRAILING NULLCOLS

(

IP char(255),

APPKEY char(255),

PLATFORM char(255),

PORTAL char(255),

COMPANYID char(255) )

时间： 2024-11-05 17:25:52

记一次从oracle到hive的历史数据迁移（一）的相关文章

Loading Data From Oracle To Hive By ODI 12c

本文描述如何通过ODI将Oracle表数据同步到Hive.1.准备工作在hadoop集群的各个节点分别安装Oracle Big Data Connectors,具体的组件如下图所示:这里只需安装Oracle Loader For Hadoop(oraloader)以及Oracle SQL Connector for Hadoop Distributed File System (oraosch)两个软件.安装比较简单,直接解压即可使用(这里的ODI.oraosch以及oraloader组件都是以

实验：Oracle直接拷贝物理存储文件迁移

实验目的:Oracle直接拷贝物理文件迁移,生产库有类似施工需求,故在实验环境简单验证一下. 实验环境: A主机:192.168.1.200 Solaris10 + Oracle 11.2.0.1 B主机:192.168.1.186 Solaris10 1.备份ORACLE安装包($ORACLE_BASE目录) tar cvf oracle.tar oracle 2.关库,备份参数文件,控制文件,数据文件,临时文件,日志文件查看各个文件的存放路径: SQL> show parameter pf

Oracle用分区表分区交换做历史数据迁移

一. 说明: OLTP库中有些表数据量大,且每月有持续的大量数据添加.因为历史数据在此库中不再做訪问,而是在另1个OLAP库中做分析.所以会对历史数据迁移至OLAP库中.对这样的历史数据迁移的操作.较好的办法是该表採用分区表.按时间分区后,能够对分区进行迁移.通过分区交换和表空间传输会非常easy完毕.并且性能上影响非常小. 关于分区表很多其它内容: http://blog.csdn.net/tanqingru/article/category/1397435 关于表空间传很多其它内容:

oracle作为hive元数据库，建表报错

hive> > > create table test(a string, b int);FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataStoreException: An exception was thrown while adding/validating class(es) : OR

SQOOP Load Data from Oracle to Hive Table

sqoop import -D oraoop.disabled=true --connect "jdbc:oracle:thin:@(description=(address=(protocol=tcp)(host=HOSTNAME)(port=PORT))(connect_data=(service_name=SERVICE_NAME)))" --username USERNAME --table TABLE_NAME --null-string '\\N' --null-non-s

sqoop oracle到hive，动态分区一次操作记录

sqoop,将oracle数据传递到hive,可以直接将表数据覆盖传递,也可以按select传递,这里我用的是select查询的脚本如下: 1.创建分区表,按c1分区 CREATE TABLE `xx.cc`( `c1` string) PARTITIONED BY(`c2` string); 2.通过sqoop将数据导入临时表中 sqoop import -D oraoop.jdbc.url.verbatim=true --hive-import --hive-overwrite --con

记使用talend从oracle抽取数据时，数字变为0的问题

数据源为oracle,字段类型为number. 发现通过mainline连接到一个logrow控件,输入的该字段的值为0 经过多次测试还是没发现有什么规律. 通过查看代码发现有这一句内容. if (row2.ID != null) { // strBuffer_tLogRow_1.append(row2.ID.setScale(-127,java.math.RoundingMode.HALF_UP).toPlainString()); } // 不知这个是个bug还是一个未知的规则. 待解决.

Oracle Undo 查询表中历史数据

Undo 表空间用于存放Undo 数据.当执行DML操作时,Oracle会将这些操作的旧数据写入Undo 段.用于对数据库一致读,事务回滚之类的操作. 换而言之,在特殊情况下,我们可以用它来找回被错误操作的数据.例如: SELECT t.fid FROM ct_bas_province AS OF TIMESTAMP to_date('2014-11-21 22:01', 'yyyy-mm-dd HH24:mi') t WHERE t.fnumber = '海南省'; 即在要查询的表名

Oracle RAC环境实时数据迁移

系统要求及安装前的说明 Oracle GoldenGate可以在Oracle不同版本间移动数据,也可以在Oracle和其它类型数据库之间移动数据.Oracle GoldenGate支持数据的过滤.映射和转换.Oracle还能在相似的Oracle数据库之间复制DDL操作.注意下面一句:当DDL支持被激活的时候,Oracle GoldenGate不支持数据的过滤.映射和转换. 支持的Oracle数据库版本,从9.2开始支持DML和DDL.支持几乎所有的主流操作系统,具体的可以从MOS(My Orac

猜你喜欢

浅谈一下web移动端基本

屏幕尺寸.屏幕分辨率.屏幕像素密度屏幕尺寸: 指屏幕的对角线的长度,单位是英寸,1英寸=2.54厘米. 常见的屏幕尺寸有2.4.2.8.3.5.3.7.4.2.5.0.5.5.6.0等. 屏幕分辨率 ...

如何查看appache的端口是否被占用

win + R 快捷键输入 cmd 打开命令行. 输入 netstat -ano 查看端口使用情况 Ctrl + Shift + Esc 打开 windows 任务管理器,依次单击 [查看][ 选择列 ...

AS1 A Chinese Girls' Amusement

题意:给你一个大数 ,问你求小于这个数一半且与他互质的数. 解题思路:奇数直接是二分之一,偶数小于它一半的那个最大奇数. 解题代码: 1 // File Name: a.cpp 2 // Author ...

php base64_decode 解码方法

<?php header('Content-Type:text/html;charset=utf-8'); function encode_file_contents($filename) { ...

C#实现类似QQ的隐藏浮动窗体、消息闪动

功能简介当语音客服系统登录成功进入主界面时,本聊天工具将会自动隐藏在左下角位置,当鼠标移动到左下角时,自动弹出,当鼠标移开聊天窗体时,自动隐藏.如果想让聊天窗体固定在桌面,只要拖动一下聊天窗口,让它 ...

4.6指针变量作参数

Q:编写一个函数,该函数被主函数调用,通过该函数实现向主函数中定义的数组输入数据. 注意:函数的调用是在内存的堆栈中实现的.一旦函数调用结束,该函数内部的所有局部变量都会被释放掉. 本题目要求对主函数 ...

cobbler自动化安装操作系统

Cobbler安装与部署目录 Cobbler安装与部署... 1 理论部分:Cobbler简介... 1 Collber 对象关系图... 1 工作流程... 2 部署安装cobbler4 一.系统 ...

git查看本地和创建分支、上传分支、提交代码到分支、删除分支等

以下是git命令行里边的命令操作,加上了说明: Welcome to Git (version 1.9.5-preview20141217) Run 'git help git' to display ...

按要求编写Java应用程序。（1）创建一个叫做机动车的类：属性：车牌号(String)，车速(int)，载重量(double) 功能：加速(车速自增)、减速(车速自减)、修改车牌号，查询车的载重量。编写两个构造方法：一个没有形参，在方法中将车牌号设置“XX1234”，速度设置为100，载重量设置为100；另一个能为对象的所有属性赋值；（2）创建主类：在主类中创建两个机动车对象。创建第

package com.hanqi.test; public class jidongche { private String chepaihao;//车牌号 private int speed;// ...

通用的linux下安装配置svn独立服务

参考资料: http://www.blogjava.net/zhouf/articles/251476.html http://www.cnblogs.com/thinksasa/archive/20 ...

php数据库操作

/** * Created by PhpStorm. * User: yuyud * Date: 2016/1/11 0011 * Time: 16:43 */ /** * 数据库连接 * Class ...

OpenCV Tutorials —— Adding (blending) two images using OpenCV

An interesting dyadic (two-input) operator is thelinear blend operator: #include <cv.h> #inc ...

图片压缩最优方案

Github地址: https://github.com/jeanboydev/Android-BitherCompress 原文地址:http://blog.csdn.net/copy_yuan/a ...

自增锁ID复用问题

mysql> select * from pp; +----+------+ | id | name | +----+------+ | 1 | xx | | 2 | xx | | 3 | xx ...

开源的推荐系统

我收集和整理的目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确), 这方面 ...

Linux下C++静态库、动态库的制作与使用

参考博文:C++静态库与动态库 >> 静态库 1. 静态库的制作 a) 编辑 name.cpp 和name.h文件 b) $g++ -c name.cpp //注意带参数-c,否则直接编译 ...

在visual studio中运行C++心得

1.在visual studio中建立C++项目 (1)新建->项目->空项目 C++ (2)右击项目->添加->新建项->C++文件(.app) (3编写C++文件 ...

Linux里必须会的redis命令

一.Key Key命令速查: 命令说明 DEL 删除给定的一个或多个 key,不存在的 key 会被忽略,返回值:被删除 key 的数量 DUMP 序列化给定 key,返回被序列化的值,使用 RES ...

APPCAN学习笔记002---app快速开发AppCan.cn平台特色

技术qq交流群:JavaDream:251572072 1.多窗口机制常见应用只支持单一窗口 2.原生UI与交互支持大量原生UI与交互支持(如Action Sheet等) 3.第三方开放平台支持 ...

JavaIO学习之File类

File类作用: 1.用来将文件或者文件夹封装成对象. 2.方便对文件与文件夹的属性进行操作. 3.File对象可以作为参数传递给流的构造函数. IO流的流对象只能操作设备上的数据. 文件属性 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.022 s.