使用shell分页读取600万+的MySQL数据脚本

shell-mysql
（1）脚本背景:
由于要在Linux上，远程读取mysql的表的数据，然后做一定清洗后，把数据上传至Hadoop集群中，使用Java写吧，感觉太麻烦了，得在Win上开发好，还得打成jar包，上传到Linux上，如果那里出了问题，还得重复这样，非常不方便，那就用shell写一个吧，也不需要什么jdbc驱动包，只需要在Linux上装个MySQL的客户端即可，用一行yum命令即可搞定，所以就花了点时间，封装了一个小脚本

（2）功能介绍:
直接在Linux下使用shell脚本远程分页读取MySQL表的数据的一个小脚本，已测过读取600万+的数据效率与jdbc相差无几

（3）脚本介绍:
主要有三个脚本构成
1，page.sh 这是一主脚本，里面定义了分页的条件，大家看下便知
2，f.sh 一个小包装的脚本吧，里面会用sed去掉表头一些信息
3，port.sh 分页读取数据的执行脚本

（4）如何使用？
使用非常简单，需要改下page.sh里面的查询字段，以及分页查询的数量，默认是10000，然后执行sh page.sh databaseName tableName传入数据库名和表名即可

Github地址：https://github.com/qindongliang/shell-mysql

时间： 2024-11-07 22:44:30

使用shell分页读取600万+的MySQL数据脚本的相关文章

思维导图学 Linux Shell攻略之干货篇 mysql数据库脚本管理系统

以结果为导向的学习,才是最有效率学习.笔者以前也曾经隔三差五的学习linux shell编程来着.给我的感觉就是,今天学了,后天忘了,一星期之后就白学了. 还好,最近自己平时没啥事,一直照着<linux shell攻略>,学做一些小例子,看着自己写的shell程序,简单的几行程序,实现一些好玩的效果,信心满满.不知不觉间,慢慢坚持了2周. 说说自己的干货吧.其实就是一个linux 操作mysql数据库脚本管理系统. 功能谈不上复杂,就是在平时工作中,笔者要维护多套业务系统,这些业务系统主要功能

企业级通过shell脚本开发MySQL启动脚本案例

企业Shell面试题10:开发MySQL启动脚本说明MySQL启动命令为:/bin/sh mysqld_safe --pid-file=$mysqld_pid_file_path 2>&1 > /dev/null &停止命令为:mysqld_pid=`cat "$mysqld_pid_file_path"`if (kill -0 $mysqld_pid 2>/dev/null) then kill $mysqld_pid sleep 2f

Java 线程池 +生产者消费者+MySQL读取300 万条数据

1.1需求数据库300 万条用户数据 ,遍历获取所有用户, 各种组合关联, 获取到一个新的json ,存到redis 上. 1.2 难点数据库比较多, 不可能单线程查询所有的数据到内存. 1.3解决办法多线程读取, 生产者每次获取200 条数据, 消费者去消费.(这里主要是根据MySQL分页去获取下一个200 条数据) 1.4 代码 1.4.1 调用方法 /** * 线程启动 */ public void update() { //redis操作类 HashRedisUtil redi

MySql实现分页查询的SQL，mysql实现分页查询的sql语句（转）

http://blog.csdn.net/sxdtzhaoxinguo/article/details/51481430 摘要:MySQL数据库实现分页查询的SQL语句写法! 一:分页需求: 客户端通过传递start(页码),limit(每页显示的条数)两个参数去分页查询数据库表中的数据,那我们知道MySql数据库提供了分页的函数limit m,n,但是该函数的用法和我们的需求不一样,所以就需要我们根据实际情况去改写适合我们自己的分页语句,具体的分析如下: 比如: 查询第1条到第10条的数据的s

读取nagios数据库至MySQL

读取NAGIOS数据库至MYSQL 1.DBI的安装 wget http://www.cpan.org/modules/by-module/DBI/DBI-1.625.tar.gz tar xf DBI-1.625.tar.gz cd DBI-1.625 yum -y install perl-ExtUtils-CBuilder perl-ExtUtils-MakeMaker perl Makefile.PL make make install 2.DBD的安装 wget http://www.

c#分页读取GB文本文件

原文:c#分页读取GB文本文件应用场景: a.我在做BI开发测试的时候,有可能面对source文件数GB的情况,如果使用一般的文本编辑器,则会卡死,或要等很久才能显示出来. b.有时候,我们使用ascii(01)或ascii(02)作为行或列的分隔符,这样的临时文件用于导数据到DB,如果文件导入过程中有错误,需要查看文件的时候,普通的编辑器不支持换行,则会很恐怖. 为解决这两个需求,我使用c#完成了一个简单的winform的应用程序. 功能列表: 1.根据配置的行数,写测试文件,指定行终止符

Struts2+Hibernate3+Spring三大框架技术实现MySQL数据分页

原文:Struts2+Hibernate3+Spring三大框架技术实现MySQL数据分页源代码下载地址:http://www.zuidaima.com/share/1550463494638592.htm 本项目采用了Struts2,Hibernate3,Spring三框架技术来实现对MySQL中的数据进行分页,在本机上面测试通过了,特此分享 java源代码截图:

Linux shell逐行读取文件的方法

Linux shell逐行读取文件的方法在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法.为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率. 方法1:while循环中执行效率最高,最常用的方法. function while_read_LINE_bottm(){ While read LINE doecho $LINEdone < $FILENAME} 注释:我习惯把这种方式叫

c#分页读取GB文本文件实例

本文实例讲述了c#分页读取GB文本文件的方法.分享给大家供大家参考.具体如下: 一.应用场景: ① .我在做BI开发测试的时候,有可能面对source文件数GB的情况,如果使用一般的文本编辑器,则会卡死,或要等很久才能显示出来. ② .有时候,我们使用ascii(01)或ascii(02)作为行或列的分隔符,这样的临时文件用于导数据到DB,如果文件导入过程中有错误,需要查看文件的时候,普通的编辑器不支持换行,则会很恐怖. 为解决这两个需求,我使用c#完成了一个简单的winform的应用程序.

猜你喜欢

js使用技巧大全

1.防止重新构建 var constructedHtml = ""; for(var i = 0,len = arr.length;i < len;i++){ constru ...

Stars_树状数组

Problem Description Astronomers often examine star maps where stars are represented by points on a p ...

entity framework 新手入门篇（3）-entity framework实现orderby，count，groupby，like，in，分页等

前面我们已经学习了entityframework的基本的增删改查,今天,我们将在EF中实现一些更加贴近于实际功能的SQL方法. 承接上面的部分,我们有一个叫做House的数据库,其中包含house表和 ...

同时安装office2016与visio2016的实现过程

visio 2016安装问题同时安装office2016与visio2016的实现过程 visio2016 but failed

矩阵乘法专题4——bzoj 2326 [HNOI2011] 数学作业题解

转载请注明:http://blog.csdn.net/jiangshibiao/article/details/24963747 [原题] 2326: [HNOI2011]数学作业 Time Limi ...

springMVC框架+POI组件导出Excel

目的:访问url(http://localhost:8080/POIOutputExcel/outputexcel.do)实现excel导出,效果图如下: 文件目录(配置文件就不多说了,跟前面的随笔一 ...

LAMP架构搭建与优化（3.0-3.2）

mysql配置讲解 vim /etc/my.cnf (这是MySQL的配置文件),核心配置文件是MySQLD 端口:监听socket:是否要过滤lock锁:key_buffer_size主要用于索引块 ...

Android自定义控件的属性配置

在Android的xml布局文件里,xmlns:android="http://schemas.android.com/apk/res/android",就是定义了xml的命名空间 ...

文本省略并显示省略号

css部分 /*p标签超出文字省略号*/p{ width: 150px; white-space: nowrap; overflow: hidden; text-overflow: ellipsis; ...

037医疗项目-模块四：采购单模块—采购单数据模型

上一篇文章我们知道了采购的需求.这篇文章我们就要看一下采购单模块的数据库怎么去建立. 我们设计时采用两张表: 1:采购单基本信息表(YYCGD): 也就是对应的页面上的: 当然我们设计数据库的时候不可 ...

各种排序函数（摘）

sort的应用: 1.可以传入两个参数: sort(a,a+N) ,其中a是数组,a+N表示对a[0]至a[N-1]的N个数进行排序(默认从小到大排序): 2.传入三个参数: sort(a,a+N,c ...

奥日与黑暗森林源码赏析

1.使用Conditional代替方法的#if xxx,参考自MoonDebug [Conditional("UNITY_EDITOR"), Conditional("D ...

Java程序员必须知道的几种系列辅助开发工具

集成开发环境 Eclipse是最有名也最广泛使用的Java集成开发环境(IDE),允许开发者结合语言支持和其他功能到任何的默认包中,而且Eclipse市场有许多定制和扩展的插件. IntelliJ已经 ...

[2016-03-23][codeforces][208][A][Dubstep]

时间:2016-03-23 00:06:45 星期三题目编号:[2016-03-23][codeforces][208][A][Dubstep] 题目大意:把字符串中的 "WUB" ...

信号完整性第二章小结

信号的上升时间通常是从终值的10%~90%的时间理想方波的频谱幅度以速率1/f下降如果去掉方波中较高的频率分量,上升时间久会增加信号的带宽是0.35/(信号的上升时间) 只要减小信号带宽,上升时 ...

ie8 ajax 跨域问题

最近做了个客服端要通过ocx获得初始化数据就是一个html页面镶嵌在一个c++做的程序里面通过c++做的程序的一个按钮来打开我的这个html页面但是页面中的ajax就是用不了又不报错后来加入了cro ...

linux笔记_day06

1.用户:表示符,凭证 2.用户组:表示符进程也是有属主和属组的安全上下文(secure context): 用户:UID,/etc/pawwd 组:GID ,/etc/group 影子口令: 用 ...

C#利用摄像头拍照功能实现

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...

怎么样获取PHP变量的变量名之扩展实现

很长时间没有更新博客了. 一来最近工作比较忙,没有时间好好研究问题, 二是觉得没有很好的材料可以写. 也有一些没有彻底研究透的问题,写着写着没有了头绪,都扔在了草稿箱里了. 这次顺带也要更新一下博客的 ...

F# 两个新Bug，集中在 module 中

新年发布F#的两个 Bug,都集中在 module 中. 第一个是:[<CLIEvent>] 特性在 module 中不起作用,CLIEvent 的作用是使 F# 的事件编译后生成标准接口 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.