TokuDB在生产环境的应用场景(zabbix也可以)

一 、背景介绍

近年来,TokuDB作为MySQL的大数据(Big Data)存储引擎受到人们的普遍关注。其架构的核心基于一种新的叫做分形树(Fractal Trees)的索引数据结构,该结构是缓存无关的,即使索引数据大小超过内存性能也不会下降,也即没有内存生命周期和碎片的问题。特别引人注意的是,TokuDB拥有很高的压缩比(官方称最大可达25倍),可以在很大的数据上创建大量的索引,并保持性能不下降。同时,TokuDB支持ACID和MVCC,还有在线修改表结构(Live Schema Modification)以及增加的复制性能等特性,使其在某些特定的应用领域(如日志存储与分析)有着独特的优势。
在TokuDB的应用场景中,通常是数据库插入操作的量远远大于读取的量,因而本此本测试是在公司生产库上增加一个从库,来体验下TokuDB的高压缩比和低存储占用率,而且在相同数据的情况下io使用率更优秀。

本测试是在生产环境中增加一个从库,来验证ToKuDB在大频率写入,小频率读的场景验证。

一、首先我们导出生产环境主库的表结构跟数据。

1、导出主库表结构(为脱敏处理把库名更改为test)

shell>

mysqldump -p --no-data --databases test >test_table.sql

2、导出数据

shell>

mysqldump -p -t --master-data=2 test >test_data.sql

3、处理表结构语句

把所有innodb存储引擎为表改为tokudb
shell>

sed -i '[email protected]@[email protected]' test_table.sql

4、拷贝数据到需要建立的TokuDB从库服务器上

二、创建percona TokuDB版本从库

下载相应的二进制包

下载地址

1、优化系统参数,是系统可以满足TokuBD的安装要求

关闭系统透明大页
shell>

echo never > /sys/kernel/mm/transparent_hugepage/enabled

shell>

echo never > /sys/kernel/mm/transparent_hugepage/defrag

2、创建mysql用户增加数据目录

shell>

groupadd mysql

shell>

useradd -r -g mysql -s /sbin/nologin mysql

shell>

cd /opt

shell>

tar -xf XeLabs-TokuDB-5.7.19-Centos6-r1.X86_64.tar.gz

shell>

ln -s /opt/XeLabs-TokuDB-5.7.19-Centos6-r1.X86_64 /usr/local/mysql

shell>

mkdir /data/mysql/mysql3306/{data,logs,tmp} -p

shell>

chown mysql.mysql /usr/local/mysql/ /usr/local/mysql /data/mysql -R

[[email protected] ~]#

cat >/etc/my.cnf<<EOF
[client]
port = 3306
socket = /tmp/mysql3306.sock
default-character-set=utf8mb4
[mysql]prompt="\[email protected]\h [\d]>"
#pager="less -i -n -S"
#tee=/opt/mysql/query.log
no-auto-rehash
[mysqld]
#misc
user = mysql
basedir = /usr/local/mysql
datadir = /data/mysql/mysql3306/data
port = 3306socket = /tmp/mysql3306.sock
event_scheduler = 0
default-storage-engine=tokudb
skip-name-resolve
tmpdir = /data/mysql/mysql3306/tmp
#
timeoutinteractive_timeout = 2880000
wait_timeout = 2880000
#character set
character-set-server = utf8mb4
open_files_limit = 65535
max_connections = 100
max_connect_errors = 100000
lower_case_table_names =1
#
explicit_defaults_for_timestamp=1
#symi replication
#rpl_semi_sync_master_enabled=1
#rpl_semi_sync_master_timeout=1000 # 1 second
#rpl_semi_sync_slave_enabled=1
#logs
log-output=file
slow_query_log = 1
slow_query_log_file = slow.log
log-error = error.log
pid-file = mysql.pid
long_query_time = 1
log_error_verbosity=1
#log-slow-admin-statements = 1
#log-queries-not-using-indexes = 1
log-slow-slave-statements = 1
#binlog
#binlog_format = STATEMENT
binlog_format = row
server-id = 43306
log-bin = /data/mysql/mysql3306/logs/mysql-bin
binlog_cache_size = 1M
max_binlog_size = 256M
max_binlog_cache_size = 4M
sync_binlog = 0
expire_logs_days = 10
#procedure
log_bin_trust_function_creators=1
#
gtid-mode = on
enforce-gtid-consistency=1
#relay log
skip_slave_start = 1
max_relay_log_size = 128M
relay_log_purge = 1
relay_log_recovery = 1
relay-log=relay-bin
relay-log-index=/data/mysql/mysql3306/logs/relay-bin.index
log_slave_updates
#slave-skip-errors=1032,1053,1062
#buffers & cache
table_open_cache = 2048
table_definition_cache = 2048
table_open_cache = 2048
max_heap_table_size = 96M
sort_buffer_size = 128K
join_buffer_size = 128K
thread_cache_size = 200
query_cache_size = 0
query_cache_type = 0
query_cache_limit = 256K
query_cache_min_res_unit = 512
thread_stack = 192K
tmp_table_size = 96M
key_buffer_size = 8M
read_buffer_size = 2M
read_rnd_buffer_size = 16M
bulk_insert_buffer_size = 32M
#myisam
myisam_sort_buffer_size = 128M
myisam_max_sort_file_size = 10G
myisam_repair_threads = 1
#innodb
innodb_buffer_pool_size = 4096M
innodb_buffer_pool_instances = 1
innodb_data_file_path = ibdata1:100M:autoextend
innodb_flush_log_at_trx_commit = 2
innodb_log_buffer_size = 8M
innodb_log_file_size = 100M
innodb_log_files_in_group = 3
innodb_max_dirty_pages_pct = 50
innodb_file_per_table = 1
innodb_rollback_on_timeout
innodb_status_file = 1
innodb_io_capacity = 2000
transaction_isolation = READ-COMMITTED
innodb_flush_method = O_DIRECT
loose_tokudb_cache_size=100M
loose_tokudb_directio=ON
loose_tokudb_fsync_log_period=1000
tokudb_commit_sync=0
EOF

初始化无密码的数据库

shell>

cd /usr/local/mysql/bin/ && ./mysqld --initialize-insecure

启动MySQL数据库

shell>

cp support-files/mysql.server /etc/init.d/mysqld

shell>

/etc/init.d/mysqld start

增加MySQL环境变量

shell>

echo 'export PATH=/usr/local/mysql/bin:$PATH' >>/etc/profile

shell>

source /etc/profile

导入表结构

shell>

mysql -p test<test_table.sql

清理GTID信息

shell>

mysql -e 'reset master'

导入数据

shell>

mysql -p test <test_data.sql
执行change master 操作

mysql>

change master to master_host='192.168.1.10',master_port='3306',master_user='repl',master_password='repl',master_auto_position=1;

mysql>

start slave;

mysql>

show slave status\G

[email protected] [(none)]>show slave status\G

* 1. row *
Slave_IO_State: Waiting for master to send event
Master_Host: 192.168.1.1
Master_User: repl
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: mysql-bin.000029
Read_Master_Log_Pos: 900797194
Relay_Log_File: relay-bin.000028
Relay_Log_Pos: 68956928
Relay_Master_Log_File: mysql-bin.000029
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 900797194
Relay_Log_Space: 203175161
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Master_Server_Id: 1303306
Master_UUID: d54f3590-7760-11e7-9f22-fa163e3dde13
Master_Info_File: /data/mysql/mysql3306/data/master.info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set: d54f3590-7760-11e7-9f22-fa163e3dde13:31849593-32456621
Executed_Gtid_Set: 05c9edae-dee5-11e7-91fb-fa163ecf7778:1-2,
d54f3590-7760-11e7-9f22-fa163e3dde13:1-32456621
Auto_Position: 1
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
1 row in set (0.00 sec)

[email protected] [(none)]>

支持主从环境搭建完毕。

对比下主库InnoDB存贮引擎数据与从库TokuDB存储引擎的数据大小对比

innodb存储在6G
tokudbdb 存储在不到1G

在3.6G 大小sql语句下插入 innodb存储引擎与tokudb存储引擎磁盘iO对比

由此可见tokudb在磁盘节约和io使用上在写场景比较多的业务中相当给力

时间: 2024-10-11 17:07:28

TokuDB在生产环境的应用场景(zabbix也可以)的相关文章

Zabbix监控平台(三)生产环境案例

Zabbix监控平台(三)生产环境案例 一,Zabbix生产环境监测案例概述 1.1 项目规划 1.2 SNMP监控流程 1.3 IPMI 1.4 JMX(使用Zabbix Java Gateway代理) 1.5 实战监控Nginx,Apache,MySQL,PHP-fpm 1.6 Zabbix的Web监测 二,Zabbix监控MySQL数据库操作实战 2.1 编写监控脚本 2.2 在zabbix-agent端创建自定义键值配置文件 2.3 在zabbix-server端测试键值 2.4 在za

centos7 Mysql5.7.15版本 一主一备架构(生产环境带数据,不锁库)

1.概述 场景:生产线上,有一个MySQL数据库,为了安全,领导想给它做成主备架构,添加一个备库来做实时数据同步. 在操作之前需要考虑的问题: 如果有条件的话,获取生产库上,操作系统及数据库安装文档,认真观看,有没有对系统及数据库做一些特殊的配置. (1)操作系统方面: 是否设置主机名: 配置静态IP地址: 使用与主库一样的操作系统: 操作系统所使用的字符集: 主库操作系统有没有作其他更改. (2)MySQL数据库方面: 获取主库的my.cnf,备库配置文件要根据主库的my.cnf进行相应的配置

redis概述,特点,与Memached的不同,生产环境主从配置,redis配置文件解析

Redis概述: 是一个基于Key-Value的持久化数据库存储,支持丰富的数据类型,用C语言编写,可基于内存又可持久化的日志型.Key-Value数据库,并提供多种语言的API Redis特点 1.Key-Value健值类型存储 2.支持数据可靠存储及落地 3.单进程单线程高性能服务器 4.单机qps(每秒查询率)可以达到10w 5.适合小数据量高速读写访问 Redis跟Memached的不同 1.Redis可以持久化数据存储 2.性能高很,Redis能支持超过10W每秒的读写频率 3.丰富的

[原创译书] JS函数编程 3.2 开发和生产环境

?? Functional Programming in Javascript 主目录第三章 建立函数式编程环境 开发和生产环境 环境 编程风格与应用所部署或者将要部署的环境没啥关系.但是库就有关系了. 浏览器 主要的Javascript应用还是跑在客户端的,也就是浏览器.基于浏览器的环境对于开发来说非常好, 因为浏览器无处不在,你可以在本地机器上写代码,解释器是浏览器的Javascript引擎, 所有的浏览器都有开发者终端.火狐的FireBug提供了非常有用的错误信息,并支持断点等等, 不过同

Linux运维一:生产环境CentOS6.6系统的安装

CentOS 6.6 x86_64官方正式版系统(64位)下载地址 系统之家:http://www.xitongzhijia.net/linux/201412/33603.html 百度网盘:http://pan.baidu.com/s/1i5HSsnz 本博客大部分文章如无特别说明都是基于该系统之上的! Linux系统磁盘分区知识简介 1)磁盘在使用前一般要先分区 2)磁盘分区有主分区,扩展分区和逻辑分区之分.一块磁盘最多可以有4个主分区,其中一个主分区的位置可以用一个扩展分区替换,在这个扩展

生产环境使用 pt-table-checksum 检查MySQL数据一致性

公司数据中心从托管机房迁移到阿里云,需要对mysql迁移(Replication)后的数据一致性进行校验,但又不能对生产环境使用造成影响,pt-table-checksum 成为了绝佳也是唯一的检查工具. pt-table-checksum 是 Percona-Toolkit 的组件之一,用于检测MySQL主.从库的数据是否一致.其原理是在主库执行基于statement的sql语句来生成主库数据块的checksum,把相同的sql语句传递到从库执行,并在从库上计算相同数据块的checksum,最

理解Docker(6):若干企业生产环境中的容器网络方案

本系列文章将介绍 Docker的相关知识: (1)Docker 安装及基本用法 (2)Docker 镜像 (3)Docker 容器的隔离性 - 使用 Linux namespace 隔离容器的运行环境 (4)Docker 容器的隔离性 - 使用 cgroups 限制容器使用的资源 (5)Docker 网络 (6)若干企业生产环境中的容器网络方案 Docker 在早期只有单机上的网络解决方案,在 1.19 版本引入了原生的 overlay 网络解决方案,但是它的性能损耗较大,可能无法适应一些生产环

手游公司运维之利用Rundeck自动化运维工具和Shell脚本构建测试环境代码发布平台和生产环境代码发布平台

在做手游运维工作之前,我接触的代码发布都是常规的软件发布,有固定的发布周期.之前工作的那个外企有严格的发布周期,一年中的所有发布计划都是由Release Manager来控制,每次发布之前都需要做一些准备工作,如填写发布表单,上传发布需要的资源文件,联系发布过程中的相关人员,如开发和测试.最后在公司内部开发的发布平台上按照指定的时间点击鼠标对一个集群内的几台主机或全部主机进行代码发布.这个发布平台还是基于rsync服务实现的.虽然每个星期都有各种服务的发布,但是整个发布流程是可以控制的,并且发布

Docker适合生产环境了吗?

之所以称为生产环境就是因为它可以为企业创造利润.所以答案非常清晰:视情况而定. Docker.是现今最前沿的科技. 同时,它也是近10年最具挑战性的技术,原因在于它革新了软件开发.运维.系统架构.测试以及常规做法. Dokcer至今才诞生仅两年时间.你会用一个仅发展两年左右的数据库技术吗?亦或是一个操作系统?向前兼容性很差,升级会造成对先前软件的不兼容,这是Docker存在的问题,但请不要因这个事实丧失尝试的勇气. 同时,也还有一些大的碎片问题围绕在持续部署,网络及认证管理上.对于生产环境而言,