大数据量业务订制和解决方案思考

大数据量的系统要经过对数据的用处分析和数据周期分析，以寻求更好的解决方案。

1：业务系统的基础数据，如人员基础信息（基础资料，权限等）
.数据可以KEEP在内存中.数据要分散存储.基础数据逻辑要简洁.使用增量更新.高峰期来临前提前更新基础数据

2：热数据处理
此部分数据是各方面环境会频繁使用到的数据
对这部分数据的存储，比如
使用不一样的存储方式，比如建立高效的索引，使用SSD盘，或者使用mysql数据库存储

3：历史数据的迁移

近期数据
此类数据是需要最近频繁使用或者调用的数据，对OLTP系统而言此类数据是核心数据。
历史数据
此类数据主要做历史数据查询或者历史分析数据，建议迁移出OLTP系统数据库

4：报表数据的存储
对报表数据进行数据转换，从原始数据，转化到订制数据，再清理成报表数据

5：数据库业务拆分多表数据存储
将核心业务表进行拆分，既能提高数据库的性能，还能提高数据的安全

6：索引数据的存储
无效索引的删除与索引的定期重建
和SSD盘的引入等处理

数据流转

数据中心
订制小数据中心围绕中心数据库

数据分发机制
按区域城市等进行数据分发

中心数据入库后的流转

MYSQL:查询类系统：如网站的查询

多套ORACLE:多用途系统：如备份、物流监控，报表等

ORACLE:核心业务系统：信息流、物流、资金流全流程控制系统

大数据分析系统：对历史数据或者大数据进行分析。

时间： 2024-08-14 00:24:08

大数据量业务订制和解决方案思考的相关文章

MYSQL数据库导入大数据量sql文件失败的解决方案

1.在讨论这个问题之前首先介绍一下什么是"大数据量sql文件". 导出sql文件.选择数据库-----右击选择"转储SQL文件"-----选择"结构和数据" .保存文件db_mras.sql文件. 2.导入sql文件.在MYSQL中新建数据库db_mras.选择数据库-----右击选择"运行SQL文件"-----选择文件db_mras.sql,运行. 现在发现运行失败,提示错误"MySQL server has g

关于poi导出大数据量EXCEL导出缓慢的解决方案--生成xml格式的表格文件

今天遇到了一个POI导出EXCEL文件结果文件大小太大导致系统运行缓慢的问题.想到了使用输出XML格式的表格来完成. 首先,我们需要理解一下为什么POI导出EXCEL文件会导致文件大小变大.最主要的原因应该是POI变成中经常会对无关的单元格设置属性.例如:一个EXCEL工作表的最大列数为256,我们只使用10列.而编程时经常会将256列全部渲染格式,造成很大的资源浪费.当然应该还有其他很多原因也会造成表格变大. 使用这个方案的前提是对于表格的格式要求不高,因为使用的是自己的工具,没有POI优化了

WCF大数据量传输解决方案

文章内容列表:1．场景:2．解决方案3. WCF契约与服务实现设计静态图4. WCF契约与服务实现设计详细说明6. 服务端启动服务代码:7. 客户端代码8. WCF大数据量传输解决方案源码下载 1．场景: WCF在网络传输中,大数据量传输造成网络阻塞,宽带无法承受: 2．解决方案解决WCF在网络传输中的大数据量问题: A．需要把相关数据序列化成字节流,再对字节流进行压缩,再进行传输,到了客户端再做反向操作便可获得原始数据. B．如果压缩后的数据仍然较大时,可以再压缩流后,再对流进行

大数据量、高并发数据库的高性能、高可用性解决方案

大数据量.高并发数据库的高性能.高可用性解决方案: 1.拆表:大表拆小表(垂直拆,水平拆:分表,分区partition,分片sharding),可以在应用层实现,也可以在数据库层面实现一部分:提高系统性能. 2.分库:把表放到不同的数据库,这也是分布式数据库的基础:提高系统性能. 3.分布式:不同的数据库放到不同的服务器:提高系统性能. 4.集群:使用数据库复制等技术组建集群,实现读写分离.备份等:提高系统性能.可用性. 5.缓存:对常用的数据进行缓存.提高系统性能. 6.备份:主从库,快照,热

任何抛开业务谈大数据量的sql优化都是瞎扯

周三去某在线旅游公司面试.被问到了一个关于数据量大的优化问题.问题是:一个主外键关联表,主表有一百万数据,外键关联表有一千万的数据,要求做一个连接. 本人接触过单表数据量最大的就是将近两亿行历史数据(某运营商一业务一年数据)做查询,所有查询相关列必须做索引,而且还要保证不会出现全表扫描情况.也从来没有试过把这么多数据全部拿出来放内存中.只好回答说“再怎么做优化估计都不行,这数据量太大了,性能肯定吃不销.我只能告诉尽可能的添加过滤条件,不要一次用这么多的数据来做连接,能分批做就分批做吧”. 面试人

大数据量下高并发同步的讲解(转)

文章转自:http://blog.csdn.net/xcw931924821/article/details/52475742 *************************************************************************************************************************************************************************************** 对于

大数据量下高并发同步的讲解（不看，保证你后悔）

对于我们开发的网站,如果网站的访问量非常大的话,那么我们就需要考虑相关的并发访问问题了.而并发问题是绝大部分的程序员头疼的问题, 但话又说回来了,既然逃避不掉,那我们就坦然面对吧~今天就让我们一起来研究一下常见的并发和同步吧. 为了更好的理解并发和同步,我们需要先明白两个重要的概念:同步和异步 1.同步和异步的区别和联系所谓同步,可以理解为在执行完一个函数或方法之后,一直等待系统返回值或消息,这时程序是出于阻塞的,只有接收到返回的值或消息后才往下执行其它的命令. 异步

大数据量下高并发同步的讲解(不看，保证你后悔！)

偶然的机会在网上看到了这篇blog,觉得作者写得挺不错的(虽然自己并没有怎么看懂...),所以就转来跟大家分享分享吧~~~ 对于我们开发的网站,如果网站的访问量非常大的话,那么我们就需要考虑相关的并发访问问题了.而并发问题是绝大部分的程序员头疼的问题, 但话又说回来了,既然逃避不掉,那我们就坦然面对吧~今天就让我们一起来研究一下常见的并发和同步吧. 为了更好的理解并发和同步,我们需要先明白两个重要的概念:同步和异步 1.同步和异步的区别和联系所谓同步,可以理解为在执行完

大数据量高并发的数据库优化

一.数据库结构的设计如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能.所以,在一个系统开始实施之前,完备的数据库模型的设计是必须的. 在一个系统分析.设计阶段,因为数据量较小,负荷较低.我们往往只注意到功能的实现,而很难注意到性能的薄弱之处,等到系统投入实际运行一段时间后,才发现系统的性能在降低,这时再来考虑提高系统性能则要花费更多的人力物力,而整个系统也不可避免的形成了一个打补丁工程. 所以在考虑整个系统的流程的时候,我们必须