报表性能优化方案之报表取数

1. 取数原理

设计器拼出最终的SQL,将SQL语句传给数据库,数据库执行,将数据返回给设计器。

由于计算过程首先要通过SQL语句从数据库中取数据,我们可以通过控制数据量的大小和对数据的提前预处理来提高报表的性能。下面是一些优化的方法。

2. 优化SQL

FineReport报表的数据集采用的是表模型,也就是说通过SQL这种DSL语言,从数据库通过简单查询或各种组合关联查询得到一个关系表,而这部分SQL查询根据各种数据库产商长时间的优化(比如建立索引),已经非常成熟。数据集一般要通过FineReport报表模型的复杂处理才能生成最终的表样。因此,从数据库SQL查询取出数据量越少,FineReport报表模型需要做的复杂处理和计算就越少,所花的时间和内存就少,从而可以提高性能。

2.1 SQL语句取具体的字段

我们一般会用select * from 这样的形式将一个数据库表中所有的字段都取出来,而其中一些字段是报表中不需要用到的,例如报表中只需要用到三个字段,但是数据库中实际的表有十个字段,一些初学者习惯性的用select * from table1,这样相当于把十个字段的数据都取到报表服务器端,增加了报表服务器端的内存占用以及减慢了运算速度,所以SQL语句中尽量不要用“*”号,而是写上具体的字段,能够减少报表服务器端的内存占用,加快报表的运算速度。

2.2 SQL中直接分组代替报表中分组

一些汇总类型的报表,例如制作一张订单总额的表,可能会从订单明细表中取出大量的数据记录,然后进行数据汇总,即进行分组聚集运算,报表计算过程中我们可以在SQL中提前进行一次分组聚集,能够大大减少取到的报表服务器的记录数,加快取数和报表运算的速度。

SQL语句:SELECT 成本价,类别ID FROM 产品

从数据库中选择如上两个字段,然后根据类别ID进行成本价的汇总,此时数据库返回给报表处理的数据就有77条。如下:


优化的SQL语句:SELECT sum(成本价),类别ID FROM 产品 group by 类别ID

经过SQL优化后,报表需要处理的数据就只剩8条了。如下:


优化分析:

第一种做法,不仅仅取到报表服务器上记录数多了,取数速度慢,而且报表模型需要对表数据列进行分组运算,增加了报表运行时间;

第二种做法,数据库虽然要进行分组运算,但是数据库中有索引,运算速度快,且取到报表服务器端的记录数大大减少,取数速度大大加快,因此在报表模型进行分组运算的时候只要对很少的记录数进行,报表的运算速度大大加快了。

实验结果以及分析表明,第二种做法的性能远优于第一种。所以,分组应该尽量在sql里进行。

2.3 SQL中直接排序代替报表中排序

报表计算过程中很多时候需要对数据进行排序,虽然排序运算可以在报表端进行,不过我们还是建议在SQL中提前将数据排序,这是因为数据库中索引功能,通常是C/C++语言(往往在效率上比Java好)写的,会使得排序运算的速度很快。

2.4 SQL中直接过滤代替报表中过滤

报表计算过程中很多时候并不需要对表中的所有记录进行操作,而只是需要对部分满足条件的记录进行操作,虽然可以在报表设计器中对数据过滤,不过我们建议在SQL中对数据提前过滤,这样数据库返回的数据就减少了,既加快了取数速度,也加快了报表的运算速度。

3. 使用视图、存储过程

视图是由SELECT语句组成的查询定义的虚拟表,由一张或多张数据库实际的表中的数据组成的,从数据库系统外部来看,视图就如同一张表一样。

存储过程通过流控制与SQL语句,可以对数据进行强大的运算与处理,对于业务比较复杂的应用,常常需要将原始数据通过存储过程处理后再供报表使用。另外存储过程运行前,数据库会对其进行语法和句法的分析,并进行优化,这种已经编译好的存储过程极大地改善SQL语句的性能。在报表端也只需要书写较短的调用语句来获得结果,从而降低网络的通信量。

所以表与表的连接、复杂的SQL尽量在数据库中使用视图或者存储过程直接进行,这样将复杂的SQL语句直接保存于数据库服务器端(数据库本身会对SQL语句进行语法分析并进行优化),在报表设计器端就不需要写大段的SQL语句而是直接调用视图或存储过程了,一方面减少网络传输量,减轻数据库的压力,另一方面加快了报表的运算速度。

时间: 2024-10-16 10:37:27

报表性能优化方案之报表取数的相关文章

报表性能优化方案之报表计算时间

1. 问题描述 完成报表取数后,设计器会对数据库返回的数据进行扩展.分组.列表.汇总等运算,好的模板制作习惯往往可以优化报表的计算时间. 以下示例报表开发工具:FineReport. 2. 解决方案 2.1 空白单元格应用 报表中,只要一个单元格里有设置就会占用一份内存,而空白的单元格几乎是不占任何内存的.报表中由于布局的需要,不可避免地会出现一些只起到占位作用而无需其他的设置的单元格:尽量将这些单元格设成空白单元格,这样能够有效的减少内存的占用,加快报表的运算速度. 2.2 慎用隐藏行列 报表

报表性能优化方案之报表服务器优化基础讲解

一.内存 JVM堆栈内存是决定应用服务器性能的关键指标,一般服务器默认的内存配置都比较小,在较大型的应用项目中,这点内存是不够的,因此需要进行查看与修改Web服务器内存大小,接下来就介绍服务器内存查看的方法以及不同服务器内存的修改方式. 各应用服务器的内存配置方法不尽相同,如下列出了常用服务器的JVM参数(-Xms,-Xmx)配置方法. JVM参数定义: - Xms: 初始化内存大小 - Xmx: 可以使用的最大内存 以下示例工具:报表开发工具FineReport 二.服务器内存的查看 如果您想

报表性能优化方案之报表缓存路径

1. 问题描述 若启用了磁盘缓存,默认的会在C:\Documents and Settings\Administrator\.FineReport80(windows下)下创建cache即缓存文件夹,一般呢,C盘的空间会很小,如保存在C盘会增加对C盘的压力,那么有没有方法让其保存到别的盘符下呢? 解决方案提供工具:报表开发工具FineReport. 2. 解决方案 通过修改%FR_HOME%\WebReport\WEB-INF\resources\目录下的cache.xml文件(报表管理平台中设

报表性能优化方案之行引擎执行层式报表

1. 问题描述 这样一种报表:报表形式非常简单,只是简单的单数据源明细报表,但是数据量非常大,百万.千万甚至更多.报表取数及计算时间相当长. 希望能够提高报表展示速度,对于用户来说,查询报表不会有滞后的感觉. 解决方案提供工具:报表开发工具FineReport. 2. 解决方案 2.1 解决方案 对于单数据源明细报表,可以启用行引擎来执行报表,提高报表展示速度,优化用户体验. 2.2 原理 普通报表:取出全部数据后再执行报表,最后返回整体的报表结果给浏览器,用户访问到看到结果的时间=报表取数时间

报表性能优化方案之数据集缓存与共享

1. 问题描述 对于大数据量报表,若每次直接从数据库中查询数据,不仅增加数据库服务器的压力,也极大的影响了取数的速度从而降低了报表的执行速度,为此FineReport提供了数据集缓存与共享功能. FineReport可先将其数据集查询的结果缓存下来,对于缓存下来的数据,再次使用到相同数据集时,无需再次连接数据库重新查询数据,直接使用缓存下来的结果,即使用FineReport的数据集共享机制,达到资源复用,减少取数时间从而提高了报表的展现速度. 2. 数据集缓存 缓存分为缓存至内存和缓存至磁盘.

报表性能优化方案之单数据集分页SQL实现层式报表

1.概述 我们知道,行式引擎按页取数只适用于Oracle,mysql,hsql和sqlserver2008及以上数据库,其他数据库,如access,sqlserver2005,sqlite等必须编写分页SQL. 下面以Access数据库为例介绍需要写分页SQL的数据库怎样利用行式的引擎实现层式报表. 解决方案提供工具:报表开发工具FineReport 2.解决思路 对于mysql这类可以直接使用行式的引擎实现层式报表的数据库来说,如果勾选了行式引擎,程序会自动生成分页sql,如,我新建了一个数据

报表性能优化方案之巧用相邻连续分组

1. 问题描述 在数据显示方式章节内容中,我们已介绍分组的两个不同使用场景:普通分组和相邻连续分组.但其使用相邻连续分组功能,更主要原因是能够提高其报表的性能. 示例报表开发工具:FineReport 2. 原理 相邻连续分组的操作,是将数据集中连在一起的相同数据才进行合并的.尤其是,在配合SQL中已排好序的列,对其实现的分组时,使用此分组方式其性能比普通分组快些.如下简单示例,查看其报表执行数据信息,可看出其分组方式比普通分组方式更能提高其报表的性能. 3. 实现步骤 3.1 新建报表 3.2

报表性能优化方案之善用参数注入

1. 问题描述 对于多数据集关联报表,当数据很大时报表的展现速度就会很慢,或通过写sql语句又很复杂.为此FineReport提供一种,既可加快报表的展现速度,又不用编写复杂的sql语句的方案.即使用动态参数注入功能. 2. 原理 动态参数注入,是通过注入的值对数据库中的数据进行操作的,只是取对应的数据,所以会提高报表的性能. 3. 示例 新建模板 展现多个关联数据表的数据 SQL语句,ds1:SELECT * FROM [订单] SQL语句,ds2:SELECT * FROM 订单明细 报表样

报表性能优化方案之多数据集实现层式报表

1. 问题描述若报表使用的数据量是上百万条的话,觉得报表展现的速度慢,可以使用层式报表来提高报表展现速度.但由层式报表章节可以得知,层式报表必须是单数据集,若是多数据集的模板且数据量又很大,想要提高报表的查询速度要如何实现呢? 2. 实现思路在定义数据集时通过使用数据库本身的行序号或者使用数据库函数生成行序号(即行号)并且在where条件中通过页码参数使得行号在一定范围内显示,点击自定义的上一页下一页按钮时重新传入页码参数取出相应的数据. 注:SQL Server2000无法生成行号,因此需要定