原课程计划里并没有这篇内容,今天在群里讨论SSAS的负载均衡方案,有网友提到Remote Partition远程分区,恕我孤陋寡闻,之前未曾了解过这个解决方案,阅读了官方的文档后觉得这个的确很有益处,这里记录下Demo实践的过程供大家参考,并特此鸣谢方案的提出者"理想"同学,很多时候真的是没有做不到,只有想不到。
https://technet.microsoft.com/en-us/library/ms174837(v=sql.90).aspx
上面连接是我这个Demo所参考的官方向导,向导文档是基于SQL 2005版本的,而我这里使用的是SQL 2012,包括AW MD Project也是2012版,所以Demo会和向导文档略有差异。
首先需要准备两个SSAS Instance,实际环境中这两个实例必须是在两个不同的Server上才有意义,不然怎么叫远程分区呢?我这里条件有限,仅在同一台Server上安装了两个Instance,一个默认实例localhost作为Master Instance,部署了AW多维数据集,如下图所示
另一个实例localhost\Remote作为部署远程分区的Subordinate Instance,暂时还没有任何内容
分别配置两个SSAS实例的参数项LinkFromOtherInstanceEnabled和LinkToOtherInstanceEnabled为true,两个实例都需要设置这两个参数,右击SSAS数据源选择Property属性,在Analysis Server Properties的General页面里找到这两个参数并修改为true,保存退出后可能需要重启下SSAS Service,我在Demo过程中没有手动重启,但期间死机重启过一次,所以也不知道具体要不要重启。。。。。。
下面我们为Subordinate Instance新建一个MD项目,命名为AdventureWorksDW_Remote以区分Master Instance的AdventureWorksDW2012Multidimensional-EE,在这个新建的项目上创建Data Sources连接到Master Instance,Provider选择OLE DB for Analysis Services,Server设置为localhost默认实例,Initial catalog选择AdventureWorksDW2012Multidimensional-EE,如下图所示
然后右击这个MD项目,点击Edit Database, Properties属性页面设置MasterDataSourceID为Adventure Works DW2012 Multidimensional-EE
最后配置部署选项,设置Server为localhost\Remote实例
部署这个项目后在SSMS里刷新.\Remote实例下的Databases数据源,看到这个项目如下图
接着我们再回到Master Instance去修改AdventureWorksDW2012Multidimensional-EE,首先需要修改Internet Sales Order Details.dim的StorageMode属性,默认这个维度时Rolap,这里必须要修改为Molap
这是因为我们接下来需要设置Fact Internet Sales部分分区部署到远程实例,SSAS要求所有跟Fact Internet Sales相关的维度必须是Molap存储模式,否则会报以下错误信息
接着需要新建一个Data Sources数据源连接到Subordinate Instance,我命名为Adventure Works DW Remote,具体配置见下图,这样才能使两个实例互相通信
打开Partitions设置页面,我们现在要把Fact Internet Sales 2008年的分区设置到远程部署,定位到Internet_Sales_2008分区,到Properties属性页面设置StorageLocation,
选择Remote Analysis Services Data Source为上一步创建的数据源Adventure Works DW Remote,OK确定
最后部署更新并full process这个MD项目,到SSMS Object Explorer里查验Master Instance如下,Data Sources里有远程SSAS和本地DW两个数据源,Fact Internet Sales下面有四个分区,注意Internet_Sales_2008这个分区也是存在于Master Instance的,只不过这里仅仅是个"指针",2008年的Sales事实数据并不是存储在这个实例下面
我们到以下路径查看Master Instance下面Internet_Sales_2008年的分区文件夹,里面仅仅看到一个51k的xml文件保存了一些Metadata,真正的数据文件不在这个实例持久化
C:\Program Files\Microsoft SQL Server\MSAS11.MSSQLSERVER\OLAP\Data\AdventureWorksDW2012Multidimensional-EE.0.db\Adventure Works.0.cub\Fact Internet Sales 1.0.det\Internet_Sales_2008.0.prt
再到SSMS Object Explorer里查验Subordinate Instance如下,Data Sources里有远程SSAS和远程DW两个数据源,Fact Internet Sales下面只有一个分区Internet_Sales_2008
到以下路径查看Subordinate Instance下面Internet_Sales_2008年的分区文件夹,里面能看到很多数据文件,这个文件夹占用了2M磁盘空间,说明真正的数据文件确实被部署到远程实例了
C:\Program Files\Microsoft SQL Server\MSAS11.REMOTE\OLAP\Data\AdventureWorksDW_Remote.0.db\Adventure Works.0.cub\Fact Internet Sales 1.0.det\Internet_Sales_2008.0.prt
此时如果客户端做如下查询请求,对2007和2008两年的Internet Sales事实度量值聚合分析
Profiler在Master Instance捕捉到以下MDX脚本
SELECT {[Measures].[Internet Sales Amount],[Measures].[Order Count]} DIMENSION PROPERTIES PARENT_UNIQUE_NAME,HIERARCHY_UNIQUE_NAME ON COLUMNS ,
NON EMPTY Hierarchize(DrilldownMember({{DrilldownLevel({[Date].[Calendar].[All Periods]},,,INCLUDE_CALC_MEMBERS)}},
{[Date].[Calendar].[Calendar Year].&[2007],[Date].[Calendar].[Calendar Year].&[2008]},,,INCLUDE_CALC_MEMBERS)) DIMENSION PROPERTIES PARENT_UNIQUE_NAME,HIERARCHY_UNIQUE_NAME,
[Date].[Calendar].[Calendar Semester].[Calendar Year] ON ROWS
FROM (SELECT ({[Date].[Calendar].[Calendar Year].&[2008], [Date].[Calendar].[Calendar Year].&[2007]}) ON COLUMNS FROM [Adventure Works]) CELL PROPERTIES VALUE, FORMAT_STRING, LANGUAGE, BACK_COLOR, FORE_COLOR, FONT_FLAGS
Master Instance主实例在拿到这个查询请求后,根据自己掌握的元数据判断到2007分区部署在本地实例,2008分区部署在远程实例,命令两个实例并发执行各自分区的聚合查询,实际环境中这两个实例是在两台不同Server上部署,那么就可以同时利用两台Server的硬件资源,包括cpu, memory, disk io,达到了均衡负载的目的,最终主实例会把各Server查询的结果组织起来返回给客户端,那么这种聚合查询的性能将会与远程分区实例的数量成正比提升。