看SatisfyBI如何用SSAS构建数据仓库

  • A+
所属分类:赛迪思

SSAS是用于SQLServer数据库用于BI的组件,通过SSAS可以创建多维数据集,并在之上进行数据建模、数据挖掘、数据分析等操作。

 

那么下面介绍SatisfyBI是如何用SSAS建立数据仓库的?

 

第一步:确定主题

就是确定数据分析或前端展现的主题。(以汽车行业的KPI管理分析系统为例:某区域某门店销售情况就是一个主题)。主题要体现出某一方面的各维度分析和统计数值型数据(量度)之间的关系,确定主题时要综合考虑。统计数值型数据(量度)存在于中间的事实表;分析角度是各个维度;我们将通过维度的组合,来考察量度。针对刚才的门店销售情况这个主题,我们可以通过时间、地区和门店三个维度组合,来考察销售情况这个量度。从而,不同的主题来源于数据仓库中的不同子集,我们可以称之为数据集市。数据集市体现了数据仓库某一方面的信息,多个数据集市构成了数据仓库。

第二步:确定分析指标

确定好主题,下一步我们将考虑要分析的KPI指标,诸如:年销售额之类。它们一般为数值型数据。我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大值最小值等,这样的数据称为量度。量度是要统计的指标,必须事先选择恰当,基于不同的量度可以进行复杂关键性能指标(KPI)等的设计和计算。

第三步:确定事实表

在确定了量度之后,我们要考虑到该量度的汇总和不同维度下量度的聚合情况。考虑到量度的聚合程度不同,我们将采用“最小粒度原则”,即将量度的粒度设置到最小。

例如:假设目前的数据最小记录到月,即数据库中记录了每月的交易额。那么,如果我们可以确认,在将来的分析需求中,交易额只需要精确到月就可以的话,我们就可以在ETL处理过程中,按月为单位来汇总销售数据,此时,数据仓库中量度的粒度就是“月”;反过来如果我们不能确认将来的分析需求在销售额上是否需要精确到月,那么,我们就需要遵循“最小粒度原则”,在数据仓库的事实表中保留每日的销售数据,以便日后对“天”进行分析。

第四步:确定维度

如何理解维度?及维度的层次(Hierarchy)和级别(Level)

a、维度是指分析的各个角度。例如我们希望按照时间,或者按照地区,或者按照门店名称进行分析,那么这里的时间、地区、门店就是相应的维度。基于不同的维度,我们可以看到各量度的汇总情况,也可以基于所有的维度进行交叉分析。

b、维度的层次(Hierarchy)和级别(Level)

层次:时间维度表结构为例,年-半年-季度-月-半月-旬-周-日

级别:门店维表结构为例,门店集团分类、门店类型分类等等

第五步:创建事实表

a、了解

在确定好事实数据和维度后,我们将考虑加载事实表。事实表装有企业的度量数据,度量以及事实表才是最终用户真正想要看的内容,维度表是事实表数据的入口,事实只有通过维度解释才会变得有意义;

b、如何创建?

做法:将原始表(OLTP)与维度表进行关联,生成事实表,使用外连接进行数据关联;事实表是数据仓库的核心,需要精心维护,在JOIN后将得到事实数据表,一般记录条数都比较大,为实现数据的完整性和基于数据仓库的查询性能优化。我们可以设置复合主键和索引;事实表与维度表一起放于数据仓库中,我们还可以建立视图和汇总表,提供前端连接数据仓库进行数据查询奠定基础。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的QQ
  • 这是我的QQ扫一扫
  • weinxin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: