关系数据库OLAP研究

(整期优先)网络出版时间:2009-03-13
/ 1

关系数据库OLAP研究

吴小明

摘要:随着数据库技术的发展,信息量也越来越大,人们希望从已有的数据中提炼出有用的信息服务于决策者。基于关系数据库的OLAP系统能通过对数据仓库中的数据进行抽取,得到用户感兴趣的数据,数据,建立Cube模型,生成实例化的视图。

关键词:关系数据库;OLAP系统;Cube模型

中图分类号:TP3文献标志码:A文章编号:1000-8772(2009)06-0142-01

收稿日期:2009-02-21

作者简介:吴小明,男,学生,从事计算机科学与技术研究。

随着数据库技术的发展,信息量也越来越多,人们希望从已有的数据中提炼出有用的信息服务于决策者。数据分析的多维视图和分析,包括对层次维和多重层次维的随着计算机技术的飞速发展和企业界不断提出新的要求。事实上,多维分析是分析企业数据最有效的方法。另一方面就是人们对以往计算机的简单数据操作提出了更高的要求,希望计算机能够更多地参与数据分析与决策制定等领域。特别是数据库处理可以大致地划分为两大类:操作型处理和分析型处理(或信息型处理)。这种分离划清了数据处理的分析型环境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据环境发展为一种新环境:体系化环境,而基于数据仓库技术上的联机分析处理(OLAP)技术就是其中一个关键的技术。为此,数据仓库及OLAP技术成为数据库技术领域的一个新的研究热点。基于数据仓库的联机分析处理(OLAP)正在被业界广泛的研究和应用、尤其用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持。

联机分析处理的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP是一类软件技术,它使分析人员、经理、管理人员通过对信息(维数据)多种可能的观察形式进行快速、稳定、一致和交互式的存取,以便对数据进行深入观察和分析。

一、OLAP系统的设计方案

系统采用客户服务器C/S模式,从多个部门的数据库中采集数据到数据源中,从数据源中抽取、清理、转换成数据仓库,OLAP服务器从数据仓库中提取数据,提供给客户端使用,决策分析人员利用前端PC机上的客户软件,后台利用SQLServer数据库系统建立数据仓库,用Windows2000Server组建并以它作为OLAP服务器的工作平台。整个系统包括OLAP建型向导、视图实例化、智能分析和元数据管理。采用VisualC++开发应用程序。创建后用户可以看到所选Cube的树型元数据结构,并且可以通过友好的可视化界面实现OLAP操作,并进一步地进行智能OLAP分析,减少用户的交互操作,快速发现有意义的决策分析信息,这一部分都是通过图形化的界面与用户交互。

二、功能与结构设计

本系统提供了OLAP建模向导,来创建数据立方,它为用户的建模过程提供了简单方便的操作,用户首先选择数据源,选择事实表,选择度量值和事实表主键,然后选择多个维表,建立维表之间的连接,在每一个维表中选择维层次和维表主键,最后建立事实表与维表之间的连接,一个Cube模型就建立起来了。

数据仓库必须支持各种可能的查询,相当一部分查询可能是复杂的,通常需要处理大量的数据,而且一般要对数据进行投影、连接、分组等复杂处理,这是一个非常耗时的过程,然而一个OLAP系统却要求它的查询能够被快速响应。解决这个矛盾通常所采用的方法是:针对OLAP可能的查询进行预计算,即实例化部分视图。它与数据库的“视图”概念不同之处在于:它不是虚拟的,而是经过计算,含有大量数据,并存储在数据仓库的实在的表中。通过这些预计算,OLAP基本上不再需要对原始数据进行复杂处理,而只需在实例化视图的基础上进行一些简单的计算便可以完成复杂的查询。

实例化视图减少了数据仓库的查询响应时间,但整个Cube的数据量往往是很惊人的,完全存储简直是不可能的,因此我们只能选择一部分来进行存储,这就是实例化视图选择问题。即在一定的资源约束下,选择一组视图进行实例化,使整个数据仓库所支持的查询响应时间满足用户要求,或是使其是最优的。其中一种策略是:通过比较复杂的查询代价(磁盘空间、计算和维护时间等因素)分析算法,来决定实例化视图的选择。经比较,本系统可采用改进的基于排序的实例化视图来选择算法。

参考文献:

[1]胡雪琴,周昌乐,顾超.数据仓库在中医临床信息分析中的

应用研究[J].中医药信息,2008,(2).

[2]林昕,李心科.一种OLAP海量数据载入技术的研究[J].计

算机技术与发展,2008,(2).

(责任编辑:李晓群)