什么是三层数据仓库架构?
数据仓库通常具有三级(层)架构,涉及-
该底层是相对始终是关系型数据库系统中的仓库数据库服务器。后端工具和实用程序用于将记录从操作数据库或其他外部来源(包括外部顾问支持的用户配置文件数据)输入底层。
这些工具和实用程序实现数据提取、清理和转换(例如,将来自多个源的相同数据合并为统一格式),以及加载和刷新功能以更新数据仓库。使用称为网关的应用程序接口提取数据。
网关由底层DBMS支持,并允许客户端程序生成要在服务器上执行的SQL代码。网关的示例包括Microsoft的ODBC(开放数据库连接)和OLEDB(数据库的开放链接和嵌入)和JDBC(Java数据库连接)。该层还包括一个元数据存储库,用于保存有关数据仓库及其内容的数据。
所述中间层是使用一个关系OLAP(ROLAP)模型,即,映射在多维数据到标准的关系的操作的操作的扩展的关系数据库管理系统,或多维OLAP(MOLAP)模型,即通常执行的OLAP服务器,直接进行多维数据和操作的专用服务器。
的顶层是一个前端客户端层。它包括查询和报告工具、分析工具和/或数据挖掘工具(例如,趋势分析、预测等)。
从架构上看,数据仓库模型有企业仓库、数据集市、虚拟仓库三种。
企业仓库-企业仓库收集有关跨越整个组织的主题的所有数据。它支持企业范围内的数据集成,通常来自一个或多个操作系统或外部数据提供者,并且在范围内是跨职能的。
它一般包括详细数据和汇总数据,大小可以从几千兆字节到几千千兆字节、太字节等。企业数据仓库可以在传统大型机、计算机超级服务器或并行架构平台上执行。它需要广泛的业务建模,并且可能需要数年时间来设计和构建。
数据集市-数据集市包括对特定用户团队有价值的公司范围数据的子集。范围仅限于明确选择的科目。例如,营销数据集市可以将其主题限定为用户、商品和销售。数据集市中包含的数据往往是汇总的。
虚拟仓库-虚拟仓库是操作数据库的视图集合。为了高效的查询处理,只能物化一些可能的摘要视图。虚拟仓库只是在可操作的数据库服务器上构建但需要过剩容量。