Star Schema 和 Snowflake Schema 的区别?
星型架构
星型模式是将记录组织成维度表、事实表和物化视图的会议。所有信息都存储在列中,需要元数据来识别作为多维对象的列。
星型模式是一种关系模式,其中关系模式的设计描述了多维数据模型。星型模式是显式数据仓库模式。之所以称为星型模式,是因为该模式的实体关系图再现了与主表不同的带有点的星型。模式的中间包括一个大的事实表,星号的点是维度表。
雪花架构
雪花模式是星型模式的一种变体,其中几个维度表被规范化,进一步将数据划分为更多的表。生成的模式图形成类似于雪花的形状。
雪花模式是星型模式的扩展,其中星形的每个点都分解为更多的点。它被称为雪花模式,因为雪花模式的图表模拟雪花。Snowflaking是一种标准化STAR模式中维度表的方法。当它完全规范化一些维度表时,结果结构类似于雪花,中间是事实表。
雪花模型和星型模型的区别在于雪花模型的维度表可以保持规范化的形式。这样的表维护简单,也可以存储存储空间,因为当维度结构作为列涉及时,大维度表可以完全大。
由于该空间中的大部分是冗余信息,因此制作规范化结构将减少完整的空间需求。但是,雪花结构会降低浏览效率,因为执行查询需要更多连接。因此,系统性能会受到不利影响。性能基准测试可用于确定什么对这种设计有利。
让我们看看StarSchema和SnowflakeSchema之间的比较。