数据集市是什么?

数据集市定义

数据集市是一个结构概念,它是企业级数据仓库的一个子集,主要面向部门级业务,并且只面向某个特定的主题。

有两种类型的数据集市——独立型和从属型

数据集市的应用

数据集市是数仓之上更聚焦的业务主题合集,更偏向于应对业务数据快速高效应用的需求,一般用于商业智能系统中探索式和交互式数据分析应用。

数据集市的一般架构

如何建设数据集市

  • 自上而下建设
  • 自下而上建设

数据集市和数据仓库的区别

类目 数据仓库 数据集市
数据来源 生产系统外部数据等 数据仓库或生产系统等外部数据
规模范围 企业级 部门或工作组级
主题 以企业为主题 以部门或特殊分析为主题
数据粒度 最细粒度 较粗的粒度