1、数据仓库是什么?
数据仓库是一个集中的、用于管理和分析企业数据的系统。 它提供了一个高性能的、可扩展的、面向主题的存储,用于支持企业中各种业务部门对数据进行查询、分析、报告和挖掘。
与在线交易处理系统(OLTP)不同,数据仓库可以提供离线分析服务。 它通常设计用于支持复杂的查询和报告,包括大量的数据计算,并且通常从多种不同的数据源进行提取和集成。 这意味着数据仓库通常包括多个不同的数据表,这些数据表根据某种方式组织在一起,以支持企业内部各种各样的数据需要。
数据仓库通常通过组件化设计以支持不同的组件和接口。 其中包括ETL(抽取,转换和加载),数据存储层,元数据管理和数据挖掘工具。 ETL组件用于从不同数据库,文件系统和云资源中提取数据,规范化数据并加载到数据存储中。
数据存储是用于存储数据的核心组件。 元数据管理组件是用于管理和跟踪数据仓库中数据和表元数据的工具。 数据挖掘工具用于分析和理解这些数据,以提取更深层次的商业应用洞察。
详见:https://mp.weixin.qq.com/s/AuxANZ4-Vx9jGAr3D79qXw