Les termes data warehouse (DW ou entrepôt de données) et data lake (DL ou lac de données) sont souvent utilisés pour parler du stockage des données massives, mais ils ne sont pas interchangeables. Définissons ces deux concepts, leur combinaison et leur utilisation concrète pour une entreprise.
Un DW est un référentiel de données structurées et filtrées qui ont déjà été transformées dans un but spécifique. Il s’agit d’une plateforme utilisée pour collecter et analyser des données provenant de multiples sources hétérogènes. Les données stockées dans un DW sont généralement nettoyées, organisées et optimisées pour répondre aux besoins métier.
Lire la suite