Why is dlt-hub/dlt a recommended Dimensional Data Modeling GitHub Repositories repository?

Applies dimensional modeling to transform loaded data into structured formats.

1 dépôt

Awesome GitHub RepositoriesDimensional Data Modeling

Techniques for structuring data into facts and dimensions to optimize for analytical querying and reporting.

Distinct from Dimensional Data Slicing: Closest candidates focus on slicing, indexing, or visualization, whereas this is about the structural design of the data model itself.

Explore 1 awesome GitHub repository matching data & databases · Dimensional Data Modeling. Refine with filters or upvote what's useful.

Trouvez les meilleurs dépôts grâce à l'IA.Nous recherchons les dépôts les plus pertinents grâce à l'IA.

dlt-hub/dlt
dlt-hub/dlt
5,472Voir sur GitHub
dlt est un outil d'ingestion de données Python et un framework de pipeline ETL conçu pour récupérer des données depuis diverses sources et les persister dans des destinations structurées. Il fonctionne comme un moteur d'inférence de schéma qui détecte automatiquement les types de données et aplatit les structures JSON imbriquées en tables relationnelles, déplaçant les données des sources vers des lakehouses, des entrepôts ou des bases de données vectorielles. Le projet se distingue par une génération de pipeline alimentée par l'IA, utilisant de grands modèles de langage pour échafauder le code d'extraction et les connecteurs pour les API REST. Il prend également en charge le stockage vectoriel multimodal et la population spécialisée de bases de données vectorielles pour prendre en charge les applications d'IA et de machine learning. Le framework couvre un large éventail de capacités, incluant l'évolution automatique du schéma, le chargement incrémentiel de données via le suivi d'état et la validation de la qualité des données par l'application de contrats de données. Il fournit des outils pour la normalisation des données relationnelles, les transformations pré- et post-chargement, et une variété d'adaptateurs de destination pour les bases de données SQL et les magasins d'objets cloud. L'observabilité est gérée via des tableaux de bord d'exécution de pipeline, le suivi de lignage des colonnes et la vérification de version de schéma utilisant des hachages basés sur le contenu.
Applies dimensional modeling to transform loaded data into structured formats.
Pythondatadata-engineeringdata-lake
Voir sur GitHub5,472

Awesome Dimensional Data Modeling GitHub Repositories

dlt-hub/dlt