
Plateforme de métadonnées
Freemium

OpenMetadata est une plateforme de métadonnées open-source axée sur le schéma qui centralise la découverte, l'observabilité et la gouvernance des données. Contrairement aux outils hérités reposant sur des silos fragmentés, OpenMetadata utilise un graphe de métadonnées unifié pour connecter les actifs de données, les pipelines et les utilisateurs. Son architecture repose sur une approche « schema-first », garantissant une grande extensibilité pour les entités personnalisées. En intégrant plus de 100 connecteurs, elle permet aux équipes data d'automatiser la documentation, de suivre le lignage et d'appliquer des normes de qualité, comblant ainsi efficacement le fossé entre producteurs et consommateurs de données dans des environnements d'entreprise complexes.
Centralise toutes les métadonnées dans une structure de graphe unique, permettant une cartographie complexe des relations entre actifs de données, pipelines et utilisateurs. Contrairement aux catalogues purement relationnels, cette approche basée sur les graphes permet une analyse d'impact approfondie et un suivi du lignage à travers des systèmes hétérogènes, offrant une vue à 360 degrés de l'écosystème de données, essentielle pour l'observabilité moderne.
Basée sur JSON Schema, cette approche garantit que toutes les entités de métadonnées sont strictement typées et extensibles. Elle permet aux développeurs de définir des champs et des relations de métadonnées personnalisés sans altérer les fonctionnalités de base. Cette rigueur technique assure une cohérence sur toute la plateforme, facilitant grandement l'intégration avec les pipelines CI/CD et l'automatisation des workflows de gouvernance par rapport aux référentiels traditionnels rigides.
Fournit un support natif pour plus de 100 sources de données, incluant les entrepôts cloud, les outils BI et les moteurs d'orchestration. Ces connecteurs automatisent l'ingestion des métadonnées techniques, opérationnelles et métier. En réduisant la charge manuelle de collecte, les équipes obtiennent une visibilité complète en quelques heures plutôt qu'en quelques semaines, garantissant que le catalogue reste synchronisé avec l'état réel de l'infrastructure.
Extrait et visualise automatiquement le flux de données de la source à la destination en analysant les requêtes SQL et les logs de pipeline. Cette fonctionnalité offre une visibilité de bout en bout, aidant les ingénieurs data à identifier la cause racine des échecs de pipeline et à comprendre l'impact en aval des changements de schéma. Elle élimine l'effet « boîte noire » dans le traitement des données, favorisant la confiance des parties prenantes.
Intègre la gouvernance directement dans le workflow en permettant aux utilisateurs d'assigner des propriétaires, de définir des tags et de documenter les actifs de données sur place. Elle prend en charge les « Data Contracts » pour appliquer des normes de qualité à la source. En traitant les métadonnées comme un actif collaboratif, elle transfère la responsabilité de la qualité des données d'une équipe centrale vers les producteurs eux-mêmes, améliorant considérablement la fiabilité des actifs de l'organisation.
Les analystes utilisent la plateforme pour rechercher des jeux de données vérifiés dans toute l'entreprise. En consultant les détails des schémas, les échantillons de données et les métriques d'utilisation, ils identifient rapidement les bonnes tables pour leurs tableaux de bord BI, réduisant le temps d'analyse et évitant l'utilisation de données obsolètes ou incorrectes.
Les ingénieurs data exploitent le graphe de lignage pour retracer l'origine des données corrompues. Lorsqu'un tableau de bord échoue, ils identifient instantanément quel pipeline en amont ou quelle table source est responsable, réduisant drastiquement le temps moyen de résolution (MTTR) des incidents de données.
Les équipes de gouvernance utilisent le marquage automatique et le suivi de propriété pour garantir que les données PII sont identifiées et protégées. La plateforme fournit une piste d'audit claire sur la propriété des actifs et leurs accès, simplifiant la conformité aux réglementations telles que le RGPD et le CCPA.
Doivent gérer des pipelines complexes et assurer la fiabilité des données. OpenMetadata leur fournit des outils de lignage et d'observabilité automatisés pour maintenir une infrastructure de haute qualité sans documentation manuelle.
Ont besoin d'un accès rapide à des données fiables. Ils utilisent la plateforme pour découvrir des actifs pertinents, comprendre le contexte métier et vérifier la qualité des données avant de créer des rapports ou des modèles.
Responsables de la sécurité et de la conformité des données. Ils utilisent la plateforme pour appliquer les normes, gérer les accès et maintenir un inventaire clair de tous les actifs de données de l'entreprise.
Open Source (Apache 2.0). Service managé fourni par Collate avec une offre gratuite et une tarification Entreprise personnalisée selon l'échelle et les besoins de support.