La gestion des données physiques est le processus de mise en œuvre et de maintenance du stockage physique, de l'accès et du traitement des données dans un système de gestion de base de données ou à l'aide d'une autre technologie de stockage des données. Il s'agit de mettre en œuvre le modèle logique de données dans une technologie de base de données spécifique et de définir les caractéristiques physiques du stockage et de l'accès aux données.
Nous connaissons tous les systèmes de gestion relationnels, NoSQL, les data warehouses, etc. Ce sont autant d'exemples de gestion physique des données.
La gestion logique des données est un processus d'organisation et de gestion des données basé sur leurs relations logiques, leur signification et leur contexte. Il se concentre sur la définition des éléments de données, de leurs relations et de leurs attributs d'une manière compréhensible et significative pour les utilisateurs métiers et techniques.
L'objectif de la gestion logique des données est de créer un modèle conceptuel des données que toutes les parties prenantes peuvent facilement comprendre et entretenir. Il s'agit notamment de définir les entités de données, leurs attributs et les relations entre elles, ainsi que les règles métiers et les normes de qualité des données. La gestion logique des données produit un modèle logique de données, qui est une vue de haut niveau des données non dépendante d'une technologie ou d'une mise en œuvre spécifique.
La gestion logique des données est essentielle pour garantir que les données sont bien organisées, compréhensibles et significatives, ce qui est indispensable pour une gouvernance, une intégration et une analyse efficaces des données.
Alors que l'architecture physique des données a été prédominante pendant des décennies, la gestion logique des données gagne en popularité en raison de sa nature agile. L'un des enjeux les plus brûlants dans le domaine de la gestion des données est celui des data fabrics. Par définition, la data fabric permet d'augmenter l'intégration et le partage des données à travers des sources de données hétérogènes. Ce concept de sources de données hétérogènes signifie que vous établissez une couche logique d'accès aux données au-dessus de ces diverses sources de données. De même, le data mesh, qui est intrinsèquement une architecture logique de données, est un autre modèle de gestion des données très populaire aujourd'hui. Il est construit sur une plateforme de données distribuées. L'accès aux données se fait par le biais de produits de données basés sur le domaine, qui forment une couche d'abstraction des sources de données sous-jacentes. Les consommateurs des produits de données ne voient pas nécessairement ces sources et peuvent même ignorer leur existence. Ces liens vous permettront d'obtenir plus de détails sur les data fabrics et les data mesh.
La virtualisation des données met en œuvre une architecture et une gestion logiques des données qui intègrent toutes les données de l'entreprise, qu’elles soient réparties dans des systèmes disparates, gèrent des données unifiées pour une sécurité et une gouvernance centralisées et les mettent à la disposition des utilisateurs métiers en temps réel.
Pour en savoir plus sur la virtualisation des données, cliquez sur le lien ci-dessous.