La gestion moderne des données repose sur l'idée d'améliorer la production d'informations métiers basées sur les données, en s'appuyant sur deux facteurs principaux :
- Apporter de l'agilité au processus d'analyse des données, souvent par le biais d'initiatives en libre-service qui réduisent les goulets d'étranglement informatiques.
- Mettre tout élément d'information à disposition des processus analytiques.
Cependant, toute entreprise possède de nombreuses applications et systèmes axés sur différents aspects métiers, de la gestion de la supply chain à l'automatisation marketing, en passant par toutes sortes de systèmes de données, tels que les data warehouses, les data marts et les data lakes.
Ce paysage complexe de données doit faire l'objet d'une gestion efficace pour atteindre les objectifs mentionnés précédemment. Des sujets tels que l'intégration agile des données, la découverte des données, la sécurité et la gouvernance sont au cœur de toute stratégie moderne en matière de données.
Afin de mettre en œuvre efficacement ces exigences, les entreprises ont adopté deux approches différentes :
- Des stratégies de centralisation des données basées sur la consolidation physique des données ainsi que
- Des stratégies logiques de données basées sur des vues consolidées de données à travers des systèmes disparates.
L'architecture et la gestion logique des données permet l'accès à des sources de données multiples et variées tout en semblant former une seule source de données « logique » aux yeux des utilisateurs. Il s'agit d'unifier les données stockées et gérées à travers de multiples systèmes de gestion de données, notamment les sources de données traditionnelles telles que les bases de données, entrepôt de données ou data lakes, ainsi que d'autres sources de données comme les applications, les fichiers big data, les services web, et le cloud pour répondre à tous les cas d'utilisation analytiques.
La gestion logique des données permet d'effectuer des opérations telles que la découverte des données, leur accès, leur sécurité, leur intégration et leur partage par le biais d'une représentation logique (ou virtuelle), plutôt que de les effectuer directement sur chaque système source physique. Les pratiques de gestion logique des données permettent la mise en œuvre cohérente de politiques et de pratiques de gestion, d'intégration et d'utilisation des données d'une organisation, indépendamment de la nature, de l'emplacement et des capacités de chaque système source.
Bien que les approches logiques présentent des avantages évidents, les entreprises ont parfois besoin d'utiliser une approche monolithique pour répondre à un besoin métier spécifique. Les deux approches peuvent être déployées conjointement dans le cadre d'une stratégie globale de gestion agile des données.
Perspective métier
- Un emplacement unique pour trouver toutes vos données : une couche logique de données centralise vos données, permettant un accès en temps réel à toutes les données, y compris celles qui sont stockées on-premise et sur le cloud, en offrant une cohérence sémantique.
- Des vues métier : une couche logique de données permet aux entreprises de créer des vues de leurs données adaptées à leurs besoins et en libre-service. Ce processus s'effectue en éliminant les technologies, formats et protocoles traditionnellement complexes d'intégration des données ainsi que les détails liés à l'emplacement, ce qui rend les données plus accessibles et plus faciles d'utilisation.
- Amélioration de l'utilisation des données : les utilisateurs non techniques peuvent rapidement trouver, accéder, intégrer et partager les données. Les experts techniques de l'entreprise peuvent prendre part au processus de modélisation des données et réduire le temps de production de données prêtes à l'emploi.
Perspective informatique
- Données en temps réel : une couche logique de données permet aux parties prenantes d'accéder à la demande aux données les plus récentes, à tout moment, sous le format souhaité, afin de prendre en charge une grande variété de cas d'utilisation métier. Les entreprises n'ont plus besoin d'attendre l'exécution d'un lot nocturne pour mettre à jour leurs jeux de données.
- Réduction de la prolifération et de la duplication des données : la couche logique de données élimine les réplications inutiles et permet aux organisations de gagner en agilité, d'atténuer les risques et de réduire les coûts. Approvisionnement plus rapide des données : les couches logiques de données accélèrent l'approvisionnement de nouveaux jeux de données, ce qui permet aux organisations de suivre l'évolution constante de leurs besoins en matière de données.
- Centralisation de la sécurité et de la gouvernance : la couche unique permettant l'accès à toutes les données de l'entreprise simplifie considérablement la mise en œuvre de la sécurité et la gestion du contrôle des données pour chaque utilisateur dans tous les jeux de données.
Pour mettre en œuvre avec succès une architecture logique de données et une approche logique de la gestion, les organisations n'ont besoin que d'une seule capacité :
La virtualisation des données est une technologie de gestion et d'intégration des données qui exploite les métadonnées pour permettre aux organisations d'accéder à toutes leurs données en temps réel et de découvrir, cataloguer, approvisionner, combiner, partager et gouverner les données pour répondre à une large variété de cas d'utilisation.