Data Domains: Data Mesh verleiht den Business Domains Superkräfte!
Das Konzept Data Mesh basiert auf vier Hauptsäulen, von denen die erste eine nach sogenannten Data Domains strukturierte Organisation ist. Um effektiv zu sein, muss diese Struktur die wirtschaftlichen Gegebenheiten des Unternehmens und die Interaktionen zwischen seinen verschiedenen Einheiten widerspiegeln. Sie setzt daher ein hohes Maß an Nähe zu den Geschäfts- bzw. Fachbereichen voraus.
Dieser Artikel ist der zweite in einer Reihe, die wir dem Thema Data Mesh widmen. Das Konzept Data Mesh vereint alle notwendigen Zutaten, um die gesamte Organisation rund um die Herausforderungen der Datenoptimierung herum auszurichten.
Um dies zu demonstrieren und unsere Überzeugungen bezüglich Data Mesh zu teilen, verfassen wir diese Artikelserie, die diesem innovativen Thema gewidmet ist. Unser Ziel ist es, Ihnen zu helfen, die Auswirkungen und Vorteile von Data Mesh für Ihre eigene Transformation zu einer Data-Driven-Culture im Unternehmen fassen zu können.
Dieser Artikel erschien in einer früheren Version in englischer Sprache auf dem Data & AI Blog von Business & Decision.
Artikel 1: Data Mesh – das ultimative Modell für Data-Driven-Unternehmen?
Artikel 3: Data Mesh: Daten sind das Produkt
Data Domains: Eine Bedienungsanleitung
Die Nutzung von Daten in Geschäftsprozessen und bei der Entscheidungsfindung ist ein wesentlicher Veränderungsfaktor für die Wertschöpfung auf allen Ebenen des Unternehmens. Und in dieser Hinsicht ist Data Mesh eine eine Chance für Geschäftsbereiche, ihre eigene Transformation voranzutreiben und ihre gesamte Entscheidungsfindung durch Analyitcs zu verbessern. Die Strukturierung von Daten in Domänen/Domains, die so nah wie möglich an der Organisation und den Prozessen des Unternehmens liegen, hat zwei Vorteile. Data Mesh hilft dabei, die Nutzung von Daten demokratischer zu gestalten, indem es über den Kreis der Experten wie Data Scientists, Data Engineers, Data Architects usw. hinausgeht. Mit diesem Ansatz soll auch sichergestellt werden, dass die Daten in vollem Umfang von den operativen Mitarbeitern genutzt werden können, und zwar so nah wie möglich an deren jeweiligenBedürfnissen. Was ja auch genau jenes Ziel ist, dass Unternehmen in ihren Bestrebungen hin zur Data-Driven-Culture verfolgen.
Mit Data Mesh liegen die Verantwortung für die Daten, das Wissen über sie und ihre Verwendung vollständig in den Händen der jeweiligen Geschäfts- und Fachbereiche, die die Hauptakteure bei der Optimierung der Daten sind. Dies ist das Prinzip des “Domain Ownership”, das sich wie folgt beschreiben lässt:
- Die Fähigkeit, die gemeinsame Nutzung von Daten entsprechend dem Wachstum der Organisation (Anzahl der Datenquellen, Anzahl der Verbraucher usw.) zu entwickeln,
- Schnelle und kontinuierliche Datenänderungszyklen,
- Agilität bei der Verringerung der teamübergreifenden Synchronisierung und der Beseitigung von Engpässen, die durch eine zentralisierte Verwaltung entstehen,
- Verbesserung der Datenqualität und der Belastbarkeit von Analysen (BI, KI) durch die Annäherung der Produzenten an die Konsumenten (Beseitigung der Komplexität von zwischengeschalteten Datenpipelines).
Was genau bedeutet die Organisation in „Domains“?
Der Data-Domain-Ansatz von Data Mesh lehnt sich direkt an das Konzept des Domain Driven Design (DDD) an, das auch bei der Entwicklung von Softwarelösungen angewandt wird. Diese Dimension des Data Mesh besteht also darin, die Daten (und ihre Verwendung) entsprechend der Segmentierung nach Domains aufzuschlüsseln.
Dies ist ein grundlegender Gedanke, der das Herzstück des Data Mesh-Konzepts bildet. Ebenso ist bei der Erstellung und Verteilung der Datenbereiche große Sorgfalt geboten. In einigen Unternehmen wird diese Wahl offensichtlich sein und auf den Hauptfunktionen des Organigramms basieren (HR, Betrieb, Marketing usw.). In anderen Kontexten kann die Aufteilung nach Geschäftsbereichen, nach Vertriebskanälen oder nach den spezifischen Bedürfnissen der einzelnen Einheiten erfolgen. Die Bereiche einer einzelnen Organisation können enge oder breite, übergreifende Bereiche umfassen.
Wie auch immer die Aufteilung aussehen mag, sie muss mit besonderer Sorgfalt vorgenommen werden. Die Granularität der Bereiche und ihre Struktur müssen für jedes Unternehmen eingehend evaluiert werden, um die spezifischen Bedürfnisse und den Reifegrad der verschiedenen Abteilungen zu berücksichtigen. In jedem Fall ist es wichtig, dass die Aufschlüsselung nach Data Domains die geschäftlichen Realitäten des Unternehmens widerspiegeln. Sie sollte niemals das Ergebnis eines rein technischen Ansatzes oder eines Ansatzes sein, der zu weit von den Realitäten vor Ort entfernt ist. Der methodische Ansatz besteht darin, die verschiedenen Arten von Data Domains abzubilden und zu beschreiben:
- Quellenorientierte Data Domains, in denen analytische Daten zusammengeführt werden, die die von den operativen Systemen erzeugten geschäftlichen Fakten widerspiegeln und als native Datenprodukte bekannt sind.
- Aggregierte Datendomänen, in denen analytische Daten zusammengeführt werden, die aus Korrelations- und Anreicherungsoperationen unter Einbeziehung von Daten stammen, die ursprünglich aus mehreren quellenorientierten Data Domains stammen (z. B. 360°-View).
- Anwenderorientierte Datendomänen, in denen analytische Daten zusammengefasst sind, die für die Anforderungen eines oder mehrerer geschäftlicher Anwendungsfälle transformiert wurden.
Einmal eingerichtet, treiben die Domains die Distribution und Optimierung von Daten voran. Sie spielen eine wesentliche Rolle bei der Rücküberführung der Datenhoheit an die jeweiligen Bereiche, die bei der Nutzung von Daten völlig autonom werden können. Um dies zu erreichen, sind die Bereiche für ALLE Daten in ihrem Bereich verantwortlich. Dazu gehören natürlich auch operative Daten (ERP, Prozess-Tools usw.), aber auch analytische Daten.
Zu diesem Zweck halten sich die Bereiche an eine Reihe von Rollen und Verantwortlichkeiten:
- Datenproduzenten und Verwalter aller Datenbestände (analytisch und operativ),
- Mitverantwortliche für die Data Governance durch die Anwendung gemeinsamer Regeln und Standards, die auf organisatorischer Ebene festgelegt werden.
- Designer von Datenprodukten nach gemeinsamen Grundsätzen, um die Freigabe (z. B. über APIs) und Nutzung durch die verschiedenen Bereiche zu ermöglichen.
Teilnehmer an der gemeinsamen Nutzung von Daten mit anderen Bereichen. Der generierte Wert wird durch Skalierung erhöht, z. B. durch die Schaffung einer Datenbörse oder eines Datenmarktplatzes. Dies ist ein grundlegender Aspekt von Data Mesh, auf den wir noch näher eingehen werden.
Autonome, agile Domains
Data Mesh stellt zweifellos einen Paradigmenwechsel dar, sowohl was die Verteilung der Kompetenzen als auch der Verantwortlichkeiten betrifft. Durch die Organisation nach Domains ist das Daten-Know-how nicht mehr zentralisiert (innerhalb der IT oder in einer Data Factory), sondern verteilt.
Dieser Ansatz hat viele Vorteile:
- Überwinden Sie den Flaschenhals eines zentralisierten Teams und entwickeln Sie Datenprodukte, die sich unmittelbar an Fachleute richten.
- Wesentliche Verbesserung der Datenqualität, indem sowohl die Produktion als auch die Nutzung der Daten näher an die jeweiligen Bereiche herangeführt werden. Diese sind auch besser in der Lage, die Daten in einem vereinheitlichten Katalog zu dokumentieren. Das Ergebnis sind Skalierungseffekte. Gartner schätzt, dass schlechte Datenqualität Unternehmen durchschnittlich 12,9 Millionen Dollar pro Jahr kostet.
- Fördern Sie den bereichsübergreifenden Datenaustausch, um Silos aufzubrechen und unternehmensweite Mehrwerte zu schaffen.
- Fördern Sie eine Kultur der internen Zusammenarbeit und die Entwicklung von Kompetenzen in datenbezogenen Bereichen.
Data Mesh und Data Domains: endlich das richtige Rezept, um alle Bereiche einzubeziehen?
Der Übergang von einer Welt, in der die Daten zentral vom Data Office und der IT gesteuert werden, zu einer Welt, in der die Rollen verteilt sind und mit den Bereichen geteilt werden, erfordert eine gründliche Evaluierung der Unternehmensorganisation und daher eine sehr hochrangige Unterstützung.
Data Mesh bedeutet, dass in den Domains entsprechende Datenexperten bzw. Datenexpertisen eingesetzt werden, die so nah wie möglich am Geschäft sind, um multidisziplinäre Teams zu bilden, die mit agilen Methoden umgehen können.
Diese Zuweisung von Komentenzen ist auch wichtig, um die verschiedenen Themen im Zusammenhang mit dem End-to-End-Management von Daten und Datenprodukten zu behandeln. Dies erfordert eine Überarbeitung der Stellenbeschreibungen, um diese neuen Tätigkeiten einzubeziehen.
Der Aufbau der Organisation nach Data Domains erfolgt iterativ, wobei mindestens mit einer Erzeugerdomain (ausgerichtet auf die Quelle) und einer Anwenderdomain (ausgerichtet auf den Anwender) begonnen wird. Diese Einführung basiert auf einem befähigenden, motivierten und entsprechend reifen Bereich. Weniger reife Unternehmen können von einem Data Office unterstützt und beraten werden, das Methoden und Ressourcen zur Verfügung stellt. Die Datenbereiche können dann mit einer schrittweisen Übertragung von Aktivitäten und Verantwortung eingeführt werden. Die Dezentralisierung wird dann mit fortschreitender Reife beschleunigt.
Datenbereiche, die unabhängig und dennoch kommunikativ sind
Die Unternehmen stoßen sehr oft auf Hindernisse – insbesondere auf Schwierigkeiten, relevante, wertschöpfende Anwendungsfälle zu identifizieren. Dies lässt sich häufig durch das schwach ausgeprägte Interesse an oder die fehlende Erfahrung der jeweiligen Bereiche im Umgang mit Daten erklären.
Mit Data Mesh werden die Unternehmen, oder besser gesagt die Data Domains, mehr denn je zu Akteuren der im Unternehmen umgesetzten Datenstrategie. Mehr sogar, da diese Aneignung der Datenhoheit auf föderaler Basis erfolgt. Jeder Bereich ist somit an der Verwaltung und Optimierung der globalen Datenbestände auf Unternehmensebene beteiligt, dank der standardisierten gemeinsamen Datennutzung der Domains und der einheitlichen Governance.
Die Vorstellung von den Rollen und Verantwortlichkeiten der jeweiligen Bereiche bei der End-to-End-Verarbeitung von Daten und der Erstellung von Datenprodukten, wie sie von Data Mesh konzipiert wurde, impliziert daher einen Bruch mit den bisherigen Gepflogenheiten. Bislang ist es den Unternehmen nicht gelungen, die Kontrolle über die Daten zu übernehmen. Für sie ist dieser Unternehmenswert eine Technologie und damit eine Sache der IT. Die IT-Abteilung ihrerseits hat eine defensive Haltung gegenüber der Neudistribution von Rollen und Verantwortlichkeiten, die als Risikoquelle in Bezug auf Sicherheitsaspekte und Governance wahrgenommen wird.
Diese jeweiligen Positionen und die vorherrschende Kultur hindern die Organisationen daran, die Datennutzung weiter zu öffnen, den Zugang zu ihnen zu erleichtern und die Menschen zu ihrer Nutzung zu ermutigen. Für eine realistische Einschätzung der Situation müssen jedoch einige Nuancen berücksichtigt werden. Der diesbezügliche Reifegrad ist von Bereich zu Bereich sehr unterschiedlich. Einige, wie z. B. im Marketing oder in der Logistik, werden oft als Vorreiter in Sachen Nutzung genannt. Bei Data Mesh geht es darum, mit diesen eingeübten Praktiken zu brechen. Durch seinen globalen Ansatz fördert es den Austausch von Daten zwischen Silos. Seine Lösung: die Schaffung von Data Domains, die sowohl unabhängig als auch interaktiv sind. Der Eigenwert der Datenprodukte (eine weitere Säule des Data Mesh), die von den an der Quelle ausgerichteten Domains offengelegt und gemeinsam genutzt werden, soll durch die von den an den Datenanwendern ausgerichteten Domains implementierten Verwendungszwecke ausgeschöpft werden.
Michelin & Data Mesh: von der Plattform zu den Datenbereichen
Joris Nurit, Chief Data and Analytics Architect bei Michelin, entdeckte das Konzept des Data Mesh im Jahr 2019, als er er die Data-Lake-Strategie des Unternehmens leitete. Zu diesem Zeitpunkt führte Michelin bereits seit fünf Jahren eine verteilte Architektur ein. Und das war nicht der einzige Teil ihrer IT, auf den das Unternehmen einen verteilten Ansatz angewendet hatte.
Michelin setzte somit eines der Hauptprinzipien von Data Mesh um, indem es sich folgendes Ziel setzte: ein einziges Netz/Mesh, das alle Data Domains regelt. Der Reifenhersteller betrachtete auch die anderen Säulen. Eine der Prioritäten des CDO war es daher, eine globale Data-Governance einzurichten, die alle Bereiche abdeckt und verbindet. Diese föderale Governance basiert auf verschiedenen Rollen wie Data Owner, Data Steward und Data Administrator. Die Data Owner der Domains sind für die ordnungsgemäße Verwaltung der Quell- und Aggregatprodukte verantwortlich.
Das sollten Sie mitnehmen:
- Die notwendige Überarbeitung der Organisation bedingt ein sehr hohes Maß an Sponsoring.
- Eine so nah wie möglich an den jeweiligen Bereichen orientierte Struktur der Domains.
- Erforderliche Datenexpertise in den Domains.
- Ein Data Office als Moderator und treibende Kraft hinter Data Mesh
Über den Autor:
Sablon Philippe
Business & Decision
Der ursprüngliche Artikel wurde in Zusammenarbeit mit Christophe Auffray, die deutsche Version von Martin Lehofer erstellt.