Grundlagen
Data Governance: Was es ist und warum Sie es brauchen
Dieser Leitfaden erläutert die Frameworks, Prinzipien und praktischen Schritte, die erforderlich sind, um Daten vertrauenswürdig, überprüfbar und skalierbar zu machen – auch in KI-gesteuerten Umgebungen.

Laurie MacphersonTechnical Writer, Snowflake

Gulnaz SharipovaLokale Redakteurin, Snowflake
DATA GOVERNANCE DEFINITION
Data Governance ist das Framework von Richtlinien, Rollen, Prozessen und Technologien, das sicherstellt, dass Daten über ihren gesamten Lebenszyklus hinweg konsistent und verantwortungsvoll verwaltet, geschützt und genutzt werden. Dies umfasst Eigentümerschaft, Zugriff, Qualität, Klassifizierung und Überprüfbarkeit.
Wenn bei Daten etwas schiefgeht – ein Compliance-Verstoß, ein Modell, das mit der falschen Population trainiert wurde, eine Metrik, die von verschiedenen Teams unterschiedliche interpretiert wird –, können Unternehmen die darauf folgenden Fragen oft nicht beantworten. Die Eigentümerschaft ist unklar, die Datenherkunft (Data Lineage) ist unvollständig, Zugriffsprotokolle existieren nicht oder reichen nicht weit genug zurück. Das Problem wird erst durch eine Aufsichtsbehörde oder bei einer Überprüfung nach einem Vorfall sichtbar.
Data Governance ist die wiederkehrende Praxis, Eigentümerschaft, Klassifizierung, Datenherkunft und Audit-Kontrollen so aufzubauen, dass diese Antworten verfügbar sind, noch bevor sie benötigt werden. Da sich Daten zunehmend über verschiedene Systeme, Clouds, Partner und KI-Workflows hinwegfließen, steigen die Anforderungen an die Governance kontinuierlich. In den meisten Unternehmen ist es viel schwieriger als es sein sollte, verlässliche Antworten auf Datenfragen zu liefern. Dieser Leitfaden zeigt, wie Sie das ändern können.
Was ist Data Governance?
Data Governance ist das System von Richtlinien, Rollen, Prozessen und Technologien, das definiert, wie ein Unternehmen Daten über ihren gesamten Lebenszyklus hinweg verwaltet. Sie legt fest, wem die Daten gehören, was sie bedeuten, wie sie klassifiziert werden, wer darauf zugreifen kann, wie die Datenqualität gemessen und wie die Nutzung auditiert wird. In der Praxis ist Data Governance ein Betriebsmodell, um Daten in großem Maßstab vertrauenswürdig, geschützt und nutzbar zu machen.
Ein ausgereiftes Data Governance-Programm beantwortet vier Fragen:
- Welche Daten existieren und was bedeuten sie?
- Wem gehören sie und wer trägt die Verantwortung für ihre Nutzung?
- Wer darf auf sie zugreifen, sie teilen oder in KI-Workflows verwenden?
- Kann das Unternehmen belegen, wie sie transformiert, geschützt und genutzt wurden?
Die Beantwortung dieser Fragen hängt von Metadaten, Data Stewardship, Datenqualität, Datenschutzkontrollen, Compliance-Prozessen und klaren Verantwortlichkeiten ab. Ohne das Zusammenspiel dieser Elemente können Teams keine zuverlässige Data Governance gewährleisten.
Warum Data Governance jetzt wichtiger denn je ist
Data Governance ist schwieriger geworden, da Daten nicht mehr in einer einzigen Reporting-Umgebung isoliert sind. Eine Produktnutzungstabelle speist möglicherweise Analytics, Kundensupport-Workflows, das Partner-Reporting, Machine-Learning-Modelle und Executive-Dashboards. Eine Data Governance-Richtlinie, die für ein Dashboard funktioniert, greift nicht automatisch für jede nachgelagerte Kopie, Transformation oder jeden KI-Prompt, der auf dieselben Daten zugreift.
Diese Fragmentierung ist eines der größten Hindernisse für eine effektive Data Governance und skalierbare KI. „Wenn Daten für unterschiedliche Zwecke an verschiedenen Orten verteilt sind, wird es extrem schwierig, diese Daten zu kontrollieren und zu sichern”, sagt Baris Gutelkin, VP of Product, AI bei Snowflake. Er argumentiert, dass die Investition in eine einzige, standardisierte Datenbasis im gesamten Unternehmen leistungsfähigere Anwendungsfälle für generative KI ermöglicht und gleichzeitig Data Governance und Sicherheit vereinfacht.
Wenn Daten für einen Zweck an einem Ort und für einen anderen Zweck an einem anderen Ort liegen, wird es extrem schwierig, diese Daten zu kontrollieren und zu sichern
Baris Gutelkin
VP of Product, AI bei Snowflake
Damit eine solche Datenbasis in der Praxis funktioniert, reicht es nicht aus, Daten zu zentralisieren – es bedarf einer konsistenten, skalierbaren Governance. Teams müssen sensible Datenfelder klassifizieren, Eigentümerschaften zuweisen, die Datenherkunft verfolgen, Maskierungen durchsetzen, die Aktualität überwachen und die Nutzung überprüfen, ohne sich auf Silowissen oder unzusammenhängende Tabellenkalkulationen verlassen zu müssen. Eine gut umgesetzte Governance macht vertrauenswürdige Daten leichter auffindbar und sicherer in der Nutzung – ohne zusätzliche Hürden für die Teams, die sie benötigen.
HÄUFIGE FALLE
Unternehmen behandeln Data Governance oft als einmaliges Projekt und nicht als fortlaufende operative Disziplin, die in die täglichen Workflows eingebettet ist. Dies führt zu unklaren Zuständigkeiten, unvollständigen Metadaten und Kontrollen, die sich bei der Datenübertragung zwischen Systemen und KI-Anwendungsfällen nicht automatisch übertragen – was die Rückverfolgung von Problemen und das Bestehen von Audits erschwert.
Data Governance für KI
KI erhöht die Anforderungen an die Data Governance, da kontrollierte Daten nun von Modellen und Agenten abgerufen, zusammengefasst, transformiert oder verarbeitet werden können. Wenn ein KI-Agent im Namen von Nutzer:innen handelt, häufen sich die Fragen: Welche Datenzeilen hat er abgerufen, was hat er in einen Prompt aufgenommen und gibt es für all das einen Audit-Trail?
Data Governance für KI konzentriert sich auf die Daten, die von KI-Systemen verwendet werden. Dazu gehören die Herkunft der Trainingsdaten, die Datenklassifizierung von PII und sensiblen Daten, Kontrollen für Einwilligungen und zulässige Nutzung, Bias und die Repräsentativität von Quelldaten, die Datenherkunft zwischen Datensets, Features, Prompts, Outputs und nachgelagerten Entscheidungen sowie Zugriffskontrollen für Agenten und Audit-Trails für Abrufe, den Prompt-Kontext und generierte Outputs.
Dies steht in engem Zusammenhang mit KI-Governance, ist aber nicht dasselbe. Data Governance für KI kontrolliert die Daten, die KI-Systeme verwenden. KI-Governance kontrolliert das Modell oder System selbst: Modellfreigaben, Evaluierungen, Model Cards, Monitoring, Drift, menschliche Aufsicht und Risikomanagement. Die beiden Programme müssen miteinander verknüpft werden. Ein risikoreicher KI-Workflow kann nicht effektiv gesteuert werden, wenn das Unternehmen nicht weiß, aus welchen Datenquellen er gespeist wird, welche sensiblen Datenfelder beim Abruf auftauchen können, wer die Datennutzung genehmigt hat und ob sich die Outputs zu kontrollierten Quellen zurückverfolgen lassen.
Erfahren Sie, wie Snowflake dabei hilft, Daten für vertrauenswürdige KI zu verwalten:
Prinzipien der Data Governance
Prinzipien der Data Governance leiten die Entscheidungen eines Programms in Bezug auf Richtlinien, Ownership, Technologien und Prozesse. Zu den gängigen Prinzipien gehören:
- Verantwortlichkeit: Jedes kritische Daten-Asset hat einen benannten Owner, der für Zugriffsentscheidungen, Qualitätsprobleme und Definitionskonflikte verantwortlich ist.
- Transparenz: Nutzer:innen können Definitionen, Herkunft, Qualitätssignale und den Richtlinienkontext für die Daten-Assets einsehen, mit denen sie arbeiten.
- Datenqualität: Kontrollierte Daten werden an expliziten Erwartungen gemessen und nicht einfach als zuverlässig vorausgesetzt.
- Datenschutz und Sicherheit: Sensible Daten werden während ihres gesamten Lebenszyklus klassifiziert, geschützt und überwacht.
- Stewardship: Benannte Stewards pflegen Definitionen, beheben Probleme und unterstützen die verantwortungsvolle Nutzung über alle Domänen hinweg.
- Standardisierung: Begriffe, Richtlinien und Kontrollen sind domänenübergreifend konsistent, wobei Ausnahmen dokumentiert und genehmigt werden.
- Auditfähigkeit: Das Unternehmen kann nachweisen, wie auf Daten zugegriffen wurde und wie sie geändert, geteilt und genutzt wurden.
- Ethische Nutzung: Datenethik bedeutet, dass Daten auf faire, diskriminierungsfreie und den Erwartungen der Nutzer:innen entsprechende Weise verwendet werden und Mechanismen zur Erkennung und Eindämmung schädlicher oder unbeabsichtigter Folgen unterstützt
Diese Prinzipien spiegeln sich in konkreten Mechanismen wider: Ownership-Felder in einem Katalog, Sensibilitäts-Tags für Datenfelder, Maskierungsrichtlinien für regulierte Daten, Datenherkunftspfade für kritische Berichte und Audit-Logs für Zugriffsüberprüfungen.
Frameworks und Standards für Data Governance
Data Governance-Frameworks und -Standards helfen Unternehmen dabei, ein Programm zu strukturieren, Fähigkeiten zu definieren und zu entscheiden, was zuerst implementiert werden soll. Einige konzentrieren sich auf den Reifegrad des Datenmanagements, während andere den Schwerpunkt auf IT-Governance, Architektur, Qualität oder Cloud-Kontrollen legen.
| Framework oder Standard | Am besten geeignet für | Was damit gesteuert wird |
|---|---|---|
| DAMA-DMBOK | Umfassendes Design von Datenmanagement-Programmen | Wissensbereiche, Rollen und Disziplinen des Datenmanagements |
| DCAM | Reifegrad des Enterprise-Datenmanagements | Betriebsmodell, Kontrollen, Verantwortlichkeit und Reifegrad |
| CDMC | Cloud-Datenmanagement-Kontrollen | Governance-Kontrollen für Cloud- und hybride Datenumgebungen |
| COBIT | Ausrichtung der IT-Governance | Risiko, Kontrollen, Verantwortlichkeit und Enterprise-Governance |
| TOGAF | Ausrichtung der Unternehmensarchitektur | Datenarchitektur, Anwendungsabhängigkeiten und Architektur-Governance |
| FAIR-Prinzipien | Wiederverwendung von wissenschaftlichen Daten und Forschungsdaten | Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit |
| ISO 8000 | Datenqualität und Stammdaten | Qualitätsanforderungen, Datenaustausch und Stammdaten-Prozesse |
| DGI Data Governance Framework | Design von Governance-Programmen | Entscheidungsrechte, Verantwortlichkeit und Richtlinienprozesse |
Eine Gesundheitsorganisation könnte DAMA-DMBOK nutzen, um grundlegende Datenmanagement-Fähigkeiten zu definieren, CDMC, um Cloud-Kontrollen abzubilden, und die Data-Governance-Anforderungen von HIPAA, um Erwartungen an Zugriff, Aufbewahrung und Audits festzulegen.
Frameworks bieten Struktur, aber ein Programm benötigt dennoch Verantwortliche, Metadaten, Klassifizierung, Qualitätsregeln, Zugriffsrichtlinien, Audit-Prozesse und Technologien, um diese Entscheidungen dort umzusetzen, wo Daten genutzt werden.
Ein Governance-Programm benötigt ein Betriebsmodell, das zur Arbeitsweise des Unternehmens passt. Ein globales Unternehmen mit Dutzenden von Geschäftsbereichen kann nicht jede Tabelle durch ein zentrales Team verwalten, aber ein vollständig dezentrales Modell könnte zu inkonsistenten Definitionen, doppelten Richtlinien und inkonsistenter Kontrolle führen.
Die meisten Unternehmen entscheiden sich für eines von drei Modellen:
| Modell | So funktioniert es | Am besten geeignet für |
|---|---|---|
| Zentralisiert | Ein zentrales Governance-Team definiert Richtlinien, Standards und Freigaben | Kleinere Programme, stark regulierte Daten oder Governance in der Frühphase |
| Föderiert | Domänen verwalten ihre Daten lokal, befolgen aber gemeinsame Governance-Standards | Große Unternehmen mit ausgeprägtem Domänen-Ownership |
| Hybrid | Ein zentrales Team legt Richtlinien und Plattformstandards fest, während die Domänen das tägliche Stewardship übernehmen | Die ausgereiftesten Unternehmensprogramme |
Ein hybrides Modell ist oft am praktischsten. Ein zentrales Team definiert Klassifizierungsstandards, Richtlinienvorlagen, Kataloganforderungen und Audit-Vorgaben. Domänenteams sind für ihre Datenprodukte verantwortlich, pflegen Definitionen, beheben Qualitätsprobleme und genehmigen den Zugriff basierend auf dem lokalen Kontext.
Unabhängig davon, welches Modell ein Unternehmen verwendet, müssen die Entscheidungsrechte explizit festgelegt sein. Wenn zwei Teams den Begriff „aktive:r Kund:in“ unterschiedlich definieren, sollte das Governance-Modell festlegen, wer den Konflikt auflöst. Wenn ein Partner Zugriff auf ein sensibles Dataset anfordert, sollte das Modell festlegen, wer die Anfrage genehmigt, welche Nachweise erforderlich sind und wie die Entscheidung protokolliert wird.
Die Kernkomponenten der Data Governance
Ein Data Governance-Programm basiert auf Prinzipien und Frameworks, wird aber durch spezifische operative Komponenten umgesetzt. Diese Komponenten machen Governance in den Systemen sichtbar, die täglich genutzt werden: Kataloge, Tags, Lineage-Diagramme, Zugriffsrichtlinien, Qualitätsprüfungen, Stewardship-Workflows und Audit-Logs.
Metadatenmanagement
Metadaten liefern den Kontext, der Personen und Systemen erklärt, was ein Daten-Asset ist, woher es stammt und wie es verwendet werden sollte. Sie können Tabellennamen, Spaltentypen, Owner, Geschäftsdefinitionen, Vertraulichkeitskennzeichnungen, Aktualitätsziele, Datenherkunftspfade, Nutzungsmuster oder Kostenprofile beschreiben.
Die meisten Data Governance-Programme stützen sich auf drei Arten von Metadaten:
- Business-Metadaten umfassen Definitionen, Owners, Domänen, Glossarbegriffe und Zertifizierungsstatus – sie helfen Teams zu verstehen, ob ein Daten-Asset relevant und für die Nutzung freigegeben ist.
- Technische Metadaten umfassen Schemata, Datentypen, Transformationen, Abhängigkeiten und Datenherkunft (Data Lineage) – sie helfen Engineers und Architekt:innen zu verstehen, wie Daten fließen und sich verändern.
- Operative Metadaten umfassen Aktualität, Nutzung, Kosten, Qualitätsergebnisse und Zugriffsmuster – sie helfen Teams zu überwachen, ob Daten aktuell und vertrauenswürdig sind und angemessen genutzt werden.
Erfahren Sie mehr über den Unterschied zwischen Data Governance und technischer Governance →
Datenklassifizierung (Data Classification)
Bei der Datenklassifizierung werden Daten anhand ihrer Sensitivität, ihrer Domäne, gesetzlicher Vorschriften (einschließlich der Datensouveränität) oder ihrer zulässigen Nutzung Labels versehen. Beispielsweise kann ein Datenfeld als PII, geschützte Gesundheitsdaten, Zahlungskartendaten, vertrauliche Finanzdaten oder genehmigte Trainingsdaten getaggt werden. Diese Labels steuern dann Zugriffsüberprüfungen, Maskierungsrichtlinien, Aufbewahrungsregeln, Freigabegenehmigungen und Einschränkungen für die KI-Nutzung.
Die Klassifizierung ist besonders wichtig, da sensible Daten selten isoliert an einem einzigen Ort liegen. E-Mail-Adressen, Kunden-IDs, Diagnosecodes, Geodatenfelder und Transaktionsdetails fließen oft über Pipelines, Dashboards und Anwendungstabellen. Ein Data Governance-Programm muss diese Felder identifizieren, bevor es sie konsequent schützen kann.
Datenkatalog
Ein Datenkatalog ist das durchsuchbare Inventar, das Governance erst praktisch nutzbar macht. Er bietet Analyst:innen, Engineers, Stewards und Geschäftsanwender:innen einen zentralen Ort, um Daten-Assets zu finden, Definitionen zu lesen, die Datenherkunft zu überprüfen, Eigentümer:innen zu ermitteln, Qualitätssignale zu prüfen und Zugriff anzufordern.
Moderne Kataloge zeigen zertifizierte Datenprodukte an, fügen Richtlinienkontext hinzu, zeigen, ob eine Tabelle aktuell genug für die Nutzung ist, und helfen Teams, die Duplizierung ähnlicher Datasets zu vermeiden. Ein guter Katalog beantwortet praktische Fragen, bevor jemand eine Abfrage schreibt: Was bedeutet diese Tabelle? Wer ist dafür verantwortlich? Ist sie genehmigt? Welche nachgelagerten Assets hängen von ihr ab? Enthält sie sensible Daten?
Datenherkunft (Data Lineage)
Die Datenherkunft verfolgt Daten von der Quelle bis zur Nutzung. Sie zeigt, wie sich ein Datenfeld, eine Tabelle oder eine Metrik durch Ingestion, Transformation, Modellierung, Reporting, Sharing und KI-Workflows bewegt. Die Datenherkunft kann auf Tabellenebene ansetzen, um aufzuzeigen, wie Tabellen von anderen Tabellen oder Quellen abhängen; auf Feldebene, um zu veranschaulichen, wie bestimmte Datenfelder transformiert oder wiederverwendet werden; oder systemübergreifend, um darzustellen, wie Daten über Tools, Clouds oder Plattformen hinweg fließen.
Wenn ein reguliertes Datenfeld in einen Bericht, ein Modell oder ein externes Datenprodukt einfließt, hilft die Datenherkunft dabei aufzuzeigen, woher sie stammt, wie sie sich verändert hat und was betroffen sein könnte, wenn sich die Quelle ändert.
Richtlinienmanagement
Im Richtlinienmanagement werden Data Governance-Regeln in durchsetzbare Kontrollen transformiert. Es umfasst Zugriffsrichtlinien, Maskierungsrichtlinien, Einschränkungen auf Zeilenebene, Aufbewahrungsregeln, Data-Sharing-Regeln, Richtlinien zur zulässigen Nutzung und Ausnahme-Workflows.
Eine Richtlinie sollte festlegen, wer unter welchen Bedingungen, zu welchem Zweck und mit welchem Überprüfungsprozess auf welche Daten zugreifen kann. Ein effektives Richtlinienmanagement schließt auch Ausnahmen ein: Einige Nutzer:innen benötigen möglicherweise temporären Zugriff für ein Audit, eine Datenmigration oder die Reaktion auf Vorfälle. Die Governance sollte erfassen, wer die Ausnahme genehmigt hat, warum sie gewährt wurde und wann sie abläuft.
Datenqualität
Datenqualität bestimmt, ob Daten genau, vollständig, konsistent, aktuell, eindeutig und valide genug für ihren vorgesehenen Verwendungszweck sind. Eine Produkttabelle, die für interne Experimente verwendet wird, kann andere Qualitätsanforderungen haben als eine Umsatztabelle für die Finanzberichterstattung oder eine Schadensfalltabelle für Analysen im Gesundheitswesen.
Eine Tabelle kann eine:n Eigentümer:in, eine Glossardefinition und eine Zugriffsrichtlinie haben, aber wenn ihre Datensätze veraltet oder unvollständig sind, können sich die Nutzer:innen nicht darauf verlassen. Moderne Programme verlagern die Qualität durch Datenverträge, Pipeline-Tests und kontinuierliches Monitoring in eine frühere Phase des Lebenszyklus.
Datenschutz und Sicherheit
Der Datenschutz regelt, wie personenbezogene und sensible Daten erfasst, genutzt, aufbewahrt, geteilt und gelöscht werden. Datensicherheit regelt, wie Daten vor unbefugtem Zugriff, Missbrauch oder Offenlegung geschützt werden. Beide hängen von Klassifizierung, Eigentümerschaft, Richtlinien und Überprüfbarkeit ab, weshalb sie in der Regel innerhalb desselben Governance-Frameworks verwaltet werden.
Datenschutzkontrollen können das Einwilligungsmanagement, Workflows für Betroffenenanfragen, Aufbewahrungsregeln, Tokenisierung und Datenmaskierung umfassen. Sicherheitskontrollen können rollenbasierte Zugriffskontrolle, Row Access Policies, Verschlüsselung, Monitoring und Verfahren zur Reaktion auf Vorfälle umfassen. Die Data Governance verbindet diese Kontrollen mit Daten-Assets. Sie zeigt auf, welche Tabellen sensible Daten enthalten, wer darauf zugreifen kann, welche Richtlinien gelten und ob die Nutzung später überprüft werden kann.
Data Sharing und Collaboration
Kontrollierte Daten müssen die sichere Wiederverwendung über Domänen, Partner und externe Ökosysteme hinweg unterstützen und nicht nur den Zugriff innerhalb einer einzelnen Umgebung kontrollieren.
- Data Mesh ordnet ein klares Domänen-Ownership zu und wahrt gleichzeitig föderierte Governance-Standards.
- Datenprodukte bündeln Daten mit einer Eigentümerschaft, Definition, einem Qualitätsziel und einem Lebenszyklus.
- Datenverträge definieren die Erwartungen zwischen Produzenten und Konsumenten, einschließlich Schema, Aktualität und Qualität.
- Data Clean Rooms ermöglichen es Parteien, an kontrollierten Daten zusammenzuarbeiten, ohne die zugrunde liegenden Rohdatensätze offenzulegen.
Jedes geteilte Daten-Asset ist mit Annahmen verbunden: wem es gehört, was es bedeutet, ob es aktuell ist, welche Richtlinien gelten und ob die Empfängerseite es für den vorgesehenen Zweck nutzen darf. Governance hilft dabei, diese Annahmen explizit festzulegen und durchsetzbar zu machen.
Rollen in Data Stewardship und Governance
Data Governance hängt von bestimmten Personen mit klarer Entscheidungsbefugnis ab. Data Stewardship ist die operative Ebene, die Governance-Entscheidungen mit der täglichen Datenarbeit verknüpft. In einem ausgereiften Programm arbeiten Stewards mit Data Ownern, Custodians, Datenschutzverantwortlichen, Sicherheitsteams und einem Governance Council zusammen, um Definitionen zu pflegen, die Qualität zu überwachen, Zugriffsmuster zu überprüfen und domänenübergreifende Definitionskonflikte zu eskalieren.
| Rolle | Governance-Verantwortung |
|---|---|
| Chief Data Officer | Legt die Datenstrategie des Unternehmens fest, sponsert das Data Governance-Programm und trägt die exekutive Verantwortung für die Datenergebnisse. |
| Data Owner | Besitzt die fachliche Entscheidungskompetenz über eine Domäne, ein Datenprodukt, eine Metrik oder ein kritisches Dataset. |
| Data Steward | Pflegt Definitionen, Qualitätserwartungen, Metadaten, Zugriffsrichtlinien und die Problemlösung für eine Domäne oder ein Asset. |
| Data Custodian | Verwaltet die technische Umgebung, in der Daten gespeichert, verarbeitet, gesichert und gepflegt werden. |
| Data Protection Officer | Überwacht die Datenschutzverpflichtungen für kontrollierte personenbezogene Daten, insbesondere dort, wo Gesetze eine formelle Datenschutzrolle vorschreiben. |
| Chief Privacy Officer | Leitet die übergeordnete Datenschutzstrategie, Richtlinien und das Risikomanagement im gesamten Unternehmen. |
| Governance Analyst | Unterstützt bei der Dokumentation von Richtlinien, der Katalogpflege, dem Reporting, der Problemverfolgung und den Governance-Metriken. |
| Governance Council | Löst domänenübergreifende Konflikte, genehmigt Standards und priorisiert Data Governance-Initiativen. |
Die genaue Rollenverteilung variiert je nach Unternehmen, aber eines bleibt gleich: Data Governance erfordert sowohl geschäftliche Autorität als auch technische Verwahrung. Große Unternehmen formalisieren dies oft durch ein Governance Council, dokumentierte Eskalationspfade und Stewardship auf Domänenebene.
Auf die praktischen Details kommt es an. Sollten sich zwei Teams über die Definition einer Kennzahl uneinig sein, sollte im Programm festgelegt werden, wer die Entscheidung trifft. Wenn für ein kontrolliertes Datenfeld eine neue Datenmaskierungs-Richtlinie erforderlich ist, sollte der Steward wissen, welcher Sicherheits- oder Datenschutzpartner hinzugezogen werden muss. Wenn ein Problem mit der Datenqualität Auswirkungen auf einen nachgelagerten Bericht hat, sollte die Datenherkunft diese Auswirkungen aufzeigen, und das Stewardship-Team sollte festlegen, wer für die Behebung zuständig ist.
Prozess und Strategie für Data Governance
Die praktische Einführung einer Data Governance-Strategie folgt in der Regel diesem Ablauf:
- Wählen Sie eine prioritäre Domäne: Beginnen Sie mit Customer 360, der Finanzberichterstattung, kontrollierten Daten, Supply Chain Analytics oder KI-Trainingsdaten – überall dort, wo das Geschäftsrisiko oder der Compliance-Druck am höchsten ist.
- Erfassen Sie kritische Datenbestände: Identifizieren Sie die Tabellen, Views, Dateien, Metriken und Berichte, die in dieser Domäne am wichtigsten sind.
- Klassifizieren Sie sensible und regulierte Daten: Taggen Sie PII, PHI, Zahlungsdaten, vertrauliche Datensätze und andere kontrollierte Datentypen.
- Weisen Sie Owner und Stewards zu: Legen Sie fest, wer für Definitionen, Zugriffsentscheidungen, Qualitätserwartungen und Problemlösungen verantwortlich ist.
- Definieren Sie Richtlinien: Legen Sie Regeln für Zugriff, Maskierung, Aufbewahrung, Data Sharing, KI-Nutzung und Ausnahmen fest.
- Erfassen Sie die Herkunft und Qualitätssignale: Verfolgen Sie kritische Datenflüsse und überwachen Sie Aktualität, Vollständigkeit und Gültigkeit.
- Überprüfen Sie Zugriff und Nutzung: Nutzen Sie Audit-Datensätze, um zu validieren, wer auf sensible Daten zugegriffen hat und ob die Richtlinien wie vorgesehen funktioniert haben.
- Domäne für Domäne erweitern: Verwenden Sie Standards, Templates und gewonnene Erkenntnisse erneut, während das Programm skaliert.
Zu den nützlichen Erfolgskennzahlen zählen die Katalog-Adoption, der Anteil der kritischen Datenbestände mit zugewiesenen Ownern, die Klassifizierungsabdeckung, der Abdeckungsgrad der Richtlinien, die Bearbeitungszeit bei Datenqualitätsproblemen, der Abschluss von Zugriffsprüfungen und die Verringerung der Anzahl von Audit-Feststellungen.
Data Governance und Einhaltung gesetzlicher Vorschriften
Aufsichtsbehörden können verlangen, dass ein Unternehmen nachweisen kann, welche regulierten Daten es speichert, wer darauf zugegriffen hat, wie diese geschützt wurden, wie lange sie aufbewahrt wurden und ob die erforderlichen Kontrollen angewendet wurden. Governance unterstützt GRC (Governance, Risk, Compliance), indem sie Datenbestände mit Richtlinien, Eigentümer:innen, Kontrollen und Audit-Trails verknüpft.
Hier einige Beispiele:
| Governance-Verpflichtung | Vorschriften und Standards (Beispiele) | Was Governance nachweisen hilft |
|---|---|---|
| Personenbezogene und sensible Daten schützen | DSGVO, BDSG, CCPA/CPRA, LGPD, PDPA, HIPAA | Welche personenbezogenen Daten existieren, wo diese liegen, wer darauf zugreifen kann und wie Betroffenenanfragen bearbeitet werden – einschließlich der spezifischen BDSG-Anforderungen für Beschäftigtendaten und Videoüberwachung |
| Integrität der Berichterstattung wahren | SOX, BCBS 239, Basel III | Wie Finanz- oder Risikodaten definiert, transformiert, kontrolliert und abgestimmt werden |
| Zahlungsdaten schützen | PCI DSS | Wo Karteninhaberdaten liegen und welche Kontrollen greifen |
| Betriebliche Resilienz verwalten | DORA, NIS2 | Wie kritische Systeme, Drittanbieter sowie ICT-Risiken (Informations- und Kommunikationstechnologie) überwacht werden |
| KI-bezogene Datennutzung steuern | EU AI Act und neue KI-Gesetze | Welche Daten in KI-Systemen verwendet werden, ob dies angemessen ist und wie eine risikoreiche Nutzung kontrolliert wird |
In Deutschland legt das Bundesdatenschutzgesetz (BDSG) nationale Anforderungen fest, die die DSGVO ergänzen – insbesondere für den Beschäftigtendatenschutz und den Einsatz von Videoüberwachung. Im April 2026 trat zudem das Daten-Governance-Gesetz in Kraft: Deutschlands Umsetzung des EU Data Governance Act. Es schafft den Rechtsrahmen für Datenvermittlungsdienste und die Weiterverwendung öffentlicher Daten, mit der Bundesnetzagentur als zentraler Anlaufstelle. Damit wird Data Governance in Deutschland nicht nur zur Best Practice, sondern zur gesetzlichen Anforderung.
Der EU AI Act ist ein gutes Beispiel dafür, warum Governance-Zeitpläne eine so kritische Rolle spielen. Die Verordnung gilt schrittweise: Allgemeine Bestimmungen und Verbote gelten ab dem 2. Februar 2025, Regeln für Allzweck-KI ab dem 2. August 2025 und eine breitere Einführung erfolgt bis zum 2. August 2027. Für Unternehmen, die verwaltete Unternehmensdaten in KI-Systemen verwenden, entsteht dadurch die praktische Notwendigkeit, die Herkunft der Trainingsdaten, die Datenklassifizierung sensibler Daten, Zugriffsberechtigungen und die Überprüfbarkeit lückenlos nachzuvollziehen.
Sehen Sie sich das Video an und erfahren Sie, wie die Funktionen von Snowflake – wie die Überwachung sensibler Daten – es Ihnen ermöglichen, Ihre sensiblen Daten mit nur wenigen Klicks zu identifizieren und einen umfassenden Überblick darüber zu erhalten.
Warum Data Governance auf Snowflake betreiben?
Data Governance lässt sich leichter aufrechterhalten, wenn Richtlinien, Metadaten, die Datenherkunft, Qualitätsüberwachung und Zugriffskontrollen nah an dem Ort angesiedelt sind, an dem Daten gespeichert, verarbeitet, geteilt und genutzt werden. Die Governance-Funktionen von Snowflake sind direkt in dieselbe Umgebung integriert, in der Unternehmen Daten, Anwendungen und KI-Workloads verwalten – anstatt über ein separates Tool angewendet zu werden, das synchron gehalten werden muss.
Einheitlicher Katalog mit integrierter Datenherkunft: Snowflake Horizon Catalog bietet Katalog, Datenherkunft auf Feldebene, aktive Metadaten und Richtliniendurchsetzung auf einer einzigen Oberfläche. Snowflake Horizon Catalog kann den Bedarf an einem separaten Katalog-Tool reduzieren, da der Governance-Kontext nah an den Daten angesiedelt ist.
Von Grund auf Compliance-orientiert: Snowflake Compliance Center bietet die Überwachung des Sicherheitsstatus sowie Bescheinigungen zur Unterstützung von Standards wie HIPAA, PCI DSS, SOC 2 Type II, ISO 27001, FedRAMP Moderate und IRAP. Je nach Implementierung können bestimmte Funktionen und Kundenkonfigurationen erforderlich sein.
Policy-as-Code für sensible Daten: Dynamic Data Masking, Row Access Policies, Tag-based Masking und External Tokenization implementieren automatisierte Sicherheits-Controls direkt auf Datenebene. Bei korrekter Konfiguration kann die Klassifizierung dazu beitragen, dass Richtlinien konsistent über Abfragen, Anwendungen, Sharing und KI-Workflows hinweg angewendet werden.
Überprüfbare Nutzung: Access History und Query History können dabei helfen, detaillierte Zugriffs- und Transformationsdatensätze zu erfassen, die Audits und behördliche Überprüfungen unterstützen. Bei richtiger Konfiguration können Unternehmen leichter erkennen, wer wann auf eine sensible Spalte zugegriffen hat.
Integrierte Governance-Kontrollen für KI-Workflows: Cortex Guard wendet Richtlinienkontrollen auf LLM-Ein- und -Ausgaben an, um das Risiko zu verringern, dass sensible Daten in ungeeignete Modellkontexte gelangen. Datenmetrikfunktionen können verwendet werden, um die Qualität von Trainingsdaten im Laufe der Zeit zu überwachen, sodass die Daten, die in KI-Systeme eingespeist werden, denselben Standards entsprechen wie die Daten für Berichte.
Kontrolliertes Sharing ohne Kopien: Secure Data Sharing, Listings und Data Clean Rooms ermöglichen es Unternehmen, Erkenntnisse mit Partnern und externen Beteiligten zu teilen, ohne Rohdaten über Sicherheitsgrenzen hinweg zu übertragen. Data Governance-Controls lassen sich kontinuierlich einfacher und konsistent durchsetzen, da die Daten die Plattform zu keinem Zeitpunkt verlassen.
Zusammen bieten diese Funktionen eine zentrale Governance-Oberfläche für Data Warehouses, Data Lakes, offene Tabellenformate wie Iceberg, Anwendungen und KI – so müssen Kontrollen nicht jedes Mal neu erstellt werden, wenn Daten in eine neue Umgebung verschoben werden.
Governance-Reife ist kein binärer Zustand. Die meisten Programme decken einige Bereiche ab, weisen in anderen jedoch Lücken auf. Diese Lücken werden meist im denkbar ungünstigsten Moment sichtbar. Bei einer Compliance-Prüfung könnte ein Datenfeld auffallen, das nie klassifiziert wurde. Oder ein KI-Ergebnis wird in Frage gestellt, aber niemand kann nachvollziehen, welche Daten dazu beigetragen haben.
Die Unternehmen, die solche Situationen vermeiden, sind nicht diejenigen, die eine Governance-Implementierung abgeschlossen haben. Es sind diejenigen, die Verantwortlichkeiten, Lineage, Klassifizierung und Audit-Kontrollen in ihre Arbeitsabläufe integriert haben – sodass die Antwort bereits vorliegt, wenn die Frage aufkommt.
Erfahren Sie mehr über Anwendungsfälle für Data Governance →
WICHTIGSTE ERKENNTNIS
Data Governance ist kein einmaliges Projekt, sondern eine fortlaufende Disziplin, die Daten in großem Maßstab vertrauenswürdig, nutzbar und überprüfbar macht. Durch die Etablierung klarer Verantwortlichkeiten, konsistenter Richtlinien sowie Transparenz bei Daten, Qualität und Zugriff können Unternehmen kritische Fragen zu ihren Daten beantworten, noch bevor Probleme entstehen. Da die Nutzung von Daten und KI zunimmt, ist die Einbettung von Data Governance in alltägliche Workflows – anstatt sie als separate Kontrollebene zu behandeln – genau das, was es Teams ermöglicht, schneller zu agieren und gleichzeitig Risiken zu reduzieren.
Häufig gestellte Fragen
Ihre häufigsten Fragen zu Data Governance - beantwortet von Snowflake-Experten
Was ist der Unterschied zwischen Data Governance und Datenmanagement?
Datenmanagement umfasst das Sammeln, Speichern, Transformieren, Integrieren und Bereitstellen von Daten. Data Governance definiert die Regeln für diese Prozesse: wem die Daten gehören, wie sie definiert sind, wer sie nutzen darf, wie die Qualität gemessen wird und wie die Compliance nachgewiesen wird. Weitere Details finden Sie in unserem Grundlagen zu Data Governance vs. Datenmanagement.
Wer ist für Data Governance verantwortlich?
Die Führungsverantwortung liegt oft bei einem Chief Data Officer oder einer ähnlichen Führungsrolle, während die operative Verantwortung im Alltag gemeinschaftlich von Data Ownern, Data Stewards, Data Custodians, Sicherheits-, Datenschutz- und Compliance-Teams sowie Data Governance Councils getragen wird.
Was sind die größten Herausforderungen bei der Data Governance?
Die größten Herausforderungen sind meist organisatorischer Natur: unklare Verantwortlichkeiten, mangelndes Executive Sponsorship, inkonsistente Definitionen und Governance, die fälschlicherweise als reine IT-Aufgabe statt als strategische Business-Aufgabe behandelt wird. Technische Probleme wie unvollständige Metadaten, eingeschränkte Datenherkunft oder ungleichmäßige Klassifizierung lassen sich leichter lösen, sobald Verantwortlichkeiten und Prozesse klar definiert sind.
Wie unterstützt Data Governance die KI?
Data Governance kontrolliert die Daten, die KI-Systeme verwenden. Sie hilft Teams dabei, die Datenherkunft zu verstehen, sensible Felder zu klassifizieren, Zugriffsrichtlinien durchzusetzen, die Qualität zu überwachen, die zulässige Nutzung zu dokumentieren und nachzuverfolgen, welche Datenquellen zu KI-Ergebnissen oder -Entscheidungen beitragen.
Ist Data Governance für die Compliance erforderlich?
Die meisten Vorschriften schreiben kein spezifisches Governance-Programm vor, aber Compliance erfordert in der Regel Governance-Funktionen. Unternehmen müssen wissen, welche regulierten Daten sie besitzen, wo diese liegen, wer darauf zugreifen kann, wie sie geschützt sind und ob sie bei einem Audit Nachweise erbringen können.
Ressourcen zu Data Governance
Data Governance-Themen entdecken
Ein tiefer Einblick in alle Aspekte der Data Governance

