Grundlagen

Data Governance: Was es ist und warum Sie es brauchen

Dieser Leitfaden erläutert die Frameworks, Prinzipien und praktischen Schritte, die erforderlich sind, um Daten vertrauenswürdig, überprüfbar und skalierbar zu machen – auch in KI-gesteuerten Umgebungen.

Laurie MacphersonTechnical Writer, Snowflake

Gulnaz SharipovaLokale Redakteurin, Snowflake

DATA GOVERNANCE DEFINITION

Data Governance ist das Framework von Richtlinien, Rollen, Prozessen und Technologien, das sicherstellt, dass Daten über ihren gesamten Lebenszyklus hinweg konsistent und verantwortungsvoll verwaltet, geschützt und genutzt werden. Dies umfasst Eigentümerschaft, Zugriff, Qualität, Klassifizierung und Überprüfbarkeit.

Wenn bei Daten etwas schiefgeht – ein Compliance-Verstoß, ein Modell, das mit der falschen Population trainiert wurde, eine Metrik, die von verschiedenen Teams unterschiedliche interpretiert wird –, können Unternehmen die darauf folgenden Fragen oft nicht beantworten. Die Eigentümerschaft ist unklar, die Datenherkunft (Data Lineage) ist unvollständig, Zugriffsprotokolle existieren nicht oder reichen nicht weit genug zurück. Das Problem wird erst durch eine Aufsichtsbehörde oder bei einer Überprüfung nach einem Vorfall sichtbar.

Data Governance ist die wiederkehrende Praxis, Eigentümerschaft, Klassifizierung, Datenherkunft und Audit-Kontrollen so aufzubauen, dass diese Antworten verfügbar sind, noch bevor sie benötigt werden. Da sich Daten zunehmend über verschiedene Systeme, Clouds, Partner und KI-Workflows hinwegfließen, steigen die Anforderungen an die Governance kontinuierlich. In den meisten Unternehmen ist es viel schwieriger als es sein sollte, verlässliche Antworten auf Datenfragen zu liefern. Dieser Leitfaden zeigt, wie Sie das ändern können.

Was ist Data Governance?

Data Governance ist das System von Richtlinien, Rollen, Prozessen und Technologien, das definiert, wie ein Unternehmen Daten über ihren gesamten Lebenszyklus hinweg verwaltet. Sie legt fest, wem die Daten gehören, was sie bedeuten, wie sie klassifiziert werden, wer darauf zugreifen kann, wie die Datenqualität gemessen und wie die Nutzung auditiert wird. In der Praxis ist Data Governance ein Betriebsmodell, um Daten in großem Maßstab vertrauenswürdig, geschützt und nutzbar zu machen.

Ein ausgereiftes Data Governance-Programm beantwortet vier Fragen:

Welche Daten existieren und was bedeuten sie?
Wem gehören sie und wer trägt die Verantwortung für ihre Nutzung?
Wer darf auf sie zugreifen, sie teilen oder in KI-Workflows verwenden?
Kann das Unternehmen belegen, wie sie transformiert, geschützt und genutzt wurden?

Die Beantwortung dieser Fragen hängt von Metadaten, Data Stewardship, Datenqualität, Datenschutzkontrollen, Compliance-Prozessen und klaren Verantwortlichkeiten ab. Ohne das Zusammenspiel dieser Elemente können Teams keine zuverlässige Data Governance gewährleisten.

Warum Data Governance jetzt wichtiger denn je ist

Data Governance ist schwieriger geworden, da Daten nicht mehr in einer einzigen Reporting-Umgebung isoliert sind. Eine Produktnutzungstabelle speist möglicherweise Analytics, Kundensupport-Workflows, das Partner-Reporting, Machine-Learning-Modelle und Executive-Dashboards. Eine Data Governance-Richtlinie, die für ein Dashboard funktioniert, greift nicht automatisch für jede nachgelagerte Kopie, Transformation oder jeden KI-Prompt, der auf dieselben Daten zugreift.

Diese Fragmentierung ist eines der größten Hindernisse für eine effektive Data Governance und skalierbare KI. „Wenn Daten für unterschiedliche Zwecke an verschiedenen Orten verteilt sind, wird es extrem schwierig, diese Daten zu kontrollieren und zu sichern”, sagt Baris Gutelkin, VP of Product, AI bei Snowflake. Er argumentiert, dass die Investition in eine einzige, standardisierte Datenbasis im gesamten Unternehmen leistungsfähigere Anwendungsfälle für generative KI ermöglicht und gleichzeitig Data Governance und Sicherheit vereinfacht.

Wenn Daten für einen Zweck an einem Ort und für einen anderen Zweck an einem anderen Ort liegen, wird es extrem schwierig, diese Daten zu kontrollieren und zu sichern

Baris Gutelkin

VP of Product, AI bei Snowflake

Damit eine solche Datenbasis in der Praxis funktioniert, reicht es nicht aus, Daten zu zentralisieren – es bedarf einer konsistenten, skalierbaren Governance. Teams müssen sensible Datenfelder klassifizieren, Eigentümerschaften zuweisen, die Datenherkunft verfolgen, Maskierungen durchsetzen, die Aktualität überwachen und die Nutzung überprüfen, ohne sich auf Silowissen oder unzusammenhängende Tabellenkalkulationen verlassen zu müssen. Eine gut umgesetzte Governance macht vertrauenswürdige Daten leichter auffindbar und sicherer in der Nutzung – ohne zusätzliche Hürden für die Teams, die sie benötigen.

HÄUFIGE FALLE

Unternehmen behandeln Data Governance oft als einmaliges Projekt und nicht als fortlaufende operative Disziplin, die in die täglichen Workflows eingebettet ist. Dies führt zu unklaren Zuständigkeiten, unvollständigen Metadaten und Kontrollen, die sich bei der Datenübertragung zwischen Systemen und KI-Anwendungsfällen nicht automatisch übertragen – was die Rückverfolgung von Problemen und das Bestehen von Audits erschwert.

Data Governance für KI

KI erhöht die Anforderungen an die Data Governance, da kontrollierte Daten nun von Modellen und Agenten abgerufen, zusammengefasst, transformiert oder verarbeitet werden können. Wenn ein KI-Agent im Namen von Nutzer:innen handelt, häufen sich die Fragen: Welche Datenzeilen hat er abgerufen, was hat er in einen Prompt aufgenommen und gibt es für all das einen Audit-Trail?

Data Governance für KI konzentriert sich auf die Daten, die von KI-Systemen verwendet werden. Dazu gehören die Herkunft der Trainingsdaten, die Datenklassifizierung von PII und sensiblen Daten, Kontrollen für Einwilligungen und zulässige Nutzung, Bias und die Repräsentativität von Quelldaten, die Datenherkunft zwischen Datensets, Features, Prompts, Outputs und nachgelagerten Entscheidungen sowie Zugriffskontrollen für Agenten und Audit-Trails für Abrufe, den Prompt-Kontext und generierte Outputs.

Dies steht in engem Zusammenhang mit KI-Governance, ist aber nicht dasselbe. Data Governance für KI kontrolliert die Daten, die KI-Systeme verwenden. KI-Governance kontrolliert das Modell oder System selbst: Modellfreigaben, Evaluierungen, Model Cards, Monitoring, Drift, menschliche Aufsicht und Risikomanagement. Die beiden Programme müssen miteinander verknüpft werden. Ein risikoreicher KI-Workflow kann nicht effektiv gesteuert werden, wenn das Unternehmen nicht weiß, aus welchen Datenquellen er gespeist wird, welche sensiblen Datenfelder beim Abruf auftauchen können, wer die Datennutzung genehmigt hat und ob sich die Outputs zu kontrollierten Quellen zurückverfolgen lassen.

Erfahren Sie, wie Snowflake dabei hilft, Daten für vertrauenswürdige KI zu verwalten:

Prinzipien der Data Governance

Prinzipien der Data Governance leiten die Entscheidungen eines Programms in Bezug auf Richtlinien, Ownership, Technologien und Prozesse. Zu den gängigen Prinzipien gehören:

Verantwortlichkeit: Jedes kritische Daten-Asset hat einen benannten Owner, der für Zugriffsentscheidungen, Qualitätsprobleme und Definitionskonflikte verantwortlich ist.
Transparenz: Nutzer:innen können Definitionen, Herkunft, Qualitätssignale und den Richtlinienkontext für die Daten-Assets einsehen, mit denen sie arbeiten.
Datenqualität: Kontrollierte Daten werden an expliziten Erwartungen gemessen und nicht einfach als zuverlässig vorausgesetzt.
Datenschutz und Sicherheit: Sensible Daten werden während ihres gesamten Lebenszyklus klassifiziert, geschützt und überwacht.
Stewardship: Benannte Stewards pflegen Definitionen, beheben Probleme und unterstützen die verantwortungsvolle Nutzung über alle Domänen hinweg.
Standardisierung: Begriffe, Richtlinien und Kontrollen sind domänenübergreifend konsistent, wobei Ausnahmen dokumentiert und genehmigt werden.
Auditfähigkeit: Das Unternehmen kann nachweisen, wie auf Daten zugegriffen wurde und wie sie geändert, geteilt und genutzt wurden.
Ethische Nutzung: Datenethik bedeutet, dass Daten auf faire, diskriminierungsfreie und den Erwartungen der Nutzer:innen entsprechende Weise verwendet werden und Mechanismen zur Erkennung und Eindämmung schädlicher oder unbeabsichtigter Folgen unterstützt

Diese Prinzipien spiegeln sich in konkreten Mechanismen wider: Ownership-Felder in einem Katalog, Sensibilitäts-Tags für Datenfelder, Maskierungsrichtlinien für regulierte Daten, Datenherkunftspfade für kritische Berichte und Audit-Logs für Zugriffsüberprüfungen.

Frameworks und Standards für Data Governance

Data Governance-Frameworks und -Standards helfen Unternehmen dabei, ein Programm zu strukturieren, Fähigkeiten zu definieren und zu entscheiden, was zuerst implementiert werden soll. Einige konzentrieren sich auf den Reifegrad des Datenmanagements, während andere den Schwerpunkt auf IT-Governance, Architektur, Qualität oder Cloud-Kontrollen legen.

Framework oder Standard	Am besten geeignet für	Was damit gesteuert wird
DAMA-DMBOK	Umfassendes Design von Datenmanagement-Programmen	Wissensbereiche, Rollen und Disziplinen des Datenmanagements
DCAM	Reifegrad des Enterprise-Datenmanagements	Betriebsmodell, Kontrollen, Verantwortlichkeit und Reifegrad
CDMC	Cloud-Datenmanagement-Kontrollen	Governance-Kontrollen für Cloud- und hybride Datenumgebungen
COBIT	Ausrichtung der IT-Governance	Risiko, Kontrollen, Verantwortlichkeit und Enterprise-Governance
TOGAF	Ausrichtung der Unternehmensarchitektur	Datenarchitektur, Anwendungsabhängigkeiten und Architektur-Governance
FAIR-Prinzipien	Wiederverwendung von wissenschaftlichen Daten und Forschungsdaten	Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit
ISO 8000	Datenqualität und Stammdaten	Qualitätsanforderungen, Datenaustausch und Stammdaten-Prozesse
DGI Data Governance Framework	Design von Governance-Programmen	Entscheidungsrechte, Verantwortlichkeit und Richtlinienprozesse

Eine Gesundheitsorganisation könnte DAMA-DMBOK nutzen, um grundlegende Datenmanagement-Fähigkeiten zu definieren, CDMC, um Cloud-Kontrollen abzubilden, und die Data-Governance-Anforderungen von HIPAA, um Erwartungen an Zugriff, Aufbewahrung und Audits festzulegen.

Frameworks bieten Struktur, aber ein Programm benötigt dennoch Verantwortliche, Metadaten, Klassifizierung, Qualitätsregeln, Zugriffsrichtlinien, Audit-Prozesse und Technologien, um diese Entscheidungen dort umzusetzen, wo Daten genutzt werden.

Erfahren Sie mehr über Data Governance-Frameworks →

Betriebsmodelle für Data Governance

Ein Governance-Programm benötigt ein Betriebsmodell, das zur Arbeitsweise des Unternehmens passt. Ein globales Unternehmen mit Dutzenden von Geschäftsbereichen kann nicht jede Tabelle durch ein zentrales Team verwalten, aber ein vollständig dezentrales Modell könnte zu inkonsistenten Definitionen, doppelten Richtlinien und inkonsistenter Kontrolle führen.

Die meisten Unternehmen entscheiden sich für eines von drei Modellen:

Modell	So funktioniert es	Am besten geeignet für
Zentralisiert	Ein zentrales Governance-Team definiert Richtlinien, Standards und Freigaben	Kleinere Programme, stark regulierte Daten oder Governance in der Frühphase
Föderiert	Domänen verwalten ihre Daten lokal, befolgen aber gemeinsame Governance-Standards	Große Unternehmen mit ausgeprägtem Domänen-Ownership
Hybrid	Ein zentrales Team legt Richtlinien und Plattformstandards fest, während die Domänen das tägliche Stewardship übernehmen	Die ausgereiftesten Unternehmensprogramme

Ein hybrides Modell ist oft am praktischsten. Ein zentrales Team definiert Klassifizierungsstandards, Richtlinienvorlagen, Kataloganforderungen und Audit-Vorgaben. Domänenteams sind für ihre Datenprodukte verantwortlich, pflegen Definitionen, beheben Qualitätsprobleme und genehmigen den Zugriff basierend auf dem lokalen Kontext.

Unabhängig davon, welches Modell ein Unternehmen verwendet, müssen die Entscheidungsrechte explizit festgelegt sein. Wenn zwei Teams den Begriff „aktive:r Kund:in“ unterschiedlich definieren, sollte das Governance-Modell festlegen, wer den Konflikt auflöst. Wenn ein Partner Zugriff auf ein sensibles Dataset anfordert, sollte das Modell festlegen, wer die Anfrage genehmigt, welche Nachweise erforderlich sind und wie die Entscheidung protokolliert wird.

Customer Story: Town of Gilbert

Die Town of Gilbert hat mit Snowflake 11 öffentlich zugängliche Dashboards eingeführt, um die Transparenz bei Bürgerdiensten wie Kriminalprävention, psychologischer Nothilfe, Schlaglochreparaturen und Recycling zu verbessern. Die Stadt nutzt Governance- und Sicherheitsfunktionen wie rollenbasierte Zugriffskontrolle, Metadaten-Felder und Dynamic Data Masking, um den vertrauenswürdigen Zugriff auf sensible Daten des öffentlichen Sektors zu unterstützen.

Customer Story lesen

Die Kernkomponenten der Data Governance

Ein Data Governance-Programm basiert auf Prinzipien und Frameworks, wird aber durch spezifische operative Komponenten umgesetzt. Diese Komponenten machen Governance in den Systemen sichtbar, die täglich genutzt werden: Kataloge, Tags, Lineage-Diagramme, Zugriffsrichtlinien, Qualitätsprüfungen, Stewardship-Workflows und Audit-Logs.

Metadatenmanagement

Metadaten liefern den Kontext, der Personen und Systemen erklärt, was ein Daten-Asset ist, woher es stammt und wie es verwendet werden sollte. Sie können Tabellennamen, Spaltentypen, Owner, Geschäftsdefinitionen, Vertraulichkeitskennzeichnungen, Aktualitätsziele, Datenherkunftspfade, Nutzungsmuster oder Kostenprofile beschreiben.

Die meisten Data Governance-Programme stützen sich auf drei Arten von Metadaten:

Business-Metadaten umfassen Definitionen, Owners, Domänen, Glossarbegriffe und Zertifizierungsstatus – sie helfen Teams zu verstehen, ob ein Daten-Asset relevant und für die Nutzung freigegeben ist.
Technische Metadaten umfassen Schemata, Datentypen, Transformationen, Abhängigkeiten und Datenherkunft (Data Lineage) – sie helfen Engineers und Architekt:innen zu verstehen, wie Daten fließen und sich verändern.
Operative Metadaten umfassen Aktualität, Nutzung, Kosten, Qualitätsergebnisse und Zugriffsmuster – sie helfen Teams zu überwachen, ob Daten aktuell und vertrauenswürdig sind und angemessen genutzt werden.

Erfahren Sie mehr über den Unterschied zwischen Data Governance und technischer Governance →

Datenklassifizierung (Data Classification)

Bei der Datenklassifizierung werden Daten anhand ihrer Sensitivität, ihrer Domäne, gesetzlicher Vorschriften (einschließlich der Datensouveränität) oder ihrer zulässigen Nutzung Labels versehen. Beispielsweise kann ein Datenfeld als PII, geschützte Gesundheitsdaten, Zahlungskartendaten, vertrauliche Finanzdaten oder genehmigte Trainingsdaten getaggt werden. Diese Labels steuern dann Zugriffsüberprüfungen, Maskierungsrichtlinien, Aufbewahrungsregeln, Freigabegenehmigungen und Einschränkungen für die KI-Nutzung.

Die Klassifizierung ist besonders wichtig, da sensible Daten selten isoliert an einem einzigen Ort liegen. E-Mail-Adressen, Kunden-IDs, Diagnosecodes, Geodatenfelder und Transaktionsdetails fließen oft über Pipelines, Dashboards und Anwendungstabellen. Ein Data Governance-Programm muss diese Felder identifizieren, bevor es sie konsequent schützen kann.

Datenkatalog

Ein Datenkatalog ist das durchsuchbare Inventar, das Governance erst praktisch nutzbar macht. Er bietet Analyst:innen, Engineers, Stewards und Geschäftsanwender:innen einen zentralen Ort, um Daten-Assets zu finden, Definitionen zu lesen, die Datenherkunft zu überprüfen, Eigentümer:innen zu ermitteln, Qualitätssignale zu prüfen und Zugriff anzufordern.

Moderne Kataloge zeigen zertifizierte Datenprodukte an, fügen Richtlinienkontext hinzu, zeigen, ob eine Tabelle aktuell genug für die Nutzung ist, und helfen Teams, die Duplizierung ähnlicher Datasets zu vermeiden. Ein guter Katalog beantwortet praktische Fragen, bevor jemand eine Abfrage schreibt: Was bedeutet diese Tabelle? Wer ist dafür verantwortlich? Ist sie genehmigt? Welche nachgelagerten Assets hängen von ihr ab? Enthält sie sensible Daten?

Datenherkunft (Data Lineage)

Die Datenherkunft verfolgt Daten von der Quelle bis zur Nutzung. Sie zeigt, wie sich ein Datenfeld, eine Tabelle oder eine Metrik durch Ingestion, Transformation, Modellierung, Reporting, Sharing und KI-Workflows bewegt. Die Datenherkunft kann auf Tabellenebene ansetzen, um aufzuzeigen, wie Tabellen von anderen Tabellen oder Quellen abhängen; auf Feldebene, um zu veranschaulichen, wie bestimmte Datenfelder transformiert oder wiederverwendet werden; oder systemübergreifend, um darzustellen, wie Daten über Tools, Clouds oder Plattformen hinweg fließen.

Wenn ein reguliertes Datenfeld in einen Bericht, ein Modell oder ein externes Datenprodukt einfließt, hilft die Datenherkunft dabei aufzuzeigen, woher sie stammt, wie sie sich verändert hat und was betroffen sein könnte, wenn sich die Quelle ändert.

Richtlinienmanagement

Im Richtlinienmanagement werden Data Governance-Regeln in durchsetzbare Kontrollen transformiert. Es umfasst Zugriffsrichtlinien, Maskierungsrichtlinien, Einschränkungen auf Zeilenebene, Aufbewahrungsregeln, Data-Sharing-Regeln, Richtlinien zur zulässigen Nutzung und Ausnahme-Workflows.

Eine Richtlinie sollte festlegen, wer unter welchen Bedingungen, zu welchem Zweck und mit welchem Überprüfungsprozess auf welche Daten zugreifen kann. Ein effektives Richtlinienmanagement schließt auch Ausnahmen ein: Einige Nutzer:innen benötigen möglicherweise temporären Zugriff für ein Audit, eine Datenmigration oder die Reaktion auf Vorfälle. Die Governance sollte erfassen, wer die Ausnahme genehmigt hat, warum sie gewährt wurde und wann sie abläuft.

Datenqualität

Datenqualität bestimmt, ob Daten genau, vollständig, konsistent, aktuell, eindeutig und valide genug für ihren vorgesehenen Verwendungszweck sind. Eine Produkttabelle, die für interne Experimente verwendet wird, kann andere Qualitätsanforderungen haben als eine Umsatztabelle für die Finanzberichterstattung oder eine Schadensfalltabelle für Analysen im Gesundheitswesen.

Eine Tabelle kann eine:n Eigentümer:in, eine Glossardefinition und eine Zugriffsrichtlinie haben, aber wenn ihre Datensätze veraltet oder unvollständig sind, können sich die Nutzer:innen nicht darauf verlassen. Moderne Programme verlagern die Qualität durch Datenverträge, Pipeline-Tests und kontinuierliches Monitoring in eine frühere Phase des Lebenszyklus.

Datenschutz und Sicherheit

Der Datenschutz regelt, wie personenbezogene und sensible Daten erfasst, genutzt, aufbewahrt, geteilt und gelöscht werden. Datensicherheit regelt, wie Daten vor unbefugtem Zugriff, Missbrauch oder Offenlegung geschützt werden. Beide hängen von Klassifizierung, Eigentümerschaft, Richtlinien und Überprüfbarkeit ab, weshalb sie in der Regel innerhalb desselben Governance-Frameworks verwaltet werden.

Datenschutzkontrollen können das Einwilligungsmanagement, Workflows für Betroffenenanfragen, Aufbewahrungsregeln, Tokenisierung und Datenmaskierung umfassen. Sicherheitskontrollen können rollenbasierte Zugriffskontrolle, Row Access Policies, Verschlüsselung, Monitoring und Verfahren zur Reaktion auf Vorfälle umfassen. Die Data Governance verbindet diese Kontrollen mit Daten-Assets. Sie zeigt auf, welche Tabellen sensible Daten enthalten, wer darauf zugreifen kann, welche Richtlinien gelten und ob die Nutzung später überprüft werden kann.

Data Sharing und Collaboration

Kontrollierte Daten müssen die sichere Wiederverwendung über Domänen, Partner und externe Ökosysteme hinweg unterstützen und nicht nur den Zugriff innerhalb einer einzelnen Umgebung kontrollieren.

Data Mesh ordnet ein klares Domänen-Ownership zu und wahrt gleichzeitig föderierte Governance-Standards.
Datenprodukte bündeln Daten mit einer Eigentümerschaft, Definition, einem Qualitätsziel und einem Lebenszyklus.
Datenverträge definieren die Erwartungen zwischen Produzenten und Konsumenten, einschließlich Schema, Aktualität und Qualität.
Data Clean Rooms ermöglichen es Parteien, an kontrollierten Daten zusammenzuarbeiten, ohne die zugrunde liegenden Rohdatensätze offenzulegen.

Jedes geteilte Daten-Asset ist mit Annahmen verbunden: wem es gehört, was es bedeutet, ob es aktuell ist, welche Richtlinien gelten und ob die Empfängerseite es für den vorgesehenen Zweck nutzen darf. Governance hilft dabei, diese Annahmen explizit festzulegen und durchsetzbar zu machen.

Customer Story: Siemens AG

Siemens, ein weltweit führendes Technologieunternehmen, hat mit Snowflake ein unternehmensweites Data Mesh aufgebaut – damit wurden über 600 Datenprojekte ermöglicht, Tausende von Data Warehouses integriert und eine skalierbare AI Data Cloud geschaffen, die KI, Automatisierung und unternehmensübergreifende Collaboration unterstützt.

Customer Story lesen

Rollen in Data Stewardship und Governance

Data Governance hängt von bestimmten Personen mit klarer Entscheidungsbefugnis ab. Data Stewardship ist die operative Ebene, die Governance-Entscheidungen mit der täglichen Datenarbeit verknüpft. In einem ausgereiften Programm arbeiten Stewards mit Data Ownern, Custodians, Datenschutzverantwortlichen, Sicherheitsteams und einem Governance Council zusammen, um Definitionen zu pflegen, die Qualität zu überwachen, Zugriffsmuster zu überprüfen und domänenübergreifende Definitionskonflikte zu eskalieren.

Rolle	Governance-Verantwortung
Chief Data Officer	Legt die Datenstrategie des Unternehmens fest, sponsert das Data Governance-Programm und trägt die exekutive Verantwortung für die Datenergebnisse.
Data Owner	Besitzt die fachliche Entscheidungskompetenz über eine Domäne, ein Datenprodukt, eine Metrik oder ein kritisches Dataset.
Data Steward	Pflegt Definitionen, Qualitätserwartungen, Metadaten, Zugriffsrichtlinien und die Problemlösung für eine Domäne oder ein Asset.
Data Custodian	Verwaltet die technische Umgebung, in der Daten gespeichert, verarbeitet, gesichert und gepflegt werden.
Data Protection Officer	Überwacht die Datenschutzverpflichtungen für kontrollierte personenbezogene Daten, insbesondere dort, wo Gesetze eine formelle Datenschutzrolle vorschreiben.
Chief Privacy Officer	Leitet die übergeordnete Datenschutzstrategie, Richtlinien und das Risikomanagement im gesamten Unternehmen.
Governance Analyst	Unterstützt bei der Dokumentation von Richtlinien, der Katalogpflege, dem Reporting, der Problemverfolgung und den Governance-Metriken.
Governance Council	Löst domänenübergreifende Konflikte, genehmigt Standards und priorisiert Data Governance-Initiativen.

Die genaue Rollenverteilung variiert je nach Unternehmen, aber eines bleibt gleich: Data Governance erfordert sowohl geschäftliche Autorität als auch technische Verwahrung. Große Unternehmen formalisieren dies oft durch ein Governance Council, dokumentierte Eskalationspfade und Stewardship auf Domänenebene.

Auf die praktischen Details kommt es an. Sollten sich zwei Teams über die Definition einer Kennzahl uneinig sein, sollte im Programm festgelegt werden, wer die Entscheidung trifft. Wenn für ein kontrolliertes Datenfeld eine neue Datenmaskierungs-Richtlinie erforderlich ist, sollte der Steward wissen, welcher Sicherheits- oder Datenschutzpartner hinzugezogen werden muss. Wenn ein Problem mit der Datenqualität Auswirkungen auf einen nachgelagerten Bericht hat, sollte die Datenherkunft diese Auswirkungen aufzeigen, und das Stewardship-Team sollte festlegen, wer für die Behebung zuständig ist.

Prozess und Strategie für Data Governance

Die praktische Einführung einer Data Governance-Strategie folgt in der Regel diesem Ablauf:

Wählen Sie eine prioritäre Domäne: Beginnen Sie mit Customer 360, der Finanzberichterstattung, kontrollierten Daten, Supply Chain Analytics oder KI-Trainingsdaten – überall dort, wo das Geschäftsrisiko oder der Compliance-Druck am höchsten ist.
Erfassen Sie kritische Datenbestände: Identifizieren Sie die Tabellen, Views, Dateien, Metriken und Berichte, die in dieser Domäne am wichtigsten sind.
Klassifizieren Sie sensible und regulierte Daten: Taggen Sie PII, PHI, Zahlungsdaten, vertrauliche Datensätze und andere kontrollierte Datentypen.
Weisen Sie Owner und Stewards zu: Legen Sie fest, wer für Definitionen, Zugriffsentscheidungen, Qualitätserwartungen und Problemlösungen verantwortlich ist.
Definieren Sie Richtlinien: Legen Sie Regeln für Zugriff, Maskierung, Aufbewahrung, Data Sharing, KI-Nutzung und Ausnahmen fest.
Erfassen Sie die Herkunft und Qualitätssignale: Verfolgen Sie kritische Datenflüsse und überwachen Sie Aktualität, Vollständigkeit und Gültigkeit.
Überprüfen Sie Zugriff und Nutzung: Nutzen Sie Audit-Datensätze, um zu validieren, wer auf sensible Daten zugegriffen hat und ob die Richtlinien wie vorgesehen funktioniert haben.
Domäne für Domäne erweitern: Verwenden Sie Standards, Templates und gewonnene Erkenntnisse erneut, während das Programm skaliert.

Zu den nützlichen Erfolgskennzahlen zählen die Katalog-Adoption, der Anteil der kritischen Datenbestände mit zugewiesenen Ownern, die Klassifizierungsabdeckung, der Abdeckungsgrad der Richtlinien, die Bearbeitungszeit bei Datenqualitätsproblemen, der Abschluss von Zugriffsprüfungen und die Verringerung der Anzahl von Audit-Feststellungen.

Erfahren Sie mehr über Best Practices für Data Governance →

Data Governance und Einhaltung gesetzlicher Vorschriften

Aufsichtsbehörden können verlangen, dass ein Unternehmen nachweisen kann, welche regulierten Daten es speichert, wer darauf zugegriffen hat, wie diese geschützt wurden, wie lange sie aufbewahrt wurden und ob die erforderlichen Kontrollen angewendet wurden. Governance unterstützt GRC (Governance, Risk, Compliance), indem sie Datenbestände mit Richtlinien, Eigentümer:innen, Kontrollen und Audit-Trails verknüpft.

Hier einige Beispiele:

Governance-Verpflichtung	Vorschriften und Standards (Beispiele)	Was Governance nachweisen hilft
Personenbezogene und sensible Daten schützen	DSGVO, BDSG, CCPA/CPRA, LGPD, PDPA, HIPAA	Welche personenbezogenen Daten existieren, wo diese liegen, wer darauf zugreifen kann und wie Betroffenenanfragen bearbeitet werden – einschließlich der spezifischen BDSG-Anforderungen für Beschäftigtendaten und Videoüberwachung
Integrität der Berichterstattung wahren	SOX, BCBS 239, Basel III	Wie Finanz- oder Risikodaten definiert, transformiert, kontrolliert und abgestimmt werden
Zahlungsdaten schützen	PCI DSS	Wo Karteninhaberdaten liegen und welche Kontrollen greifen
Betriebliche Resilienz verwalten	DORA, NIS2	Wie kritische Systeme, Drittanbieter sowie ICT-Risiken (Informations- und Kommunikationstechnologie) überwacht werden
KI-bezogene Datennutzung steuern	EU AI Act und neue KI-Gesetze	Welche Daten in KI-Systemen verwendet werden, ob dies angemessen ist und wie eine risikoreiche Nutzung kontrolliert wird

In Deutschland legt das Bundesdatenschutzgesetz (BDSG) nationale Anforderungen fest, die die DSGVO ergänzen – insbesondere für den Beschäftigtendatenschutz und den Einsatz von Videoüberwachung. Im April 2026 trat zudem das Daten-Governance-Gesetz in Kraft: Deutschlands Umsetzung des EU Data Governance Act. Es schafft den Rechtsrahmen für Datenvermittlungsdienste und die Weiterverwendung öffentlicher Daten, mit der Bundesnetzagentur als zentraler Anlaufstelle. Damit wird Data Governance in Deutschland nicht nur zur Best Practice, sondern zur gesetzlichen Anforderung.

Der EU AI Act ist ein gutes Beispiel dafür, warum Governance-Zeitpläne eine so kritische Rolle spielen. Die Verordnung gilt schrittweise: Allgemeine Bestimmungen und Verbote gelten ab dem 2. Februar 2025, Regeln für Allzweck-KI ab dem 2. August 2025 und eine breitere Einführung erfolgt bis zum 2. August 2027. Für Unternehmen, die verwaltete Unternehmensdaten in KI-Systemen verwenden, entsteht dadurch die praktische Notwendigkeit, die Herkunft der Trainingsdaten, die Datenklassifizierung sensibler Daten, Zugriffsberechtigungen und die Überprüfbarkeit lückenlos nachzuvollziehen.

Sehen Sie sich das Video an und erfahren Sie, wie die Funktionen von Snowflake – wie die Überwachung sensibler Daten – es Ihnen ermöglichen, Ihre sensiblen Daten mit nur wenigen Klicks zu identifizieren und einen umfassenden Überblick darüber zu erhalten.

Warum Data Governance auf Snowflake betreiben?

Data Governance lässt sich leichter aufrechterhalten, wenn Richtlinien, Metadaten, die Datenherkunft, Qualitätsüberwachung und Zugriffskontrollen nah an dem Ort angesiedelt sind, an dem Daten gespeichert, verarbeitet, geteilt und genutzt werden. Die Governance-Funktionen von Snowflake sind direkt in dieselbe Umgebung integriert, in der Unternehmen Daten, Anwendungen und KI-Workloads verwalten – anstatt über ein separates Tool angewendet zu werden, das synchron gehalten werden muss.

Einheitlicher Katalog mit integrierter Datenherkunft: Snowflake Horizon Catalog bietet Katalog, Datenherkunft auf Feldebene, aktive Metadaten und Richtliniendurchsetzung auf einer einzigen Oberfläche. Snowflake Horizon Catalog kann den Bedarf an einem separaten Katalog-Tool reduzieren, da der Governance-Kontext nah an den Daten angesiedelt ist.

Von Grund auf Compliance-orientiert: Snowflake Compliance Center bietet die Überwachung des Sicherheitsstatus sowie Bescheinigungen zur Unterstützung von Standards wie HIPAA, PCI DSS, SOC 2 Type II, ISO 27001, FedRAMP Moderate und IRAP. Je nach Implementierung können bestimmte Funktionen und Kundenkonfigurationen erforderlich sein.

Policy-as-Code für sensible Daten: Dynamic Data Masking, Row Access Policies, Tag-based Masking und External Tokenization implementieren automatisierte Sicherheits-Controls direkt auf Datenebene. Bei korrekter Konfiguration kann die Klassifizierung dazu beitragen, dass Richtlinien konsistent über Abfragen, Anwendungen, Sharing und KI-Workflows hinweg angewendet werden.

Überprüfbare Nutzung: Access History und Query History können dabei helfen, detaillierte Zugriffs- und Transformationsdatensätze zu erfassen, die Audits und behördliche Überprüfungen unterstützen. Bei richtiger Konfiguration können Unternehmen leichter erkennen, wer wann auf eine sensible Spalte zugegriffen hat.

Integrierte Governance-Kontrollen für KI-Workflows: Cortex Guard wendet Richtlinienkontrollen auf LLM-Ein- und -Ausgaben an, um das Risiko zu verringern, dass sensible Daten in ungeeignete Modellkontexte gelangen. Datenmetrikfunktionen können verwendet werden, um die Qualität von Trainingsdaten im Laufe der Zeit zu überwachen, sodass die Daten, die in KI-Systeme eingespeist werden, denselben Standards entsprechen wie die Daten für Berichte.

Kontrolliertes Sharing ohne Kopien: Secure Data Sharing, Listings und Data Clean Rooms ermöglichen es Unternehmen, Erkenntnisse mit Partnern und externen Beteiligten zu teilen, ohne Rohdaten über Sicherheitsgrenzen hinweg zu übertragen. Data Governance-Controls lassen sich kontinuierlich einfacher und konsistent durchsetzen, da die Daten die Plattform zu keinem Zeitpunkt verlassen.

Zusammen bieten diese Funktionen eine zentrale Governance-Oberfläche für Data Warehouses, Data Lakes, offene Tabellenformate wie Iceberg, Anwendungen und KI – so müssen Kontrollen nicht jedes Mal neu erstellt werden, wenn Daten in eine neue Umgebung verschoben werden.

Data Governance als feste operative Disziplin etablieren

Governance-Reife ist kein binärer Zustand. Die meisten Programme decken einige Bereiche ab, weisen in anderen jedoch Lücken auf. Diese Lücken werden meist im denkbar ungünstigsten Moment sichtbar. Bei einer Compliance-Prüfung könnte ein Datenfeld auffallen, das nie klassifiziert wurde. Oder ein KI-Ergebnis wird in Frage gestellt, aber niemand kann nachvollziehen, welche Daten dazu beigetragen haben.

Die Unternehmen, die solche Situationen vermeiden, sind nicht diejenigen, die eine Governance-Implementierung abgeschlossen haben. Es sind diejenigen, die Verantwortlichkeiten, Lineage, Klassifizierung und Audit-Kontrollen in ihre Arbeitsabläufe integriert haben – sodass die Antwort bereits vorliegt, wenn die Frage aufkommt.

Erfahren Sie mehr über Anwendungsfälle für Data Governance →

WICHTIGSTE ERKENNTNIS

Data Governance ist kein einmaliges Projekt, sondern eine fortlaufende Disziplin, die Daten in großem Maßstab vertrauenswürdig, nutzbar und überprüfbar macht. Durch die Etablierung klarer Verantwortlichkeiten, konsistenter Richtlinien sowie Transparenz bei Daten, Qualität und Zugriff können Unternehmen kritische Fragen zu ihren Daten beantworten, noch bevor Probleme entstehen. Da die Nutzung von Daten und KI zunimmt, ist die Einbettung von Data Governance in alltägliche Workflows – anstatt sie als separate Kontrollebene zu behandeln – genau das, was es Teams ermöglicht, schneller zu agieren und gleichzeitig Risiken zu reduzieren.

In diesen Grundlagen

Was ist Data Governance?
Warum Data Governance jetzt wichtiger denn je ist
Data Governance für KI
Prinzipien der Data Governance
Frameworks und Standards für Data Governance
Betriebsmodelle für Data Governance
Die Kernkomponenten der Data Governance
Rollen in Data Stewardship und Governance
Prozess und Strategie für Data Governance
Data Governance und Einhaltung gesetzlicher Vorschriften
Warum Data Governance auf Snowflake betreiben?
Data Governance als feste operative Disziplin etablieren

Häufig gestellte Fragen

Ihre häufigsten Fragen zu Data Governance - beantwortet von Snowflake-Experten

Was ist der Unterschied zwischen Data Governance und Datenmanagement?

Datenmanagement umfasst das Sammeln, Speichern, Transformieren, Integrieren und Bereitstellen von Daten. Data Governance definiert die Regeln für diese Prozesse: wem die Daten gehören, wie sie definiert sind, wer sie nutzen darf, wie die Qualität gemessen wird und wie die Compliance nachgewiesen wird. Weitere Details finden Sie in unserem Grundlagen zu Data Governance vs. Datenmanagement.

Wer ist für Data Governance verantwortlich?

Die Führungsverantwortung liegt oft bei einem Chief Data Officer oder einer ähnlichen Führungsrolle, während die operative Verantwortung im Alltag gemeinschaftlich von Data Ownern, Data Stewards, Data Custodians, Sicherheits-, Datenschutz- und Compliance-Teams sowie Data Governance Councils getragen wird.

Was sind die größten Herausforderungen bei der Data Governance?

Die größten Herausforderungen sind meist organisatorischer Natur: unklare Verantwortlichkeiten, mangelndes Executive Sponsorship, inkonsistente Definitionen und Governance, die fälschlicherweise als reine IT-Aufgabe statt als strategische Business-Aufgabe behandelt wird. Technische Probleme wie unvollständige Metadaten, eingeschränkte Datenherkunft oder ungleichmäßige Klassifizierung lassen sich leichter lösen, sobald Verantwortlichkeiten und Prozesse klar definiert sind.

Wie unterstützt Data Governance die KI?

Data Governance kontrolliert die Daten, die KI-Systeme verwenden. Sie hilft Teams dabei, die Datenherkunft zu verstehen, sensible Felder zu klassifizieren, Zugriffsrichtlinien durchzusetzen, die Qualität zu überwachen, die zulässige Nutzung zu dokumentieren und nachzuverfolgen, welche Datenquellen zu KI-Ergebnissen oder -Entscheidungen beitragen.

Ist Data Governance für die Compliance erforderlich?

Die meisten Vorschriften schreiben kein spezifisches Governance-Programm vor, aber Compliance erfordert in der Regel Governance-Funktionen. Unternehmen müssen wissen, welche regulierten Daten sie besitzen, wo diese liegen, wer darauf zugreifen kann, wie sie geschützt sind und ob sie bei einem Audit Nachweise erbringen können.

Ressourcen zu Data Governance

E-BOOK

Data Governance-Themen entdecken

Ein tiefer Einblick in alle Aspekte der Data Governance

Data-Governance-Frameworks

Vergleichen Sie DAMA-DMBOK, DCAM, CDMC und andere Frameworks zur Strukturierung eines Data Governance-Programms.

Mehr erfahren

Datenkatalog

Das durchsuchbare Inventar, das Governance für Analyst:innen, Data Engineers und Stewards greifbar und nutzbar macht.

Mehr erfahren

Data-Governance-Richtlinie

Ein praktisches Framework zur Festlegung von Regeln für Datenzugriff, Datenqualität und Data Stewardship.

Mehr erfahren

Datenherkunft

Verfolgen Sie Daten von der Quelle bis zur Nutzung über Pipelines, Berichte und KI-Workflows hinweg.

Mehr erfahren

Data-Governance-Modelle

Wie drei primäre Modelle jeweils Entscheidungsbefugnis, Stewardship und Durchsetzung handhaben.

Mehr erfahren

Data Privacy Governance

Governance-Kontrollen für den Schutz personenbezogener Daten – von Klassifizierung und Zugriff bis zu DSGVO-Compliance und KI-Nutzung.

Mehr erfahren

* Private Preview, † Public Preview, ‡ demnächst verfügbar

Data Governance: Was es ist und warum Sie es brauchen

Was ist Data Governance?

Warum Data Governance jetzt wichtiger denn je ist

Baris Gutelkin

Data Governance für KI

Prinzipien der Data Governance

Frameworks und Standards für Data Governance

Betriebsmodelle für Data Governance

Customer Story: Town of Gilbert

Die Kernkomponenten der Data Governance

Metadatenmanagement

Datenklassifizierung (Data Classification)

Datenkatalog

Datenherkunft (Data Lineage)

Richtlinienmanagement

Datenqualität

Datenschutz und Sicherheit

Data Sharing und Collaboration

Customer Story: Siemens AG

Rollen in Data Stewardship und Governance

Prozess und Strategie für Data Governance

Data Governance und Einhaltung gesetzlicher Vorschriften

Warum Data Governance auf Snowflake betreiben?

Data Governance als feste operative Disziplin etablieren

Häufig gestellte Fragen

Ressourcen zu Data Governance

5 kritische Komponenten für eine erfolgreiche Data Governance

Skalierbare, agile und umfassende Datenverwaltung und Data Governance

Unify Your Governance Strategy with Snowflake Horizon Catalog

Snowflake Horizon Catalog

Data Governance-Themen entdecken

Data-Governance-Frameworks

Datenkatalog

Data-Governance-Richtlinie

Datenherkunft

Data-Governance-Modelle

Data Privacy Governance