Produkt & Technologie

9 Best Practices für den Übergang von On-Premise zur Cloud mit Snowflake

Digital illustration of an on-premise data store sending data to a cloud icon with the Snowflake cloud in the center

Snowflake-Teams identifizieren täglich Chancen und helfen Kundenunternehmen bei der Umsetzung empfohlener Best Practices, die den Migrationsprozess von On-Premise in die Cloud erleichtern. Darüber hinaus beobachten sie potenzielle Herausforderungen und beraten zu bewährten Mustern, um eine erfolgreiche Datenmigration zu gewährleisten.

In diesem Artikel werden neun Schlüsselbereiche vorgestellt, die Sie beachten und planen sollten, um den reibungslosen Übergang zur Cloud zu beschleunigen. Darüber hinaus beleuchtet dieser Blog einige bewährte Funktionen von Snowflake, die Ihnen dabei helfen, den Wert Ihrer Migration zu optimieren.

Die Migration von Unternehmensdaten in die Cloud kann eine schwierige Aufgabe sein. Richtig ausgeführt kann sie jedoch nicht nur effizient, sondern auch weit weniger herausfordernd sein. Durch die Nutzung der integrierten Funktionen von Snowflake können einige der häufigsten Pain Points im Migrationsprozess weiter beseitigt werden.

Die Schwerpunkte in diesem Artikel sind:

  1. Datenkomprimierung

  2. Ursprüngliche Daten-Uploads 

  3. Kontinuierliche Daten-Uploads

  4. Priorisierung von Datasets

  5. Datenlebenszyklusmanagement

  6. Datensicherheit und Verschlüsselung

  7. Datenvalidierung

  8. Notfallwiederherstellung 

  9. Mehrere Softwareumgebungen

Datenkomprimierung

Bei der Übertragung von On-Premise-Daten in die Cloud ist Datenkompression entscheidend, um die Bandbreite zu wahren. Es gibt verschiedene Möglichkeiten, Daten vor dem Hochladen zu komprimieren. Gzip ist beispielsweise eine zuverlässige Komprimierungsmethode. Beim Laden von Daten aus Amazon S3 Buckets in Snowflake kann die Datenkompression den Prozess optimieren, die Effizienz steigern und die Übertragungszeit verkürzen.

Wie Snowflake dabei helfen kann: Wenn Dateien mit gzip oder einem anderen weit verbreiteten Format komprimiert werden, kann Snowflake die komprimierten Daten direkt erfassen, ohne dass eine manuelle Dekomprimierung erforderlich ist. Wenn Ihre Dateien auf einem lokalen Laufwerk unkomprimiert sind, komprimiert Snowflake sie auch automatisch mit gzip – es sei denn, die Komprimierung ist explizit deaktiviert oder eine andere Komprimierungsmethode angegeben. Diese integrierte Funktion hilft außerdem, die Bandbreite beim Hochladen von Dateien zu schonen und so den Migrationsprozess effizienter zu gestalten.

Ursprüngliche Daten-Uploads

Jedes Unternehmen verwaltet riesige Datenmengen, die in verschiedenen Formaten in On-Premise-Systemen verteilt sind. Ein hybrider Ansatz, bei dem einige Datasets weiterhin on-premise bleiben und andere in die Cloud verschoben werden, mag attraktiv erscheinen, um den Aufwand im Voraus zu verringern, doch langfristig wird es wahrscheinlich deutlich schwieriger sein, das zu bewältigen. Bei einem hybriden Ansatz haben Sie die Aufgabe, zwei separate Infrastrukturen mit potenziell unterschiedlichen Formaten zu verwalten, und ein Verbundmodell ist wahrscheinlich zeitaufwendig und teuer in der Verwendung.

Die Datengröße reicht von wenigen Gigabyte bis hin zu mehreren Terabyte. Die Verwaltung weniger Gigabyte (GB) ist relativ einfach, aber die Migration von Daten im Terabyte-Bereich kann logistische Herausforderungen darstellen. Um den Erfolg dieses enormen Vorhabens sicherzustellen, ist eine einmalige, manipulationssichere Übertragungsmethode unerlässlich, um die Datengenauigkeit zu fördern und die Sicherheitskontrollen während des gesamten Prozesses aufrechtzuerhalten.

Wie Snowflake dabei helfen kann: Jeder große Cloud Service Provider (CSP) bietet Lösungen für umfangreiche Datenübertragungen an. AWS bietet Snowball, Microsoft Azure Databox und Google hat Transfer Appliance, um einmalige, massive Datenmigrationen zu ermöglichen. Da Snowflake mit diesen CSPs kompatibel ist, wird die Einspeisung in Snowflake zur weiteren Verarbeitung nahtlos, sobald die Offline-Übertragung abgeschlossen ist und die Daten in der Cloud verfügbar sind.

Kontinuierliche Daten-Uploads

Einmalige Uploads können mit den oben diskutierten Lösungen verwaltet werden. Kunden müssen sich jedoch auch überlegen, wie sie täglich mit neuen Daten umgehen können. Dieser Prozess könnte unbegrenzt oder für einen bestimmten Zeitraum fortgesetzt werden, bis die On-Premise-Architektur vollständig außer Betrieb genommen und Daten direkt in Ihre Cloud-Plattform geleitet werden. Um diese fortlaufenden Anforderungen an das Laden von Daten zu erfüllen, müssen Pipelines entwickelt werden, um neu generierte Daten kontinuierlich zu erfassen und in Ihre Cloud-Plattform hochzuladen. Das ermöglicht einen nahtlosen und effizienten Informationsfluss während und nach der Migration.

Wie Snowflake dabei helfen kann: Snowflake bietet eine Vielzahl von Optionen zur Datenerfassung. Für die kontinuierliche Echtzeitbeladung eignet sich Snowpipe ideal für Trickle-Feeds. Beim Batch-Loading kann der leistungsstarke Befehl COPY verwendet werden. Für Streaming-Anwendungsfälle mit geringer Latenz ist Snowpipe Streaming ideal. Darüber hinaus ermöglichen Snowflakes robuste Ökosystem-Tools zur Datenintegration sichere und kontrollierte inkrementelle Uploads, ohne dass eine komplexe Infrastruktur erforderlich ist. Diese Flexibilität ermöglicht eine effiziente und zuverlässige Datenerfassung mit minimalen Unterbrechungen während des Migrationsprozesses. In dieser dreiteiligen Serie erfahren Sie mehr über Best Practices zur Datenerfassung mit Snowflake: Teil 1, Teil 2, Teil 3.

Priorisierung von Datasets

Unternehmen stehen oft vor der Herausforderung, dass verschiedene Teams miteinander konkurrieren, um ihre Daten schnellstmöglich in die Cloud zu migrieren. Wird sie nicht systematisch verwaltet, können mehrere Kopien derselben Daten in der Cloud gespeichert werden, was zu Ineffizienzen führt. Um dies zu vermeiden, ist es entscheidend, Datasets zu priorisieren und sie in strukturierter Reihenfolge zu migrieren, beginnend mit „Master Datasets“, bevor sie zu anderen übergehen.

Snowflake ermöglicht zwar eine nahtlose Datenmigration und Priorisierung, doch viele unserer Kunden haben bewiesen, dass eine gründliche Planung und sorgfältige Identifizierung von Datasets der Schlüssel dafür ist, dass die richtigen Daten zuerst bewegt werden, um unnötige Duplikationen zu verhindern. Es kann so einfach sein, die Datasets an einem zentralen Ort wie Sharepoint aufzulisten und Priorität für eine angemessene Planung zuzuweisen und die Liste regelmäßig zu überprüfen.

Wie Snowflake dabei helfen kann: Obwohl es zahlreiche Methoden zum Hochladen von Datasets gibt und wir einige davon bereits in diesem Blog diskutiert haben, sticht die Option zum Laden von Dateien über die Weboberfläche von Snowflake als eine der einfachsten und oft schnellsten Methoden zum Erfassen von Daten hervor. Dieser benutzerfreundliche Ansatz ermöglicht es geschäftlichen Benutzer:innen, Dateien schnell in Snowflake zu übertragen und so die Datenerfassung zu optimieren.

Datenlebenszyklusmanagement

Das Datenlebenszyklusmanagement ist ein entscheidender Bereich für ein effektives Kostenmanagement in der Cloud. Für die Pflege von Daten in der Cloud fallen Betriebskosten an. Daher sollte die Festlegung einer soliden Datenaufbewahrungsrichtlinie ein grundlegender Aspekt der Cloud-Strategie eines Kunden sein. Während gesetzliche und Compliance-Anforderungen möglicherweise eine vollständige Datenlöschung verhindern, wird die Implementierung eines Ablaufmodells für Daten empfohlen, die nicht unter diese Aufbewahrungsanforderungen fallen. Dieser Ansatz trägt zur Optimierung der Speicherkosten bei.

Wie Snowflake dabei helfen kann: Snowflake bietet verschiedene Funktionen, die das Datenmanagement erleichtern, darunter verschiedene Überlegungen zum Datenspeicher. In Kombination mit unseren Tools zur Kostenoptimierung wie Budgets tragen diese zur Senkung der Speicherkosten bei. Darüber hinaus arbeitet unser Produktteam an neuen richtlinienbasierten Funktionen, um den Lebenszyklus von Daten nahtlos zu verwalten.

Datensicherheit und Verschlüsselung

Datensicherheit ist ein wichtiger Bereich, den Unternehmen beim Verschieben ihrer Daten in die Cloud berücksichtigen. Das Sicherheitsteam muss mit ins Boot geholt werden, da Unternehmensdaten die vier Wände des Unternehmens verlassen und in die Cloud gebracht werden. Features wie private Konnektivität, Netzwerkrichtlinien und Verschlüsselung sind einige der weit verbreiteten Methoden zum Schutz von Daten während des Wechsels in die Cloud.

Einige Unternehmen haben Sicherheitsrichtlinien festgelegt, nach denen Daten verschlüsselt werden müssen, bevor sie ihr Rechenzentrum verlassen. Verschlüsselungsmethoden wie RSA und AES können auf Dateiebene angewendet werden, um den Datenschutz während dieses Prozesses zu ermöglichen. Sobald die Daten an Ihre Cloud-Plattform übertragen wurden, können umfassende Datenschutzrichtlinien implementiert werden, um die Daten sowohl während der Übertragung als auch im Ruhezustand zu schützen und eine zusätzliche Sicherheitsebene während des gesamten Migrationsprozesses zu bieten.

Wie Snowflake dabei helfen kann: Snowflake bietet End-to-End-Verschlüsselung, um Unternehmen bei der Erfüllung ihrer Compliance-Anforderungen zu unterstützen und die Daten während ihres gesamten Lebenszyklus zu schützen. Darüber hinaus bietet Snowflake robuste Schlüsselmanagement-Lösungen, sobald die Daten sich in Snowflakes Managementbereich befinden, was die Sicherheit und Kontrolle über sensible Informationen weiter verbessert. Darüber hinaus helfen Private Link und die Beschränkung der HTTP-Anforderungen von bestimmten IP-Adressen (auch bekannt als „IP-Whitelisting“), den Datenzugriff zu beschränken.

Datenvalidierung

Die Datenvalidierung ist entscheidend für die Datenqualität und das Vertrauen der geschäftlichen Benutzer:innen, da sie diese Informationen nutzen. Einige wichtige Kennzahlen, die Kunden für die Validierung verwenden, umfassen die Anzahl der eindeutigen Werte, die Anzahl der Nullwerte, die Aktualität des Datasets und Duplikatwerte. Die regelmäßige Protokollierung und Überprüfung dieser Kennzahlen in definierten Abständen trägt zur Aufrechterhaltung der Datenqualität bei und unterstützt die fundierte Entscheidungsfindung für die Geschäftsgruppen.

Wie Snowflake dabei helfen kann: Snowflake bietet eine Vielzahl von Datenmetrikfunktionen, die im Hintergrund ausgeführt werden können, um Anomalien zu erkennen und die Datenvalidierung zu unterstützen. Diese Funktionen überwachen die Daten kontinuierlich, ermöglichen eine proaktive Erkennung von Problemen und fördern die allgemeine Qualität und Zuverlässigkeit der Daten.

Notfallwiederherstellung

Die für eine Cloud erforderliche Notfallvorsorge unterscheidet sich erheblich von einem On-Premise-System. Standardmäßig haben die CSPs Standards für DR-Strategien zur Pflege von Datenkopien festgelegt. On-Premise-Lösungen erfordern oft umfangreiche Planung und Ressourcen für Datenredundanz und die Einhaltung von RPO- und RTO-Richtlinien für die Wiederherstellung. CSPs bieten jedoch in der Regel integrierte DR-Funktionen, die diese Prozesse rationalisieren und die Datenresilienz erhöhen. So können Unternehmen die Infrastruktur des CSP für eine effizientere und effektivere Notfallwiederherstellung nutzen. Die Konzentration auf die Anwendungsanforderungen in Bezug auf die Datenverfügbarkeit trägt dazu bei, Geschäftsrisiken zu minimieren.

Wie Snowflake dabei helfen kann: Eine der wichtigsten Stärken von Snowflake ist die Fähigkeit, mit Snowgrid eine nahtlose Geschäftskontinuität über verschiedene Clouds und Regionen hinweg zu gewährleisten, was sehr einfach zu implementieren ist, ohne dass im Backend viel Infrastrukturmanagement nötig ist. Darüber hinaus bietet Snowflake verschiedene integrierte Funktionen zur Unterstützung der Notfallwiederherstellung, darunter automatische Replikation, Time Travel, Failover/Failback und Secure Data Sharing

Mehrere Softwareumgebungen

In der Cloud sind oft mehrere Umgebungen (wie Entwicklung, Test, Staging und Produktion) erforderlich, ähnlich wie bei On-Premise-Einrichtungen. Cloud-Plattformen bieten jedoch mehr Flexibilität und Skalierbarkeit, was das Management vereinfachen kann. Man kann Kosten sparen, da die Cloud die Zuweisung von Ressourcen je nach Bedarf ermöglicht, Unternehmen dabei hilft, Umgebungen nach Bedarf aufzurichten und abzureißen und nur für das zu bezahlen, was sie auch nutzen. Darüber hinaus machen es Automatisierungstools für die Bereitstellung und Wartung der Umgebungen ein Kinderspiel, die gesamte Logistik zu verwalten. Benutzertests, Performancetests, Regressionstests, Sicherheitstests und mehr werden durch die Charakteristiken der Cloud sehr einfach.

Wie Snowflake dabei helfen kann: Snowflake hilft Unternehmen, Zeit, Aufwand und Geld zu sparen, indem es eine zentrale Plattform für einfachen Zugriff, Zero Copy Cloning für sofortige Kopien ohne Replikation in verschiedenen Umgebungen, Integration mit CI/CD-Tools und sofortigen Zugriff auf Ressourcen für verschiedene Arten von Tests bietet, ohne dass die Infrastruktur zur Unterstützung dieser Funktionen zusätzlich verwaltet werden muss.

Schlussgedanken

Während wir die neun großen Bereiche diskutiert haben, in denen Kunden zu kämpfen haben, und die potenziellen Lösungen, ist dies keineswegs eine erschöpfende Liste. Mit sorgfältiger Planung und den richtigen Tools können Sie die umständliche Aufgabe einer Migration von Unternehmensdaten in die Cloud einfach planen und verwalten. Die robusten Funktionen von Snowflake, die von Datenkomprimierung, Upload-Optionen, Datenlebenszyklusmanagement und verbesserter Sicherheit reichen, tragen dazu bei, den Übergang zur Cloud zu beschleunigen und gleichzeitig Risiken zu minimieren.

Indem Unternehmen sich auf die kritischen Bereiche konzentrieren, die in diesem Artikel diskutiert werden, können sie ihre Cloud-Migration optimieren und einen reibungslosen Übergang gewährleisten, der sowohl den operativen Anforderungen als auch den langfristigen Geschäftszielen entspricht. Mit Snowflake als vertrauenswürdigem Partner an Ihrer Seite verläuft der Weg Ihrer Unternehmensdaten in die Cloud reibungslos.  Weitere Informationen finden Sie auf der dedizierten Snowflake-Migrationsseite Migrate to the Cloud und erfahren Sie mehr über unser natives Tool zur Code-Umwandlung, SnowConvert

Digital illustration of an on-premise data store sending data to a cloud icon with the Snowflake cloud in the center
Data Cloud Academy

Migrations Master Class

Take our free course and get best practices for migrating to Snowflake, including expert tips and customer experiences.
Share Article

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Starten Sie Ihre 30-tägigekostenlose Testversion

Testen Sie Snowflake 30 Tage kostenlos und erleben Sie die Data Cloud – ohne die Komplexität, Kosten und Beschränkungen anderer Lösungen.