Blog
CRÉER UN DATA LAKEHOUSE OUVERTAVEC APACHE ICEBERG
Des transactions ACID sur les data lakes ouverts pour des analyses unifiées, l’IA et le ML et d’autres charges de travail collaboratives.
Déclarations prévisionnelles
Cette page contient des déclarations prévisionnelles, notamment de futures offres de produits. Elle ne constitue en aucun cas un engagement à fournir des offres de produits. Les offres et résultats réels peuvent varier et faire l’objet de risques connus et inconnus, ainsi que d’incertitudes. Découvrez notre dernier 10‑Q pour en savoir plus.
Simplicité d’utilisation
Ce service entièrement géré prend en charge les mises à niveau, la maintenance du stockage, l’approvisionnement et toute une série d’autres services automatisés : vous n’avez plus rien à régler.
Accès entre moteurs
Centralisez votre gestion des données avec Polaris Catalog, où chaque utilisateur et moteur peut trouver des Iceberg Tables et y accéder depuis un même endroit.
Performance rapide et rentable
Mise à l’échelle quasi instantanée et élastique pour prendre en charge des volumes de données massifs et des utilisateurs simultanés en Python, SQL, Java et Scala. Amélioration continue des coûts et prévisibilité grâce aux optimisations intégrées.
STOCKAGE OUVERT ET INTEROPÉRABLE
Utilisez le format de table standard open source Apache Iceberg, leader du secteur, pour stocker vos données. Pas de frais d’ingestion initiaux pour l’intégration de Snowflake avec des ensembles de données Iceberg existants.
CATALOGUE OUVERT
Bientôt disponible : Polaris Catalog, un catalogue open source pour Apache Iceberg, qui atténue la dépendance vis-à-vis des catalogues propriétaires
- Bénéficiez de l’interopérabilité en lecture et en écriture à partir de n’importe quel moteur prenant en charge l’API REST open source d’Iceberg.
- Gérez et accédez aux Iceberg Tables à partir de nombreux moteurs depuis un même endroit.
- Exécutez vos tables sur votre propre infrastructure à l’aide de conteneurs ou sur l’infrastructure Snowflake, sans dépendance. Et si vous souhaitez remplacer votre infrastructure sous-jacente, vous conservez tous les contrôles d’accès basés sur les rôles, les espaces de noms et les définitions de tables de Polaris Catalog.
PLATEFORME POLYVALENTE DE TRAITEMENT DES DONNÉES
Intégration de la plateforme Snowflake pour le data engineering et l’IA avec les Iceberg Tables
- Chargez les fichiers en continu et automatiquement dans les Iceberg Tables avec Snowpipe.
- Organisez la saisie des données de changement (CDC) à l’aide de Streams et de Tasks.
- Créez des processus de déclaration à faible latence avec les Dynamic Tables (vous pourrez bientôt bénéficier de la prise en charge d’Iceberg en public preview).
- Analysez et traitez les données textuelles avec Snowflake Cortex AI.
- Générez des prédictions avec les fonctions de ML de Snowflake Cortex et Snowpark ML.
- Transformez les données en Python, Java ou Scala avec Snowpark.
Stockage ouvert et gouverné avec Snowflake Horizon
Que ce soit avec le stockage data lake externe ou géré par Snowflake, appréhendez et protégez vos données grâce à l’étendue des capacités de gouvernance native des données de Snowflake
- Contrôlez la conformité, la découverte et la protection des données sensibles, ainsi que l’utilisation appropriée des ressources avec Object Tagging.
Renforcez la sécurité au niveau des colonnes avec Dynamic Data Masking.
Automatisez l’application des politiques de masquage avec Tag-based Masking.
Renforcez la sécurité au niveau des lignes avec Row Access Policies.
Utilisez des vues intégrées prêtes à être interrogées pour assurer la conformité réglementaire et l’audit, mais aussi pour mieux comprendre la traçabilité des données, les tendances d’utilisation et les relations.
PERFORMANCES DE REQUÊTE RENTABLES
Optimisez les charges de travail hautement concurrentes sans conflit de ressources
Entre l’utilisation des Iceberg Tables gérées par Snowflake et des tables ingérées au format Snowflake, la différence de performance est quasiment nulle.
Tarification à la consommation : vous payez uniquement pour ce que vous utilisez.
La mise à l’échelle des ressources de calcul se fait automatiquement en fonction des exigences de la charge de travail.
L’isolation du calcul minimise les conflits de ressources.
Les moniteurs de budgets et de ressources permettent de surveiller et de contrôler les dépenses.
Grâce à l’amélioration continue des performances et à l’optimisation des coûts, le prix de vos performances ne peut être qu’avantageux.
Premiers pas Avec Iceberg
Suivez une formation pratique sur les Iceberg Tables avec ces tutoriels.
Démarrez votre essaigratuit de 30 jours
Essayez Snowflake gratuitement pendant 30 jours et découvrez l'AI Data Cloud qui élimine la complexité, les coûts et les contraintes d’autres solutions.