Apache Icebergを使用するオープンなデータレイクハウスの構築

統合アナリティクス、AI/ML、その他のコラボレーションワークロードのためのオープンなデータレイクにおいて、ACIDトランザクションを実現します。

Snowflake Iceberg Tables
発表

Apache Icebergのためのオープンソースカタログ、Polaris Catalogの発表

相互運用性がさらに向上した、フルオープンソースのIcebergカタログがまもなく登場します。

将来の見通しに関する記述
このページには、Snowflakeが将来提供する製品に関する記述を含め、将来の見通しに関する記述が含まれていますが、これはいかなる製品の提供も約束するものではありません。実際の成果や提供物は異なる可能性があり、既知および未知のリスクおよび不確実性の影響を受けます。詳細については、最新の四半期報告書(10-Q)をご覧ください。

使いやすさ

フルマネージドのサービスにより、アップグレード、ストレージメンテナンス、プロビジョニングを始めとする多くのサービスが自動化されます。ユーザーによる操作は不要です。

クロスエンジンのアクセス

Polaris Catalogを使用してデータ管理を一元化することにより、すべてのユーザーとエンジンが1つの場所からIcebergテーブルを見つけてアクセスできるようになります。

費用対効果に優れた高速のパフォーマンス

ほぼ瞬時に伸縮可能なスケーラビリティにより、Python、SQL、Java、Scalaを使用する大量の同時ユーザーとデータに対応できます。組み込みの最適化で、コストと予測可能性を継続的に改善します。

Snowflake for Data Lakehouse Architecture Diagram
dsafas

相互運用可能なオープンストレージ

オープンソースの主要な標準テーブルフォーマットである、Apache Icebergを使用してデータを保存します。事前の取り込みコストなしに、Snowflakeと既存のIcebergデータセットを統合できます。

オープンなカタログ

まもなく登場:プロプライエタリなカタログによるロックインを軽減する、Apache Icebergのためのオープンソースカタログ、Polaris Catalog

  • IcebergのオープンソースREST APIをサポートするすべてのエンジンについて、読み取りと書き込みを可能にする相互運用性
  • さまざまなエンジンのIcebergテーブルの管理とアクセスを1つの場所で実現
  • コンテナを使用して自社のインフラストラクチャで実行することも、Snowflakeのインフラストラクチャで実行することもでき、ロックインの心配が不要。基盤インフラストラクチャを入れ替える必要が生じた場合も、Polaris Catalogのロールベースのアクセス制御(RBAC)、名前空間、テーブル定義はすべて保持される
polaris
Compute interoperability

汎用的なデータ処理プラットフォーム

データエンジニアリングとAIを支えるSnowflakeプラットフォームをIcebergテーブルと統合

  • Snowpipe:ファイルをIcebergテーブルに継続的かつ自動的にロード
  • ストリームとタスク:チェンジデータキャプチャ(CDC)のオーケストレーションを実施
  • ダイナミックテーブル(Icebergのサポートは近日中にパブリックプレビュー開始):低レイテンシーの宣言型処理を構築
  • Snowflake Cortex AI:テキストデータを分析、処理
  • Snowflake Cortex ML関数とSnowpark ML:予測を生成
  • Snowpark:Python、Java、Scalaのデータを変換

Snowflake Horizonによってガバナンスが確保されたオープンストレージ

Snowflakeの広範なネイティブのデータガバナンス機能により、Snowflakeマネージドのデータレイクストレージと外部のデータレイクストレージの双方についてデータの把握と保護を実現

  • オブジェクトタギング:機密データのコンプライアンス、発見、保護、リソース使用状況を監視
  • ダイナミックデータマスキング:列レベルのセキュリティを適用

  • タグベースのマスキング:マスキングポリシーの適用を自動化

  • 行アクセスポリシー:行レベルのセキュリティを適用

  • 組み込みのクエリ可能なビュー:規制コンプライアンスと監査を実施し、リネージ、使用パターン、リレーションシップを把握

fda
fdsa

費用対効果の高いクエリパフォーマンス

リソース競合を発生させることなく同時実行性の高いワークロードをサポート

  • SnowflakeマネージドのIcebergテーブルと、取り込まれるSnowflakeフォーマットのテーブルの間でのパフォーマンスのトレードオフはほぼゼロ

  • 従量課金の料金設定:使用した分のみの支払い

  • ワークロード要件に応じたコンピュートリソースの自動スケーリング

  • コンピュートの分離:リソース競合を最小化

  • バジェットモニターとリソースモニター:支出を監視、制御

  • 継続的なパフォーマンス改善とコスト最適化:価格性能比が時間の経過とともにさらに向上

30日間の無料トライアルを開始する

Snowflakeの30日間無料トライアルで、他のソリューションに内在する複雑さ、コスト、制約の課題を解決するデータクラウドを体験できます。