BUILD: The Dev Conference for AI & Apps (Nov. 12-14)

Hear the latest product announcements and push the limits of what can be done in the AI Data Cloud.

製品 & テクノロジー

Snowflakeのクラス最高のエンタープライズデータ基盤がオープンデータおよび社内コラボレーションとの相互運用性を実現

Snowflakeのクラス最高のエンタープライズデータ基盤がオープンデータおよび社内コラボレーションとの相互運用性を実現

Snowflakeは、統合データ、最適なTCO、ユニバーサルガバナンスを土台とした強固なデータ基盤を提供します。Snowflakeプラットフォームは、あらゆるデータタイプとワークロードをサポートしながら、サイロを排除してあらゆるアーキテクチャパターンを可能にします。オープンスタンダードの採用をさらに進めるため、Snowflakeは、Snowflakeに縛られることなくお好みのエンジンで読み書きできるApache Iceberg用のオープンソースカタログであるPolaris Catalogのリリースと、Icebergテーブルのサポートの一般提供を発表します。Snowflakeには、Snowflake Horizonを通じたデータ、アプリ、モデルのガバナンスと発見が組み込まれています。Snowflake Horizonには内部マーケットプレイス(プライベートプレビュー中)も含まれており、組織全体でアセットを簡単に共有できます。最後に、Snowflakeはパフォーマンスを継続的に改善し、2022年8月のメトリクス追跡開始以来、クエリ時間が27%向上しました。これは、お客様の長期的なコスト削減を目的としています。 

オープンストレージアーキテクチャをサポート

AIデータクラウドは、オープンファイルやテーブル形式で保存されているデータなど、さまざまな形式、構造、保管場所のデータを処理し、コラボレーションするための単一のプラットフォームです。Icebergテーブル(現在一般提供開始)をSnowflakeプラットフォームの機能と組み合わせることで、データレイクハウスやデータメッシュなどのさまざまなオープンアーキテクチャを構築できます。また、一元的なアクセスによる複数のエンジンからの読み取りと書き込みの相互運用性など、さらなる柔軟性を提供するために、Snowflakeは今後90日間でPolaris Catalogをオープンソース化します。Icebergテーブルが一般提供されたことで、Snowflakeの多くの機能を活用し、オープンIcebergフォーマットのテーブル上でさまざまなワークロードを強化できるようになりました。これには、Snowpark、ストリーム、タスク、動的テーブルによるパイプラインと変換(近日中にパブリックプレビュー開始)、Snowflake Cortex AIによるAIとMLのIcebergへの拡張、自動クラスタリングや圧縮などの機能によるストレージメンテナンスの実行、ライブデータシェアリングでの安全なコラボレーションが含まれます。

データレイクでIcebergをまだ使用していない場合、Snowflakeは簡単かつコスト効率の良い方法でIcebergにオンボーディングするための機能を提供します。Parquet Direct(プライベートプレビュー中)では、新しいParquetファイルが到着しても、Parquetファイルを書き換えたり複製したりすることなくIcebergを使用できます。レイクハウスですでにDelta Lakeを使用している場合、Delta Direct(プライベートプレビュー中)では、ユニバーサルフォーマット(UniForm)のすべての要件なしで、継続的かつコスト効率の良い方法でDelta Lakeテーブルに「ブロンズ」レイヤーと「シルバー」レイヤー用のIcebergテーブルとしてアクセスできます。

ビルトインのガバナンスとディスカバリー(社内チーム向け)

Snowflake Horizonにより、データガバナー、データスチュワード、データチームは、AIデータクラウドでデータ、アプリ、モデルを管理し、発見するための統合された方法を手にすることができます。これらの機能は、他のエンジンで作成されたIcebergテーブルにも拡張できます。データチームは、外部パートナーや顧客だけでなく、同じ組織内でも、この種のコンテンツでコラボレーションできるようになりました。新しいAIガバナンスの進化により、組織はモデルに対する理解を深め、共有し、セキュリティを確保できます。 

より優れた発見可能性とAIを活用したオブジェクトメタデータによる管理された社内コラボレーション

Snowflakeは、データチームがデータ、アプリ、そして新たにモデル(近日中にプライベートプレビュー開始)を簡単に発見、キュレーション、共有するための全く新しい方法を導入します。データチームが自然言語を使用してAIデータクラウド全体に関連するデータ、アプリ、モデルを検索できるUniversal Search(一般提供)に加えて、インターナルマーケットプレイス(プライベートプレビュー中)は、安全なコラボレーションと価値創造を促進するために組織内で使用するために特別にキュレーションされたすべてのデータ製品のディレクトリです。AIを活用したオブジェクト記述(近日プライベートプレビュー開始)はテーブルやビューへの記述の生成によりデータチームの時間を節約し、オブジェクトインサイトインターフェース(プライベートプレビュー)はオブジェクトの人気、アクセス、品質、依存性に関する関連インサイトを提示することにより追加のコンテキストを提供します。また、機密データの自動分類(プライベートプレビュー中)と自動タグ伝播(近日中にプライベートプレビュー開始)により、機密データの分類を合理化できるようになりました。

モデルとアプリケーションのセキュリティ改善

AIセキュリティ面では、Snowflake Cortex Guardの一般提供がまもなく始まります。Snowflake Cortex Guardは、Metaの入出力保護モデルであるLlama Guardを使用して、暴力やヘイト、自傷行為、犯罪行為に関するコンテンツをフィルタリングします。近日中に、セキュリティリスクを発見するための組み込みインターフェイスであるTrust Centerと、その解決のための推奨事項を単一の使いやすいインターフェイスで利用可能になると、Snowflake Horizonはクロスクラウドの脅威モニタリングの一元化を推進します。Trust Centerの追加機能強化により、Snowflakeネイティブアプリを継続的にスキャンしてソフトウェアの脆弱性に関するインサイトを獲得し(近日中にプライベートプレビュー開始)、プロバイダーに警告します。追加の認証改善(一般提供)、ネットワーキングの強化(一般提供)、プライベートリンク接続(近日中にプライベートプレビュー開始)により、セキュリティがさらに強化されます。

データクリーンルームと高度なポリシーによるプライバシー保護型コラボレーション

プライバシー保護コラボレーションのイノベーションにより、組織全体にまたがる複数の関係者がデータプライバシーを保護しながら、価値の高いビジネス成果を実現し、個人データ、規制データ、または専有データの分析価値を引き出すことができます。Snowflakeデータクリーンルーム(一部の地域のお客様に一般提供)の導入により、Snowflakeでは技術者ではないユーザーがシンプルなUIですぐに使えるテンプレートにアクセスでき、開発者はAPIを使用してクリーンルームをカスタマイズし、好みのモデルを展開できます。さらなるプライバシー強化イノベーションにより、より多くのユーザーが元のデータセットにアクセスすることなく、合成データ生成(近日中にプライベートプレビュー開始)を使用して機密データのテストや開発を行うことができます。差分プライバシーポリシー(近日中にパブリックプレビュー開始)により、コラボレーションを通じてきめ細かで機密性の高いデータから価値を引き出し、ノイズを加えることでデータを再識別やプライバシー攻撃から保護することができます。エンティティレベルのプライバシー(一般提供)は、データポイントが複数の行や列に分散しているエンティティを保護します。

データの品質とモデルのモニタリングの改善

データガバナーとスチュワードがデータの機密性と品質のモニタリングを強化し、コンプライアンスレビューと監査に合格できるよう、Snowflakeはリネージビジュアライゼーションインターフェイスをビュー(近日中にパブリックプレビュー開始)とモデル(プライベートプレビュー中)に拡張し、データガバナーがより多くのオブジェクトの上流と下流の関係を俯瞰できるようにします。すぐに使えるデータ品質メトリクス(null countなど)とカスタムデータ品質メトリクスを定義し、自動的に測定およびモニタリングするために、Snowflakeはデータ品質モニタリングをまもなく一般提供開始することを発表します。

Icebergテーブルの相互運用性の強化

オープンなPolaris Catalogにより、Iceberg REST APIをすでにサポートしているあらゆるエンジンがIcebergテーブルを作成できるようになりました。これらのテーブルがSnowflakeに同期された後は、きめ細かいアクセスポリシーからUniversal Searchまで、Snowflake Horizonの業界をリードするガバナンス機能とディスカバリー機能をネイティブのSnowflakeオブジェクトのように簡単に適用できます。

パフォーマンスと組み込みのコスト管理の継続的な改善

Snowflakeの成功は、お客様の成功にかかっています。つまり、Snowflakeは、お客様が効率的にコストを管理できるツールを提供しながら、最適なパフォーマンスを最適な価格で提供することに継続的に取り組んでいます。

Snowflakeはクエリ時間の短縮を継続しており、最新のSnowflakeパフォーマンス指数(SPI)の結果では、安定した顧客ワークロードについて、2022年8月25日から2024年4月30日までに27%、過去12か月間で12%の改善が見られました。SPIは、Snowflakeの一貫したパフォーマンス改善が実際のお客様の実稼働ワークロードに及ぼす影響を測定します。これらのパフォーマンス最適化の多くはインテリジェントで、お客様のアクションなしで自動的に実行されます。Snowflakeの費用の可視性、制御、最適化をより簡単に行えるよう、Snowflakeは最近、一般提供されているコスト管理インターフェイスに新たな機能を追加いたしました。詳しくは、このブログをご覧ください。さらにSnowflakeは、クエリごとのコストアトリビューションがまもなくパブリックプレビューを開始し、特定のクエリに対するウェアハウス支出のアトリビューションを可能にすると発表しています。これにより、チャージバックシナリオが強化されます。WAREHOUSE_EVENTS_HISTORYビュー(一般提供)の機能強化により、クレジット消費に影響を与える可能性のあるウェアハウスの変更をより簡単に監視できるようになります。また、予算はSnowflakeコンテナサービスコンピュートプール(近日中に一般提供開始)をカバーします。コスト管理インターフェイスでは、最近クエリされていない大きなテーブルなどのオポチュニティを表面化するためのコストインサイトが利用可能になりました。これにより、コストインサイトは即座にアクションを起こすことができます。

より迅速かつ容易な取り込み

データ取得のコスト効率と手間をさらに高めるため、Snowflakeは、JSONファイルの読み込みで最大25%、Parquetファイルの読み込みで最大50%のパフォーマンス向上を発表しています。今回のリリースにより、Snowflakeはより多くのネイティブコネクタを提供し、より簡単にデータを取り込むことができるようになりました。既存のKafka用およびServiceNow用Snowflakeコネクタを含むSnowflakeのネイティブコネクタは、拡張性、コスト効率、低レイテンシーで構築されています。わずか数クリックでデータを取り込むことができ、データは暗号化されます。Snowflakeが新たにサポートする最新のコネクタには以下が含まれます。

  • PostgreSQL用Snowflakeコネクタ(近日中にパブリックプレビュー開始) 
  • MySQL用Snowflakeコネクタ(近日中にパブリックプレビュー開始) 
  • Googleアナリティクス用Snowflakeコネクタ(一般提供)

グローバルな規制および主権市場の拡大

3つのハイパースケーラーにまたがる40以上のクラウドリージョンをすでにサポートしているSnowflakeは、顧客の規制要件を満たすために、データレジデンシーとデータ主権のために、使用データを地理的境界内に保持することを優先するゾーンレポジトリを通じて、グローバルな規制および主権のある市場にも拡大しています。特に、SnowflakeはSovereignty Roadmap in Europeの一環として、欧州におけるより厳しいデータアクセス制限に対処するためのデータガバナンスとセキュリティ強化コントロールの提供に取り組んでいます。

米国Snowflakeは、国防総省(DoD)のお客様には、国防総省(DISN)境界クラウドアクセスポイント(BCAP)とのネットワーキング統合を含む、インパクトレベル4(IL4)認定の環境をまもなく一般提供開始いたします。これにより、DoDのお客様が極めて具体的な規制要件を満たすことができるようになります。

高度なアナリティクス

Snowflakeは、いくつかの新しいアナリティクス機能のリリースにより、より有意義なデータインサイトを引き出すことを可能にします。Time Series ASOF JOIN(一般提供)、Time Series RANGE BETWEEN(近日中にパブリックプレビュー開始)、高次関数(近日中に一般提供)により、複雑なクエリの記述やカスタムUDFへの依存なしに、簡単に高性能の高度なアナリティクスを実行できます。Snowflakeの新しいトークンベースの検索機能である全文検索機能(近日中にパブリックプレビュー開始)により、特定の列または1つ以上のテーブルで完全な文字やテキストを見つけることができるようになります。さらに、検索最適化はフルテキスト検索と互換性があり、テラバイト規模のデータを数秒で、しかも低い同時実行性でクエリできます。さらに、Snowflakeは、Discrete Global Grid H3(一般提供)のサポートにより、地理空間分析を進化させ続けています。

詳しくはこちら

Snowflakeは、すべてのデータを統合し、ビルトインのガバナンスとディスカバリーを提供し、さまざまなワークロードの価格対性能比を継続的に改善する単一のプラットフォーム上で、データ基盤を簡素化するのに役立ちます。

ここでハイライトされているSnowflakeプラットフォームのさまざまな領域の詳細については、以下のリソースを参照してください。

将来の見通しに関する記述について

この記事には、将来の製品の提供に関する記述が含まれており、いかなる製品の提供を約束するものではありません。実際の結果とサービスは異なる場合があります。また、既知または未知のリスクや不確実性に左右される可能性があります。詳細については、最新の第10四半期を参照してください。

Authors
Share Article

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

30日間の無料トライアルを開始する

Snowflakeの30日間無料トライアルで、他のソリューションに内在する複雑さ、コスト、制約の課題を解決するデータクラウドを体験できます。