製品 & テクノロジー

分析の高速化:Snowflakeが平均クエリ時間を40%短縮

Photo illustration of a man using a laptop with a blue bar chart of rising bars superimposed over

Snowflakeでは、一貫した自動パフォーマンス強化の提供に取り組んでいます。ユーザーの介入、手動設定、計画的なダウンタイムなしで、より迅速、効率的、よりコスト効率の良いデータ運用ができるよう、私たちはバックグラウンドで取り組んでいます。毎週、バックグラウンドでシームレスにアップデートを展開し、お客様がサービスを中断することなく、常に最新かつ最速のバージョンのSnowflakeでワークロードを実行できるようにしています。私たちは、お客様の時間はお金であるとわかっています。そのため、Snowflakeは、すぐに使える、可能な限り使いやすく最適化されたものを目指しています。 

このアプローチの目的は、お客様がSnowflakeで最高のコストパフォーマンスを得られるようにすることです。さらに、私たちの使用量ベースの料金設定モデルでは、このようなパフォーマンスの向上は実際のコスト削減につながります。

Snowflakeパフォーマンス指数(SPI)の結果

Snowflakeは、お客様の成功に貢献するため、お客様がSnowflakeで体験できるパフォーマンスを継続的に測定し、強化します。Snowflakeパフォーマンス指数(SPI)は、このような実世界での改善を時系列で追跡します。パフォーマンス比較に合成ベンチマークを使用する代わりに、実稼働ワークロードに関する実際の顧客データを使用して機能強化を測定します。 

つまり、SPIには、日常業務に違いをもたらす本物の改善が反映されているのです。2022年8月にSPIを開始して以来、安定したワークロードの平均クエリ時間は40%改善しました。過去12か月間だけで、SPIは20%改善しました。

Graph showing 40% improvement in query duration over the last 26 months
Snowflakeパフォーマンス指数の改善(2022年8月~2024年10月)。

SPIによって追跡された最新のパフォーマンス改善

過去12か月間で、私たちはいくつかの大幅な改善を導入しました。これらの機能はほとんど自動的に行われ、コードを変更するための設定や追加の努力は必要ありません。

クエリ実行の改善:私たちは、実行時間を短縮し、複雑なクエリパターンをより効果的に処理し続けるために投資してきました。たとえば、特定の集約パターンとフィルタリングパターンを持つクエリのパフォーマンスを改善するための、結合クエリの最適化、スキューの自動処理、TOP-Kプルーニングのサポートの拡張などが挙げられます。これらのアップデートは、ワークロードが複雑化しても、クエリを高速化するために役立ちます。

データの取り込みとレプリケーション:私たちはメタデータレプリケーションに費やす時間を減らし、クローニングを高速化し、大量のデータセットの取得を最適化して、より迅速かつ信頼性の高い方法でデータをSnowflakeに取り込み、ワークフローとパイプラインを合理化しました。

適応型最適化:私たちは、Snowflakeがクエリ実行のための最適な戦略をよりスマートに選択できるように、いくつかの適応型最適化を開始しました。たとえば、より幅広いクエリを含むようにTOP-Kプルーニングを拡張し、インテリジェントな結合順序決定を行うオプティマイザーの機能を洗練させました。これにより、より迅速かつ効率的なクエリ計画が可能になります。

プラットフォームの効率性:私たちは、プラットフォーム全体の信頼性とスピードを引き続き強化しています。たとえば、クローン作成に要する時間の短縮や圧縮効率の向上、リソース消費の削減、よりスムーズなシステム運用の実現などです。

これらは、Snowflakeをより迅速かつ効率的にするためのほんの一例です。私たちは、このモメンタムを継続させることに尽力しています。そして、パフォーマンス強化への投資を継続的に行うことで、お客様がSnowflakeからより多くの価値を引き出し、長期的に運用コストを削減できるよう取り組んでいます。

最新の改善点の詳細については、パフォーマンスリリースノートSPIウェブサイトをご覧ください。

*Snowflakeの内部データによると、お客様の安定したワークロードのクエリ時間が2022年8月25日から2024年10月31日までの間で40%向上しました。SPIを計算する際に、提示期間におけるお客様のワークロードグループのうち、処理されたクエリ量とデータ量の両方が安定していて比較可能なものを特定しています。クエリ時間の短縮は、ハードウェアとソフトウェアの改善やお客様の最適化など、いくつかの要因の組み合わせによって実現しました。クエリ時間メトリクスの改善値は小数第3位で四捨五入されています。

Photo illustration of people using a laptop on a blue background
Forrester Report

The Total Economic Impact of the Snowflake AI Data Cloud

Forrester studied the potential ROI organizations may get from deploying Snowflake, including everything from cost savings to productivity gains.
記事をシェアする

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

30日間の無料トライアルを開始する

Snowflakeの30日間無料トライアルで、他のソリューションに内在する複雑さ、コスト、制約の課題を解決するデータクラウドを体験できます。