分析の高速化:Snowflakeが平均クエリ時間を40%短縮

Snowflakeでは、一貫した自動パフォーマンス強化の提供に取り組んでいます。ユーザーの介入、手動設定、計画的なダウンタイムなしで、より迅速、効率的、よりコスト効率の良いデータ運用ができるよう、私たちはバックグラウンドで取り組んでいます。毎週、バックグラウンドでシームレスにアップデートを展開し、お客様がサービスを中断することなく、常に最新かつ最速のバージョンのSnowflakeでワークロードを実行できるようにしています。私たちは、お客様の時間はお金であるとわかっています。そのため、Snowflakeは、すぐに使える、可能な限り使いやすく最適化されたものを目指しています。
このアプローチの目的は、お客様がSnowflakeで最高のコストパフォーマンスを得られるようにすることです。さらに、私たちの使用量ベースの料金設定モデルでは、このようなパフォーマンスの向上は実際のコスト削減につながります。
Snowflakeパフォーマンス指数(SPI)の結果
Snowflakeは、お客様の成功に貢献するため、お客様がSnowflakeで体験できるパフォーマンスを継続的に測定し、強化します。Snowflakeパフォーマンス指数(SPI)は、このような実世界での改善を時系列で追跡します。パフォーマンス比較に合成ベンチマークを使用する代わりに、実稼働ワークロードに関する実際の顧客データを使用して機能強化を測定します。
つまり、SPIには、日常業務に違いをもたらす本物の改善が反映されているのです。2022年8月にSPIを開始して以来、安定したワークロードの平均クエリ時間は40%改善しました。過去12か月間だけで、SPIは20%改善しました。

SPIによって追跡された最新のパフォーマンス改善
過去12か月間で、私たちはいくつかの大幅な改善を導入しました。これらの機能はほとんど自動的に行われ、コードを変更するための設定や追加の努力は必要ありません。
クエリ実行の改善:私たちは、実行時間を短縮し、複雑なクエリパターンをより効果的に処理し続けるために投資してきました。たとえば、特定の集約パターンとフィルタリングパターンを持つクエリのパフォーマンスを改善するための、結合クエリの最適化、スキューの自動処理、TOP-Kプルーニングのサポートの拡張などが挙げられます。これらのアップデートは、ワークロードが複雑化しても、クエリを高速化するために役立ちます。
データの取り込みとレプリケーション:私たちはメタデータレプリケーションに費やす時間を減らし、クローニングを高速化し、大量のデータセットの取得を最適化して、より迅速かつ信頼性の高い方法でデータをSnowflakeに取り込み、ワークフローとパイプラインを合理化しました。
適応型最適化:私たちは、Snowflakeがクエリ実行のための最適な戦略をよりスマートに選択できるように、いくつかの適応型最適化を開始しました。たとえば、より幅広いクエリを含むようにTOP-Kプルーニングを拡張し、インテリジェントな結合順序決定を行うオプティマイザーの機能を洗練させました。これにより、より迅速かつ効率的なクエリ計画が可能になります。
プラットフォームの効率性:私たちは、プラットフォーム全体の信頼性とスピードを引き続き強化しています。たとえば、クローン作成に要する時間の短縮や圧縮効率の向上、リソース消費の削減、よりスムーズなシステム運用の実現などです。
これらは、Snowflakeをより迅速かつ効率的にするためのほんの一例です。私たちは、このモメンタムを継続させることに尽力しています。そして、パフォーマンス強化への投資を継続的に行うことで、お客様がSnowflakeからより多くの価値を引き出し、長期的に運用コストを削減できるよう取り組んでいます。
最新の改善点の詳細については、パフォーマンスリリースノートとSPIウェブサイトをご覧ください。
*Snowflakeの内部データによると、お客様の安定したワークロードのクエリ時間が2022年8月25日から2024年10月31日までの間で40%向上しました。SPIを計算する際に、提示期間におけるお客様のワークロードグループのうち、処理されたクエリ量とデータ量の両方が安定していて比較可能なものを特定しています。クエリ時間の短縮は、ハードウェアとソフトウェアの改善やお客様の最適化など、いくつかの要因の組み合わせによって実現しました。クエリ時間メトリクスの改善値は小数第3位で四捨五入されています。