Snowflakeパフォーマンス指数の追跡開始以来、安定したワークロードでのクエリ時間が20%向上
注:本記事は(2024年2月7日)に公開された(Snowflake Improves Query Duration by 20% on Stable Workloads Since We Began Tracking the Snowflake Performance Index)を機械翻訳により公開したものです。
今年の初め、Snowflake Summitにおいて、Snowflakeパフォーマンス指数(SPI)の一般公開を発表しました。SPIは、お客様が実際に体験したSnowflakeのパフォーマンスの長期的な向上を測定するための総合指数です。この記事では、年2回の頻度で最新の改善点をご紹介します。
Snowflakeのパフォーマンス理念
Snowflakeの製品理念は、コアデータベースエンジンの改良に焦点を当て、Snowflakeのパフォーマンスを高めるための継続的な探求を中心としています。週次リリースは、定期的にパフォーマンスを改善するための手段です。これらの機能強化は、日々のワークフローにシームレスに統合され、追加の労力やコストをかけることなくパフォーマンスを向上させます。このアプローチは、Snowflakeでの価格対性能比の最適化に役立ちます。
私たちの手法:SPIのまとめ
SPIは、Snowflakeのこのような定期的なパフォーマンス改善の長期的な影響を測定するように設計された集計指数です。Snowflakeは、ワークロードをより迅速に実行するための改善に継続的に投資するという透明性と説明責任を提供するというコミットメントを体現しています。
SPIを計算する際、提示期間におけるお客様のワークロードグループのうち、処理されたクエリ量とデータ量の両方が安定していて比較可能なものを特定しています。クエリ時間の短縮は、ハードウェアとソフトウェアの改善やお客様の最適化などのいくつかの要因の組み合わせによってもたらされました。
従来の合成ベンチマークとは異なり、SPIは表面的なものではなく、Snowflakeの改善がお客様の安定した反復ワークロードに及ぼす影響を測定するものです。このアプローチでは、お客様の特定のワークロードの進捗を時系列で追跡できます。
数字が物語る
Snowflakeの内部データによると、お客様の安定したワークロードのクエリ時間が2022年10月31日から2023年10月31日までに11%向上しました。
2022年8月のSPI開始以降、2023年10月31日までにクエリ時間が20%も短縮されました。
これらの数値は、単なる統計ではありません。お客様にとってのSnowflakeのパフォーマンスを継続的に改善するという、Snowflakeのコミットメントの目に見える結果を表しています。
SPIによって追跡されるパフォーマンス改善の例
SPIは、価格対性能比の改善幅を測定します。複数の機能強化により、コンパイラの速度と効率が向上しました。たとえば、クエリ特性に基づく不要な最適化ステップの回避、マテリアライズドビューにアクセスするクエリのコンパイル時間の改善、SQL式の評価方法の改善などです。
さらに、マテリアライズドビューのメンテナンスの効率を高め、反復クエリのパフォーマンス特性を把握しやすくしました。また、SHOWコマンドのパフォーマンスの改善、新しい検索最適化技術の導入、非クラスタテーブルから読み取るクエリの実行時間の改善も行いました。
これらは個別の改善ではなく、ほぼ毎週のリリースに伴う一貫した機能強化の一部です。これらの改善の詳細については、こちらのパフォーマンスリリースノートをご覧ください。
継続的な改善への取り組み
SPIの目的は、過去の成果を振り返ることだけではありません。そのため、Snowflakeは一度限りの指標ではなく、プラットフォーム性能の向上がお客様の実稼働ワークロードに及ぼす影響を透明かつ定量的に把握し、お客様のために継続的に経済性の向上に取り組んでいます。SPIは、Snowflakeが新機能、機能強化、コンピュートオプションのパフォーマンスへの影響を継続的に測定し、強化するためのコンパスの役割を果たします。
詳しくは、SPIウェブサイトをご覧ください。