Analisi dei dati più veloci: Snowflake migliora la durata media delle query del 40%

Snowflake si impegna a fornire miglioramenti automatici e coerenti delle prestazioni. Lavoriamo dietro le quinte per rendere le vostri operazioni con i dati più veloci, efficienti e convenienti, senza interventi da parte dell’utente, configurazioni manuali o tempi di inattività pianificati. Ogni settimana, distribuiamo aggiornamenti in background, garantendo che i vostri workload siano sempre in esecuzione sulla versione più aggiornata e veloce di Snowflake, senza interruzioni del servizio. Sappiamo che il vostro tempo è denaro, quindi il nostro obiettivo è rendere Snowflake il più facile da usare e ottimizzato possibile, pronto all’uso.
Questo approccio aiuta a ottenere il miglior rapporto prezzo/prestazioni con Snowflake. In più, con il nostro modello di prezzo basato sui consumi, questi miglioramenti delle prestazioni possono generare un reale risparmio sui costi.
Snowflake Performance Index: i risultati
La nostra dedizione al vostro successo ci spinge a misurare e migliorare continuamente le prestazioni che ottenete con Snowflake. Snowflake Performance Index (SPI) monitora questi miglioramenti nel mondo reale nel tempo. Invece di utilizzare benchmark sintetici per il confronto delle prestazioni, misuriamo i nostri miglioramenti utilizzando dati reali dei clienti sui workload di produzione.
Ciò significa che l’indice SPI riflette miglioramenti effettivi che fanno la differenza nelle operazioni quotidiane. Dal lancio di SPI nell’agosto 2022, la durata media delle query per i workload stabili è ora migliorata del 40%. Solo negli ultimi 12 mesi, l’indice SPI ha registrato un miglioramento del 20%.

Miglioramenti delle prestazioni monitorati dall’indice SPI
Negli ultimi 12 mesi abbiamo introdotto diversi miglioramenti significativi, la maggior parte dei quali avvengono automaticamente, senza bisogno di configurazioni o modifiche al codice.
Miglioramento dell’esecuzione delle query: abbiamo investito tempo per continuare a ridurre i tempi di esecuzione e gestire in modo più efficace modelli di query complessi. Alcuni esempi sono l’ottimizzazione delle query di join, la gestione automatica della distorsione e l’espansione del supporto per il pruning Top-K per migliorare le prestazioni delle query con schemi di aggregazione e filtraggio specifici. Questi aggiornamenti aiutano le query a funzionare più velocemente, anche quando i workload diventano più complessi.
Caricamento e replica dei dati: abbiamo ridotto il tempo dedicato alla replica dei metadati, abbiamo reso più veloce la clonazione e abbiamo ottimizzato l’ingestion di data set di grandi dimensioni per aiutarvi a portare i dati in Snowflake in modo più rapido e affidabile, semplificando i vostri flussi di lavoro e pipeline.
Ottimizzazione adattiva: abbiamo lanciato una serie di ottimizzazioni adattive per rendere Snowflake più intelligente nella scelta delle migliori strategie per l’esecuzione delle query. Ad esempio, abbiamo ampliato il pruning Top-K per includere una più ampia gamma di query e perfezionato la capacità dell’optimizer di prendere decisioni intelligenti sugli ordini di join, ottenendo una pianificazione delle query più rapida ed efficiente.
Efficienza della piattaforma: abbiamo continuato a migliorare l'affidabilità e la velocità complessive della piattaforma. Ad esempio, abbiamo ridotto il tempo necessario per le operazioni di clonazione e reso più efficiente la compressione, riducendo il consumo di risorse e facilitando le operazioni del sistema.
Questi sono solo alcuni esempi di come stiamo rendendo Snowflake più veloce ed efficiente per voi. Siamo impegnati a mantenere questo slancio. Investendo continuamente nel miglioramento delle prestazioni, ci impegniamo ad aiutarvi a ottenere più valore da Snowflake e a ridurre i vostri costi operativi nel tempo.
Per ulteriori informazioni sugli ultimi miglioramenti, consultate le note di rilascio e visitate la pagina SPI.
*Sulla base di dati Snowflake interni, la durata media delle query per i workload stabili dei clienti è migliorata del 40% dal 25 agosto 2022 al 31 ottobre 2024. Ai fini del calcolo dell’indice SPI, abbiamo identificato un gruppo di workload di clienti stabili e confrontabili, sia in termini di quantità di query sia di dati elaborati nel corso del periodo considerato. La riduzione della durata delle query è stata frutto di una combinazione di fattori, tra cui miglioramenti hardware e software e ottimizzazioni dei clienti. Il miglioramento delle metriche di durata delle query viene arrotondato al centesimo più vicino.