I segreti del successo della migrazione da Spark a Snowflake: esperienze e risultati dei clienti
![Photo illustration of people on a tablet, digital code graphics, and a tablet with charts, all in Snowflake arrow shapes](https://publish-p57963-e462109.adobeaemcloud.com/adobe/dynamicmedia/deliver/dm-aid--ae5d1e37-7cb5-494f-96ee-fcc08b623810/apache-spark-to-snowflake-migration-blogheader-1680x720.jpg?quality=85&preferwebp=true)
Oggi il panorama aziendale è sempre più competitivo e la giusta piattaforma dati può fare la differenza tra team che si sentono potenziati o limitati. Mi piace parlare con leader di diversi settori e organizzazioni per sapere cosa pensano mentre valutano le varie piattaforme dati.
In queste conversazioni, ci sono una serie di domande che sento ripetutamente. La mia piattaforma dati sarà abbastanza scalabile e affidabile? Sarà facile da usare per tutto il mio team? Quali saranno i costi? In che modo i miei dati rimarranno al sicuro e governati?
Una parte critica di questa decisione è determinare su quale tecnologia di base costruire l’infrastruttura. Gli ambienti Apache Spark gestiti, come Databricks, Amazon EMR e alcune distribuzioni Cloudera, possono presentare ai team una pletora di punti deboli, che possono includere complessità, costi imprevedibili, problemi di sicurezza o problemi di prestazioni.
A mio parere, questi fattori sono i motivi principali per cui organizzazioni di tutte le dimensioni e settori scelgono Snowflake. Aiutare le organizzazioni a migrare e vedere gli straordinari risultati che ottengono sono alcuni degli aspetti più gratificanti del mio lavoro. Nel nuovo ebook “Secrets of Apache Spark to Snowflake Migration Success” presentiamo alcune di queste entusiasmanti storie di clienti come AMN Healthcare, IGS Energy, Intercontinental Exchange e il New York Stock Exchange.
Ecco alcuni esempi di organizzazioni leader che stanno migrando da ambienti Spark gestiti a Snowflake per risparmiare milioni di dollari, migliorare le prestazioni e portare più rapidamente i prodotti sul mercato per soddisfare più rapidamente i clienti.
Travelpass offre ai viaggiatori esperienze più curate, risparmiando il 65% sui costi
Creato nell’ottica di scoprire un terreno comune attraverso l’esplorazione, Travelpass collega i viaggiatori con i migliori hotel ed esperienze di viaggio per soddisfare le loro esigenze. I dati sono la linfa vitale del business di Travelpass, ma i team dati di Travelpass dedicavano molto tempo a capire come sviluppare, anziché cosa sviluppare.
Passando da Databricks a Snowflake, Travelpass ora consente a più persone di lavorare con i dati per fornire maggiore efficienza, processi decisionali più informati e un’esperienza più su misura per i viaggiatori di tutto il mondo. Grazie alla facilità d’uso e all’accessibilità di Snowflake, anche i dipendenti Travelpass che non si occupano di data engineering adesso contribuiscono ai dati Snowflake in modo rapido e significativo.
I vantaggi includono:
Risparmio sui costi del 65% passando dalla piattaforma precedente, Databricks, a Snowflake
Miglioramento del 350% dell’efficienza nella distribuzione dei dati alle business unit grazie a Snowflake Dynamic Tables
Maggiore affidabilità e stabilità dell’ecosistema eliminando il debug ad alta intensità di lavoro del sistema precedente
Chicago Trading Company risparmia il 54% sui costi e soddisfa per la prima volta gli SLA giornalieri
Riconosciuta come società leader nel trading di derivati, Chicago Trading Company (CTC) fornisce liquidità ai mercati di tutto il mondo, contribuendo a promuovere mercati efficienti, stabili e sani partecipando sia dal lato dell’acquisto che da quello della vendita. La piattaforma di ricerca di CTC raccoglie informazioni da migliaia di fonti, tra cui feed da ogni borsa valori su cui fa trading, prezzi storici di trading e dati di terze parti. Ma CTC pagava 800.000 dollari all’anno solo per trasferire i dati da Snowflake a Spark per l’elaborazione e viceversa.
Per superare questi ostacoli, CTC ha trasferito la sua elaborazione da Spark gestita a Snowflake, dove aveva già creato la sua piattaforma dati. Con Snowflake e Snowpark, CTC ottiene una maggiore visibilità e controllo sui costi e riduce drasticamente gli errori nei processi di elaborazione dei dati, un miglioramento inestimabile, dato che i processi sono sempre eseguiti in una corsa contro il tempo. Grazie alla riduzione dei costi, ora CTC massimizza i dati per innovare ulteriormente e aumentare le proprie capacità di market-making.
I vantaggi includono:
Risparmio sui costi del 54%, pari a milioni di dollari all’anno, passando da Spark gestito a Snowflake
800.000 dollari risparmiati ogni anno eliminando lo spostamento dei dati in uscita da Snowflake e ritorno
Per la prima volta viene rispettato lo SLA giornaliero che prevede la disponibilità dei dati almeno un’ora prima dell’apertura del mercato: un traguardo che non era stato in grado di raggiungere prima di Snowflake
Swire risparmia milioni sui costi e velocizza di settimane la distribuzione dei modelli
Swire Coca-Cola, USA è l’imbottigliatore locale di Coca-Cola e altri marchi di bevande in 13 stati dell’Ovest degli Stati Uniti che produce bevande per 31 milioni di consumatori ogni giorno. Swire aveva Snowflake come unica fonte di riferimento e una piattaforma Spark gestita separatamente per le sue esigenze di AI/ML. Tuttavia, la gestione di un’infrastruttura complessa distoglieva i team dati dalla creazione di modelli, causando ritardi. I cluster Spark necessitavano di manutenzione manuale per evitare sprechi e la messa in funzione richiedeva 10-15 minuti, mentre la piattaforma Spark gestita all’esterno di Snowflake sollevava preoccupazioni in materia di governance dei dati, con effetti sull’integrità e la sicurezza dei dati.
Snowflake si è dimostrato la soluzione unificata ideale per le esigenze di AI/ML di Swire, offrendo una piattaforma unica che ha notevolmente ridotto la complessità, migliorato la facilità d’uso e fornito un framework robusto per migliorare la governance dei dati. Con questi miglioramenti, Swire ha ottimizzato i suoi percorsi logistici pianificati per ridurre in modo significativo i costi relativi al carburante, alle spese dei conducenti e al costo di servizio complessivo. L’impatto sul time to market è stato altrettanto notevole, con Swire in grado di sviluppare modelli su Snowflake molto più rapidamente.
I vantaggi includono:
Risparmio di milioni di dollari sui costi ottimizzando i percorsi logistici pianificati
Time to market più rapido, con settimane risparmiate, grazie alla distribuzione più rapida di modelli AI/ML critici
Riduzione del TCO grazie a una gestione dei dati semplificata e automatizzata
Altre migrazioni di successo
Queste storie sono solo l’inizio di come le organizzazioni stanno passando a Snowflake per ottenere un vantaggio competitivo.
Scarica l’ebook “Secrets of Apache Spark to Snowflake Migration Success” per scoprire i cinque motivi principali per cui le aziende stanno passando a Snowflake e in che modo queste migrazioni aiutano le aziende a tagliare i costi, ridurre la complessità e migliorare l’affidabilità delle loro operazioni quotidiane.