Che cos’è una data clean room e a chi serve?
In questo periodo nel settore si sente molto parlare delle data clean room, ma non tutti sanno cosa sono e come si differenziano dai metodi di condivisione dei dati. In questo post intendo fare un po’ di chiarezza sull’argomento.
Che cos’è la condivisione dei dati?
I metodi tradizionali di condivisione dei dati includono la copia di file in bucket cloud/FTP, l’impiego di pipeline ETL o la gestione e l’utilizzo di API. Il problema di questi metodi tradizionali è che possono impedire una collaborazione efficace, creando insight incompleti, dati imprecisi e problemi di sicurezza. Quando si spostano i dati, la loro sicurezza dipende interamente dalla sede in cui vengono spostati, un elemento quasi impossibile da governare efficacemente; inoltre, tra i numerosi altri problemi, mantenere pipeline personalizzate può essere molto costoso.
Secure Data Sharing, al contrario, è una funzionalità della piattaforma Snowflake che consente alle organizzazioni di fornire l’accesso ai propri dati in modo sicuro, un notevole balzo in avanti dai tempi in cui si dovevano copiare file di grandi dimensioni tramite FTP o creare e gestire fragili pipeline ETL. Invece di copiare file da un sistema all’altro, ad esempio, un utente Snowflake può semplicemente definire quali tabelle di un database saranno accessibili a un altro cliente Snowflake.
Quando utilizzare Secure Data Sharing?
Secure Data Sharing è ideale quando si vuole fornire l’accesso senza intermediazioni a un set di dati, ad esempio quando si condividono dati tra business unit o con agenzie o partner di fiducia per consentire analisi sui dati che produrranno processi decisionali e risultati migliori. Inoltre viene utilizzato dalle aziende o dai provider che monetizzano o vendono i dati, perché fornisce accesso sicuro e revocabile ai loro clienti.
Snowflake Secure Data Sharing
La piattaforma Snowflake consente la collaborazione trasparente sui dati e al tempo stesso aiuta a ridurre i costi e rivelare nuovi insight aziendali. Con Snowflake Secure Data Sharing, le organizzazioni possono condividere i dati in modo sicuro in tutto il proprio ecosistema aziendale per:
- Accedere rapidamente a dati aggiornati provenienti da tutta l’organizzazione
- Controllare l’accesso governato ai dati condivisi
- Pubblicare facilmente set di dati per potenziarne la discoverability ma impostando al contempo controlli degli accessi
La cloud data platform di Snowflake
Con Snowflake, le organizzazioni possono essere data consumer, provider di dati o entrambe le cose. Snowflake Data Cloud è anche uno strumento potente per le applicazioni, consentendo ai clienti di scoprire, creare e distribuire app che vengono eseguite in modo nativo all’interno del loro account Snowflake.
Le aziende che si avvalgono della piattaforma Snowflake per facilitare la collaborazione tutelando la privacy possono godere di un’ampia gamma di vantaggi, tra cui:
- Condividere i dati tra ecosistemi aziendali senza copiarli o spostarli
- Analizzare i dati senza esporli
- Scoprire e monetizzare i dati nel Data Cloud
- Condividere dati in modo sicuro con aziende che non utilizzano Snowflake
Oggi i dati richiedono un approccio diverso
Le aziende, tuttavia, generano anche grandi quantità di dati sensibili e/o regolamentati, come elenchi di clienti e informazioni di identificazione personale, che non possono assolutamente essere condivisi con altre parti. Di conseguenza, questi dati non vengono condivisi o utilizzati per collaborare all’esterno dell’organizzazione che li ha prodotti, oppure vengono aggregati prima di condividerli, limitando i tipi di analisi che è possibile eseguire. Se un’azienda desidera ricavare insight o eseguire query su dati sensibili e/o regolamentati senza esporre i dati sottostanti, dovrebbe valutare l’utilizzo di una data clean room.
Che cos’è una data clean room?
“Le attuali dinamiche aziendali hanno accelerato la domanda di condivisione e collaborazione”, scrive Jennifer Bellisent, Snowflake Principal Data Strategist. “Allo stesso tempo, nuovi casi d’uso e metodi analitici ad alta intensità di dati hanno causato un’esplosione della domanda di dati. Ma sono aumentate anche le preoccupazioni relative alla tutela della privacy dei dati. Queste dinamiche hanno prodotto una tempesta perfetta: la necessità di collaborare sui dati in modo sicuro attraverso le data clean room.”
Una data clean room non è necessariamente una vera “stanza”. Mentre alcune clean room tradizionali richiedono un’infrastruttura fisica, le data clean room moderne non sono spazi fisici, ma piuttosto un framework che non richiede lo spostamento dei dati in un sistema o in un ambiente diverso.
La differenza tra una data clean room e la condivisione dei dati è che la prima consente al provider di definire regole sui tipi di query che possono essere eseguite sui dati, impedendo tuttavia all’azienda che le esegue di accedere ai dati sottostanti.
Sia Secure Data Sharing che le data clean room consentono a due o più parti di collaborare sui dati in modo sicuro. Ma proprio come Secure Data Sharing ha rappresentato un notevole miglioramento rispetto ai metodi legacy di condivisione dei dati, l’avvento delle data clean room è il prossimo passo importante per rendere più sicura la collaborazione sui dati per le organizzazioni.
Hai bisogno di una data clean room?
Come già detto, Secure Data Sharing è un’ottima scelta quando si condividono i dati tra business unit o con terze parti di fiducia. In scenari diversi, tuttavia, un’azienda potrebbe decidere che è venuto il momento di configurare un ambiente di data clean room.
Con l’introduzione di varie normative, tra cui il CCPA (California Consumer Privacy Act) e il Regolamento generale europeo sulla protezione dei dati (GDPR), i dati dei consumatori devono ora essere gestiti rispettando rigorosi livelli di privacy. La collaborazione con altre aziende utilizzando una data clean room è una possibile soluzione quando i dati di ogni partecipante sono sensibili e/o regolamentati.
Per chi opera nel settore dei media e della pubblicità, ad esempio, una data clean room può consentire alle aziende di ricavare insight personalizzati sui segmenti per l’attribuzione della pubblicità e delle campagne senza compromettere la privacy. Una multinazionale del settore dei media utilizza un ambiente di data clean room cross‑cloud basato su Snowflake per fornire i propri dati di prima parte sull’audience ai partner pubblicitari, che possono partecipare in modo sicuro con i rispettivi data set, il tutto senza spostare, copiare o esporre le informazioni di identificazione personale sottostanti.
In realtà, una data clean room è un’opzione da valutare in ogni settore che gestisce dati sensibili e/o regolamentati, soprattutto quando il valore (o il rischio) della collaborazione su tali dati è elevato.
Snowflake Global Data Clean Room
Snowflake Global Data Clean Room è un framework per la collaborazione sicura tra più partecipanti. Consente a due o più clienti Snowflake di analizzare i dati senza rivelare i dati grezzi alla controparte. È una soluzione che sfrutta funzionalità fondamentali di collaborazione e data governance di Snowflake, quali ad esempio:
- Row Access Policies e ruoli di database che consentono ai partecipanti di trovare corrispondenze tra i dati dei clienti senza esporre le rispettive informazioni di identificazione personale
- Stored Procedure per generare e convalidare le richieste di query
- Secure Data Sharing per condividere in modo sicuro e automatico le tabelle tra più account Snowflake senza bisogno di spostare i dati fuori da Snowflake
I vantaggi principali di Snowflake Global Data Clean Room includono:
- Consentire a due o più partecipanti di analizzare dati tra cloud e regioni diverse senza esporli alla controparte.
- Proteggere dal rischio di reverse engineering o reidentificazione di dati altamente sensibili limitando i tipi di query che possono essere eseguiti sui dati.
- Verificare l’accesso a Global Data Clean Room con la registrazione di eventi personalizzati.
Qual è l’approccio migliore per la mia azienda?
Ogni tipo di collaborazione sui dati aziendali dovrebbe essere sicuro, quindi i metodi legacy basati sulla copia dei dati stanno diventando obsoleti. Ciò detto, quando collabori con partner di fiducia e tale collaborazione non viola le norme sulla privacy, utilizzare Snowflake Secure Data Sharing è un approccio perfettamente adeguato: veloce, facile e sicuro. Tuttavia, quando inizi a collaborare su dati sensibili e/o regolamentati e il rischio della collaborazione con tali dati è elevato, è il momento di prendere in considerazione l’uso di una data clean room.
Per saperne di più, segui il nostro webinar on demand “What Is a Global Data Clean Room and When Do You Need One?”