Simplificación del análisis de datos multimodal con Snowflake Cortex AI

Ahora Snowflake Cortex AI cuenta con capacidades nativas de IA multimodal, lo que elimina los silos de datos y la necesidad de herramientas independientes y costosas. Presentamos Cortex AI COMPLETE Multimodal en vista previa pública. Esta importante mejora aporta la capacidad de analizar imágenes y otros datos no estructurados directamente en el motor de consultas de Snowflake mediante el uso del familiar SQL a escala. Unifica tus datos estructurados y no estructurados de forma más eficiente y con menos complejidad. Es importante destacar que funciona sin problemas con los datos de Snowflake, Iceberg Tables y el almacenamiento de objetos, como Amazon S3, todo ello sin mover los datos. Aprovecha la seguridad y gobernanza integradas de Snowflake para generar información más detallada y fiable sobre todo tipo de datos empresariales.
Cerrar la brecha de datos
En el panorama actual basado en datos, las organizaciones pueden obtener una ventaja competitiva significativa cuando combinan fácilmente información de fuentes no estructuradas como texto, imagen, audio y vídeo con datos estructurados. Con Cortex AI COMPLETE Multimodal, estas tareas complejas se vuelven simples con solo unas pocas líneas de SQL, lo que reduce el coste del análisis de datos. Por ejemplo, los equipos pueden mejorar los modelos predictivos mediante la inclusión de texto e imágenes, correlacionar las imágenes médicas con los resultados del tratamiento o identificar defectos de fabricación a partir de fotos de la línea de producción.
Procesar todos los datos donde se encuentren
Los entornos de datos fragmentados y las complejas arquitecturas de nube impiden la eficiencia y la innovación. Para solucionar este problema, Cortex AI COMPLETE Multimodal, ahora disponible en vista previa pública, ofrece a las empresas una solución para procesar directamente los archivos de imagen en una única plataforma unificada segura, lo que facilita la gestión y la escalabilidad. La plataforma gestionada de Cortex AI agrupa automáticamente por lotes y proporciona un alto rendimiento para los datos no estructurados almacenados en un proveedor de objetos de nube externo, como un contenedor de Amazon S3 o en Snowflake, lo que elimina la necesidad de invertir ciclos en crear soluciones que orquesten los trabajos entre diferentes servicios de nube. Esto acelera la obtención de información visual de los datos y su integración con los datos estructurados, lo que mejora la velocidad y agilidad del trabajador de datos técnicos. Esta arquitectura optimizada resultante reduce la complejidad, el tiempo de obtención de información y el coste total de la propiedad.

Análisis multimodal: la imagen completa
Los científicos de datos suelen utilizar modelos predictivos basados en datos estructurados. Sin embargo, depender solo de datos estructurados para estos modelos puede pasar por alto señales valiosas presentes en fuentes no estructuradas, como imágenes, que influyen en la interacción de los usuarios. En lugar de mantener sistemas independientes para el procesamiento de datos estructurados e imágenes, los analistas y científicos de datos ahora pueden trabajar en el entorno de Snowflake que ya conocen, utilizando SQL sencillo para explorar las correlaciones entre las métricas tradicionales y la inteligencia visual.
A continuación, explicamos cómo los analistas pueden utilizar SQL para analizar los elementos visuales de los anuncios publicitarios y descubrir patrones ocultos en el rendimiento de las campañas. Al extraer funciones visuales, tus equipos técnicos pueden descubrir relaciones con la interacción en redes sociales y las tasas de conversión de los usuarios.
SELECT
c.ad_id,
c.conversion_rate,
snowflake.cortex.complete('claude-3-5-sonnet','Classify the prominent color visible in this image. Respond with the name of the color and nothing else', adimages) as prominent_color ,
snowflake.cortex.complete('claude-3-5-sonnet','Are there human faces identified in the Image? Respond only with TRUE or FALSE and nothing else', adimages) as human_face_flag
FROM campaign_table c join image_table i on c.ad_id i.ad_id
Es aquí donde el análisis multimodal aprovecha su verdadero potencial al combinar los datos estructurados tradicionales con esta información visual enriquecida, creando así un entendimiento empresarial más completo. Otros ejemplos incluyen minoristas que integran metadatos de fotos de productos con historiales de transacciones para obtener información más detallada sobre cómo influyen las imágenes en las decisiones de compra. Independientemente de si se trata del sector del retail, la fabricación, la sanidad o las finanzas, puede aprovechar estas capacidades para obtener información más detallada y crear experiencias de cliente más significativas que impulsen el crecimiento empresarial.
Transformar sectores con análisis multimodales basados en IA
La gran cantidad de activos de datos no estructurados dentro de su organización tiene un valor empresarial sin explotar. Cortex AI Functions impulsa este valor a través de un SQL sencillo que combina análisis de datos estructurados y no estructurados.
Para optimizar las campañas de marketing: los equipos de marketing utilizan Cortex AI para transformar el rendimiento de sus campañas conectando los elementos visuales de los activos promocionales directamente a las métricas de conversión. Por ejemplo, una empresa de retail que usa Snowflake puede analizar miles de imágenes de anuncios y descubrir que las imágenes de productos con ciertos esquemas de color tienden a generar una mayor interacción entre segmentos demográficos específicos.
Para optimizar procesos manuales: los minoristas en línea y las plataformas de entrega de alimentos utilizan Cortex AI para automatizar las descripciones de imágenes de comidas y alimentos, lo que reduce el trabajo manual. En el sector de la fabricación, las instalaciones pueden evitar defectos costosos vinculando los datos de inspección visual con las especificaciones de producción. Las organizaciones sanitarias pueden mejorar los resultados de los pacientes al correlacionar los metadatos de las imágenes médicas con los protocolos de tratamiento y los datos demográficos.
Para mejorar el servicio al cliente: los departamentos de atención al cliente utilizan modelos de voz a texto para transcribir llamadas y obtener un nivel de información más profundo. Por ejemplo, las capacidades de Cortex se pueden utilizar para extraer no solo los detalles del cliente y las interacciones de los agentes, sino también para resumir los siguientes pasos, la intención y el sentimiento, ofreciendo así una imagen más completa de la experiencia del cliente.
Para analizar documentos complejos: Cortex AI permite a las empresas financieras analizar informes trimestrales, prospectos y estados financieros mediante la extracción de datos estructurados de textos, tablas y descripciones de gráficos. Por ejemplo, un banco global puede acelerar el proceso de solicitud de préstamos mediante la extracción y validación de información clave de declaraciones de impuestos, extractos bancarios y documentos de verificación del empleo, todo ello en un entorno seguro y de confianza.

Resultados de alta calidad
La calidad es primordial cuando las decisiones empresariales dependen de las analíticas. Cortex AI ofrece una calidad excepcional en una amplia gama de tareas de procesamiento de datos no estructurados mediante modelos y funciones especializadas adaptadas a diferentes tareas.
Modelos de visión líderes del sector: Cortex AI proporciona acceso instantáneo y seguro a modelos de visión líderes del sector, lo que permite seleccionar el modelo que mejor se adapte a tus requisitos empresariales específicos. Con la función Cortex AI COMPLETE, puedes elegir entre opciones como Anthropic Claude 3.5 Sonnet, Mistral AI Pixtral Large y el próximo Anthropic Claude 3.7 Sonnet, así como Llama 4 Scout de Meta y Open AI GPT-4.1 para realizar análisis visuales exhaustivos.

Claude 3.5 Sonnet sobresale en la comprensión de documentos con un impresionante 90,3 % en la referencia DocVQA, por lo que es una opción óptima para extraer información de estados financieros, contratos legales y documentación sobre cumplimiento normativo. Pixtral Large destaca con un excepcional análisis de gráficos (88,1 % ChartQA) y razonamiento matemático (69,4 % Mathvista), perfecto para informes financieros y mediciones de especificaciones de fabricación. GPT-4.1 (disponible próximamente) ofrece indicadores de comprensión de imágenes líderes del sector, como MMMU (74,8 %), para diversas necesidades de imágenes empresariales, como la respuesta visual a preguntas a partir de diagramas y mapas. Todos estos modelos funcionan directamente en el entorno de Snowflake y no se requieren integraciones externas complejas.
Transcripción de audio flexible: independientemente de las capacidades multimodales nativas de Cortex AI, los clientes pueden llevar cualquier modalidad, incluido el procesamiento de audio, a Snowflake mediante Snowpark Container Services. Snowpark Container Services ofrece una infraestructura gestionada para aplicaciones contenedorizadas que permite a los desarrolladores implementar modelos de transcripción de audio a escala.
Con Snowpark Container Services tienes la flexibilidad de implementar y optimizar modelos como OpenAI Whisper, Nvidia Canary o Nvidia Parakeet en Snowflake en función de tus necesidades específicas. Los clientes suelen seleccionar su modelo preferido en función de la tasa de errores de palabras (Word Error Rate, WER), pero también de las funciones individuales del modelo como la asistencia multilingüe, el rendimiento en entornos difíciles, como los centros de llamadas, o la eficiencia de recursos. El entorno seguro y eficiente de Snowflake permite ejecutar el modelo de tu elección, lo que ofrece una gran combinación de flexibilidad, potencia y confianza.
Análisis de sentimientos de entidades vanguardistas: más allá del procesamiento de audio, Cortex AI ofrece sofisticadas capacidades de analíticas de texto para obtener información de diversas fuentes de texto. Tanto si analizamos conversaciones de clientes transcritas, publicaciones en redes sociales, reseñas de productos u otros datos de texto, nuestro vanguardista análisis de sentimientos de entidades ofrece una comprensión matizada de las opiniones expresadas.
El análisis de sentimientos basado en aspectos de Snowflake establece un nuevo estándar de calidad en el sector, ya que proporciona una clasificación de sentimientos superior en comparación con los principales large language models (LLM) según la referencia que se muestra a continuación. En concreto, Cortex AI Entity_Sentiment permite extraer información matizada del texto mediante el análisis de sentimientos hacia entidades específicas, en lugar de depender solo de la clasificación general positiva o negativa. Cortex AI Entity Sentiment es hasta un 45 % más rentable que pedir a un modelo grande como GPT-4o una precisión de sentimiento sustancialmente mayor. Entity_Sentiment gestiona con eficacia expresiones de sentimiento complejas, incluidos los sentimientos mixtos y desconocidos, lo que facilita el análisis de la emoción relativa en las revisiones de productos o las transcripciones de llamadas.

Procesamiento avanzado de documentos con OCR: además de analizar el texto de fuentes digitales, las organizaciones también deben extraer información valiosa de documentos en varios formatos. Las capacidades de procesamiento de documentos de Cortex AI convierten documentos no estructurados en datos que se pueden buscar y analizar. La extracción de texto fiable es la base para el procesamiento preciso de documentos y es fundamental para la precisión de los sistemas de búsqueda y las analíticas multimodales.
Las capacidades de OCR de PARSE_DOCUMENT de Cortex AI superan a las de otras soluciones comerciales y de código abierto populares para documentos empresariales, sin introducir una complejidad innecesaria. Los clientes pueden integrar fácilmente en las aplicaciones los resultados de OCR, como la respuesta a preguntas basadas en LLM en documentos financieros. La solución de Snowflake ofrece resultados significativamente mejores, consiguiendo una métrica ANLS de 0,974 frente a los 0,969 de las soluciones de la competencia.

Mejor traducción automática: para todo el texto digital y el texto extraído de documentos, las organizaciones a menudo necesitan hacer que la información sea accesible en todos los idiomas. Cortex AI Translate ofrece traducciones uniformes y de alta calidad en 14 idiomas. A diferencia de los LLM de uso general, que pueden introducir comentarios o rechazar solicitudes de traducción, Cortex AI Translate está optimizado específicamente para las tareas de traducción mediante un riguroso proceso de preparación de datos y el entrenamiento personalizado de modelos. El rendimiento se alinea con los sistemas comerciales populares y los LLM de última generación como GPT-4o en los indicadores de referencia del sector. Al mismo tiempo, Cortex AI Translate es hasta un 51 % más rentable que un modelo de gran tamaño como GPT-4o, o hasta un 70 % más rentable que un sistema comercial popular. Además, Cortex AI Translate gestiona eficazmente el texto “ruidoso” (con errores), la mezcla de código y el contexto ampliado con coherencia.

El futuro del análisis de datos unificado
Snowflake Cortex AI mejora la forma en que las empresas extraen valor de todos los datos. Integra análisis estructurados y no estructurados de forma nativa a través de Cortex AI COMPLETE Multimodal, todo ello en Snowflake mediante SQL. Esto reduce la complejidad y el tiempo de obtención de información. Gracias a la IA nativa y la gobernanza de confianza, las empresas obtienen un conocimiento más amplio y completo de todos sus datos. Este enfoque unificado da como resultado decisiones más rápidas e impactantes. El equipo de Snowflake AI Research simplifica el valor de la IA para las empresas con innovaciones como Cortex AI COMPLETE Multimodal y potentes funciones de tareas específicas optimizadas para ofrecer una calidad líder del sector.
Explora Snowflake Cortex AI COMPLETE Multimodal hoy mismo.
Primeros pasos:
Declaraciones prospectivas
Este artículo contiene declaraciones prospectivas, también sobre nuestras futuras ofertas de productos, que no implican que nos comprometamos a proporcionar ninguna oferta de producto. Los resultados y las ofertas reales pueden diferir y están sujetos a riesgos e incertidumbres conocidos y desconocidos. Consulta nuestro formulario 10-Q más reciente para obtener más información.