제품 및 기술

Snowflake에서 Python을 통한 데이터 과학 및 ML의 향상 그 이상

Snowflake에서 Python을 통한 데이터 과학 및 ML의 향상 그 이상

Snowflake는 데이터 과학자, 데이터 엔지니어 및 애플리케이션 개발자로 구성된 교차 기능 팀이 머신 러닝 모델을 실험에서 생산으로 전환하는 과정에서 더 잘 협력할 수 있도록 지원하기 위해 최선을 다하고 있습니다. 그렇게 하는 데 가장 중요한 부분은 데이터 과학에서 제일 많이 사용되는 언어를 지원하는 것입니다. 따라서 당사는 Python에 집중적으로 초점을 맞출 것입니다. 

당사는 데이터 과학자들이 데이터 및 데이터 처리 능력을 거의 무제한에 가깝게 사용함으로써 워크플로우를 가속화할 수 있도록 지원하기 위해 지속적인 노력을 기울이고 있으며 최근의 움직임도 그러한 노력의 일환입니다. 개발자 플랫폼인 Snowpark의 출시에서 수십 가지의 새로운 데이터 프로그래밍 기능 공개에 이르기까지, 당사는 데이터 과학자들이 더 편하게 일할 수 있게 하는 것을 목표로 합니다. Snowpark는 개발자가 선호하는 프로그래밍 언어를 사용해 Snowflake에 직접 확장 가능한 파이프라인, 머신 러닝(ML) 모델, 애플리케이션을 구축할 수 있도록 지원합니다. 현재 제공 중인 Python용 Snowflake의 공개 미리 보기와 더불어 현재 개발 중인 Streamlit과의 새로운 네이티브 통합 덕분에 데이터 팀은 더 빠르고 더 나은 구축을 수행하고 협업의 새로운 방식을 개척할 수 있게 될 것입니다.

Snowpark에 결합된 Python

Python은 유연성과 오픈 소스 패키지의 풍부한 생태계로 인해 데이터 과학에서 가장 선호되는 언어 중 하나입니다. 현재 공개 미리 보기로 제공되는 Python용 Snowpark를 사용하면 개발자는 Snowflake로 빌드할 때 기대하는 확장성, 탄력성, 보안 및 규정 준수 이점을 활용하는 동시에 개발자에게 친숙한 구문으로 코딩할 수 있습니다. 

Snowpark의 풍부한 프로그래밍 환경과 Anaconda 파트너십의 일부로, 팀은 데이터 클라우드 내의 모든 오픈 소스 패키지 및 라이브러리로 구성된 Python의 광범위한 생태계를 원활하게 활용할 수 있습니다. 그 결과 HyperFinity와 같은 팀은 데이터 처리 아키텍처를 더욱 간소화함으로써 프로젝트를 개발에서 생산으로 더 신속하게 전환할 수 있었습니다.

Snowflake에서 직접 Python 코드 빌드 및 배치

개발자는 선호하는 통합 개발 환경(IDE) 및 선택한 개발 도구를 통해 Snowpark를 항상 유연하게 사용할 수 있었습니다. 개발자는 현재 비공개 미리 보기로 제공되는 Python용 Snowflake 워크시트로 Python 및 Snowpark의 Python용 DataFrame API를 사용해 Snowsight Snowflake의 사용자 인터페이스에서 직접 데이터 파이프라인, ML 모델 및 애플리케이션을 구축하고 배치할 수 있습니다. 따라서 코드 자동 완성을 통해 개발을 간소화하고 몇 초 만에 사용자 정의 로직을 제품화할 수 있습니다.  

ML 모델 학습 지원 확대

학습을 포함한 ML 워크플로우의 모든 단계에 걸쳐 Snowflake가 처리에 대한 기본 지원을 해 주는 덕분에 조직은 최고 수준의 데이터 거버넌스를 유지할 수 있습니다. 현재 개발 중인 대용량 메모리 웨어하우스를 통해 사용자는 Anaconda 통합에 포함된 인기 있는 Python 오픈 소스 라이브러리를 사용해 대규모 데이터 세트에 대한 기능 엔지니어링 및 모델 학습과 같은 메모리 집약적인 작업을 안전하게 실행할 수 있게 될 것입니다. 

ML 기반 통찰력과 비즈니스 활동 간의 격차 해소

가장 큰 도전 과제 중 하나는 생성되는 멋진 모델과 통찰력이 나머지 비즈니스에서 어떻게 실제로 사용될지에 관한 것일 수 있습니다. 바로 그렇기 때문에 최근 인수한 Streamlit이 필요합니다. Streamilt는 데이터 과학자와 ML 엔지니어가 좋아하는 언어 Python을 사용해 비즈니스 상대의 마음에 꼭 들 만한 도구를 만들 수 있도록 지원합니다.

그리고 현재 진행 중인 Snowflake의 Streamlit 통합 발표로 인해 데이터 클라우드 내에서 모든 Streamlit 앱을 쉽게 구축, 배치 및 공유할 수 있게 되었습니다. 따라서 사용자는 며칠 또는 몇 주가 아닌 몇 시간 만에 대화형 애플리케이션을 구축하고 비즈니스 팀과 안전하게 공유, 반복 및 협업하여 개발 효과를 높일 수 있습니다.

SQL로 머신 러닝 채택 극대화

여러 산업 분야의 기업들이 ML을 사용함으로 이익을 얻고 있습니다. 하지만 다수는 그 가치의 겉면만 훑고 있는 것에 불과합니다. 그러한 기업들이 더 큰 가치를 창출해 내도록 돕기 위해 Snowflake는 조직 전체에서 더 많은 사용자가 ML 기반 예측의 힘을 더욱 쉽게 활용할 수 있게 지원하고 있습니다. 현재 비공개 미리 보기로 제공되는 SQL 머신 러닝은 시계열 예측을 시작으로 강력한 알고리즘을 SQL 사용자에게 제공합니다. 이는 일상적인 비즈니스 인텔리전스 및 분석에 쉽게 결합되어 의사 결정 품질과 속도를 향상할 수 있습니다.  

***

종합적으로 이러한 일련의 제품 혁신은 ML 기반 통찰력을 생성하고 운영하는 새롭고 더 효율적인 방법으로 이끕니다. 데이터 과학자, 데이터 엔지니어 및 개발자는 ML 모델을 생산으로 전환하는 과정에서 협업 수준을 확장할 수 있는데, 그들은 그들이 선택한 언어로 동일한 데이터에 대해 작업할 수 있는 유연성, 다양한 처리 요구 사항에 대한 인프라 유연성, 통찰력을 활동으로 연결하는 대화형 애플리케이션 개발의 압도적 용이성을 누릴 수 있습니다.

Snowflake의 데이터 과학 발전에 대해 자세히 알아보려면 데이터 과학을 위한 Snowflake를 참조해 보세요. 

Snowpark: 코드는 동일하게, 실행은 더 빠르게

시작하기

미래 전망 진술

이 포스트에는 명시적 및 묵시적인 미래 전망 진술이 포함되어 있습니다. 여기에는 (i) Snowflake의 비즈니스 전략, (ii) 개발 중이거나 일반적으로 사용할 수 없는 제품을 포함한 Snowflake 제품, 서비스, 기술 제품, (iii) 시장 성장, 추세 및 경쟁 고려 사항, (iv) 타사 플랫폼과 Snowflake 제품의 통합 및 상호 운용성, 타사 플랫폼에서의 Snowflake 제품 가용성과 관련된 진술이 포함됩니다. 이 미래 전망 진술은 ‘위험 요인’이라는 제목 아래 기술된 내용, Snowflake가 증권 거래 위원회에 제출하는 양식 10-Q의 분기별 보고서와 양식 10-K의 연간 보고서에 기술된 내용을 포함하여 수많은 위험, 불확실성 및 가정의 영향을 받습니다. 이러한 위험, 불확실성 및 가정에 비추어, 실제 결과는 미래 전망 진술에서 예상했거나 암시한 내용과 달라 실질적이고 불리한 영향을 미칠 수 있습니다. 그러므로, 미래 사건에 대한 예측으로서 작성된 미래 예측 진술에 의존해서는 안 됩니다. 

© 2022 Snowflake Inc. All rights reserved. 여기에 언급된 Snowflake, Snowflake 로고 및 기타 모든 Snowflake 제품, 기능 및 서비스 이름은 미국 및 기타 국가에서 Snowflake Inc.의 등록 상표 또는 상표입니다. 여기에 언급되거나 사용된 기타 모든 브랜드 이름 또는 로고는 식별 목적으로만 사용되며 해당 소유자의 상표일 수 있습니다. Snowflake는 그러한 소유자와 연관되거나 그러한 소유자로부터 후원 또는 보증을 받지 않습니다.

Authors
Share Article

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

30일 무료 평가판시작하기

Snowflake를 30일 동안 무료로 사용해 보세요. 다른 솔루션에 내재된 복잡성, 비용 부담, 제약 조건 

등을 해소하는 데 도움이 되는 데이터 클라우드를 경험하실 수 있습니다.