Snowflake에서 Python을 통한 데이터 과학 및 ML의 향상 그 이상
Snowflake는 데이터 과학자, 데이터 엔지니어 및 애플리케이션 개발자로 구성된 교차 기능 팀이 머신 러닝 모델을 실험에서 생산으로 전환하는 과정에서 더 잘 협력할 수 있도록 지원하기 위해 최선을 다하고 있습니다. 그렇게 하는 데 가장 중요한 부분은 데이터 과학에서 제일 많이 사용되는 언어를 지원하는 것입니다. 따라서 당사는 Python에 집중적으로 초점을 맞출 것입니다.
당사는 데이터 과학자들이 데이터 및 데이터 처리 능력을 거의 무제한에 가깝게 사용함으로써 워크플로우를 가속화할 수 있도록 지원하기 위해 지속적인 노력을 기울이고 있으며 최근의 움직임도 그러한 노력의 일환입니다. 개발자 플랫폼인 Snowpark의 출시에서 수십 가지의 새로운 데이터 프로그래밍 기능 공개에 이르기까지, 당사는 데이터 과학자들이 더 편하게 일할 수 있게 하는 것을 목표로 합니다. Snowpark는 개발자가 선호하는 프로그래밍 언어를 사용해 Snowflake에 직접 확장 가능한 파이프라인, 머신 러닝(ML) 모델, 애플리케이션을 구축할 수 있도록 지원합니다. 현재 제공 중인 Python용 Snowflake의 공개 미리 보기와 더불어 현재 개발 중인 Streamlit과의 새로운 네이티브 통합 덕분에 데이터 팀은 더 빠르고 더 나은 구축을 수행하고 협업의 새로운 방식을 개척할 수 있게 될 것입니다.
Snowpark에 결합된 Python
Python은 유연성과 오픈 소스 패키지의 풍부한 생태계로 인해 데이터 과학에서 가장 선호되는 언어 중 하나입니다. 현재 공개 미리 보기로 제공되는 Python용 Snowpark를 사용하면 개발자는 Snowflake로 빌드할 때 기대하는 확장성, 탄력성, 보안 및 규정 준수 이점을 활용하는 동시에 개발자에게 친숙한 구문으로 코딩할 수 있습니다.
Snowpark의 풍부한 프로그래밍 환경과 Anaconda 파트너십의 일부로, 팀은 데이터 클라우드 내의 모든 오픈 소스 패키지 및 라이브러리로 구성된 Python의 광범위한 생태계를 원활하게 활용할 수 있습니다. 그 결과 HyperFinity와 같은 팀은 데이터 처리 아키텍처를 더욱 간소화함으로써 프로젝트를 개발에서 생산으로 더 신속하게 전환할 수 있었습니다.
Snowflake에서 직접 Python 코드 빌드 및 배치
개발자는 선호하는 통합 개발 환경(IDE) 및 선택한 개발 도구를 통해 Snowpark를 항상 유연하게 사용할 수 있었습니다. 개발자는 현재 비공개 미리 보기로 제공되는 Python용 Snowflake 워크시트로 Python 및 Snowpark의 Python용 DataFrame API를 사용해 Snowsight Snowflake의 사용자 인터페이스에서 직접 데이터 파이프라인, ML 모델 및 애플리케이션을 구축하고 배치할 수 있습니다. 따라서 코드 자동 완성을 통해 개발을 간소화하고 몇 초 만에 사용자 정의 로직을 제품화할 수 있습니다.
ML 모델 학습 지원 확대
학습을 포함한 ML 워크플로우의 모든 단계에 걸쳐 Snowflake가 처리에 대한 기본 지원을 해 주는 덕분에 조직은 최고 수준의 데이터 거버넌스를 유지할 수 있습니다. 현재 개발 중인 대용량 메모리 웨어하우스를 통해 사용자는 Anaconda 통합에 포함된 인기 있는 Python 오픈 소스 라이브러리를 사용해 대규모 데이터 세트에 대한 기능 엔지니어링 및 모델 학습과 같은 메모리 집약적인 작업을 안전하게 실행할 수 있게 될 것입니다.
ML 기반 통찰력과 비즈니스 활동 간의 격차 해소
가장 큰 도전 과제 중 하나는 생성되는 멋진 모델과 통찰력이 나머지 비즈니스에서 어떻게 실제로 사용될지에 관한 것일 수 있습니다. 바로 그렇기 때문에 최근 인수한 Streamlit이 필요합니다. Streamilt는 데이터 과학자와 ML 엔지니어가 좋아하는 언어 Python을 사용해 비즈니스 상대의 마음에 꼭 들 만한 도구를 만들 수 있도록 지원합니다.
그리고 현재 진행 중인 Snowflake의 Streamlit 통합 발표로 인해 데이터 클라우드 내에서 모든 Streamlit 앱을 쉽게 구축, 배치 및 공유할 수 있게 되었습니다. 따라서 사용자는 며칠 또는 몇 주가 아닌 몇 시간 만에 대화형 애플리케이션을 구축하고 비즈니스 팀과 안전하게 공유, 반복 및 협업하여 개발 효과를 높일 수 있습니다.
SQL로 머신 러닝 채택 극대화
여러 산업 분야의 기업들이 ML을 사용함으로 이익을 얻고 있습니다. 하지만 다수는 그 가치의 겉면만 훑고 있는 것에 불과합니다. 그러한 기업들이 더 큰 가치를 창출해 내도록 돕기 위해 Snowflake는 조직 전체에서 더 많은 사용자가 ML 기반 예측의 힘을 더욱 쉽게 활용할 수 있게 지원하고 있습니다. 현재 비공개 미리 보기로 제공되는 SQL 머신 러닝은 시계열 예측을 시작으로 강력한 알고리즘을 SQL 사용자에게 제공합니다. 이는 일상적인 비즈니스 인텔리전스 및 분석에 쉽게 결합되어 의사 결정 품질과 속도를 향상할 수 있습니다.
***
종합적으로 이러한 일련의 제품 혁신은 ML 기반 통찰력을 생성하고 운영하는 새롭고 더 효율적인 방법으로 이끕니다. 데이터 과학자, 데이터 엔지니어 및 개발자는 ML 모델을 생산으로 전환하는 과정에서 협업 수준을 확장할 수 있는데, 그들은 그들이 선택한 언어로 동일한 데이터에 대해 작업할 수 있는 유연성, 다양한 처리 요구 사항에 대한 인프라 유연성, 통찰력을 활동으로 연결하는 대화형 애플리케이션 개발의 압도적 용이성을 누릴 수 있습니다.
Snowflake의 데이터 과학 발전에 대해 자세히 알아보려면 데이터 과학을 위한 Snowflake를 참조해 보세요.
Snowpark: 코드는 동일하게, 실행은 더 빠르게
미래 전망 진술
이 포스트에는 명시적 및 묵시적인 미래 전망 진술이 포함되어 있습니다. 여기에는 (i) Snowflake의 비즈니스 전략, (ii) 개발 중이거나 일반적으로 사용할 수 없는 제품을 포함한 Snowflake 제품, 서비스, 기술 제품, (iii) 시장 성장, 추세 및 경쟁 고려 사항, (iv) 타사 플랫폼과 Snowflake 제품의 통합 및 상호 운용성, 타사 플랫폼에서의 Snowflake 제품 가용성과 관련된 진술이 포함됩니다. 이 미래 전망 진술은 ‘위험 요인’이라는 제목 아래 기술된 내용, Snowflake가 증권 거래 위원회에 제출하는 양식 10-Q의 분기별 보고서와 양식 10-K의 연간 보고서에 기술된 내용을 포함하여 수많은 위험, 불확실성 및 가정의 영향을 받습니다. 이러한 위험, 불확실성 및 가정에 비추어, 실제 결과는 미래 전망 진술에서 예상했거나 암시한 내용과 달라 실질적이고 불리한 영향을 미칠 수 있습니다. 그러므로, 미래 사건에 대한 예측으로서 작성된 미래 예측 진술에 의존해서는 안 됩니다.
© 2022 Snowflake Inc. All rights reserved. 여기에 언급된 Snowflake, Snowflake 로고 및 기타 모든 Snowflake 제품, 기능 및 서비스 이름은 미국 및 기타 국가에서 Snowflake Inc.의 등록 상표 또는 상표입니다. 여기에 언급되거나 사용된 기타 모든 브랜드 이름 또는 로고는 식별 목적으로만 사용되며 해당 소유자의 상표일 수 있습니다. Snowflake는 그러한 소유자와 연관되거나 그러한 소유자로부터 후원 또는 보증을 받지 않습니다.