注:本記事は(2022年6月14日)に公開された(Enhancing Data Science and ML in Snowflake with Python, and More)を翻訳して公開したものです。

Snowflakeは、データサイエンティスト、データエンジニア、アプリケーション開発者の機能横断型チームが協力して、機械学習モデルを実験から本番環境に移行する方法の改善に取り組んでいます。その大部分はデータサイエンスで最も人気のある言語をサポートすること、つまり、すべてPythonで行います。

これは、ほぼ無制限のデータへのアクセスとデータ処理能力で、データサイエンティストがワークフローを加速できるようにするための継続的な取り組みの最新の取り組みです。Snowflake開発者プラットフォームであるSnowparkの公開から、数十の新しいデータプログラマビリティ機能のロールアウトまで、データサイエンティストの苦労を和らげることを目標としてきました。Snowparkでは、開発者がスケーラブルなパイプライン、機械学習(ML)モデル、アプリケーションを、好みのプログラミング言語を使用してSnowflakeで直接構築できるようになりました。パブリックプレビューになったSnowflake for Pythonでは、開発中のStreamlitとの新しいネイティブ統合により、データチームはより迅速に、より良い製品を構築でき、新しい方法でのコラボレーションが可能になります。

SnowparkでPythonが使用可能に

Pythonは、その柔軟性とオープンソースパッケージの豊富なエコシステムにより、データサイエンスで最も人気のある言語の1つです。現在パブリックプレビュー中のSnowpark for Pythonを使用すると、ユーザーは、Snowflakeでの構築時に経験できるスケーラビリティ、弾力性、セキュリティ、コンプライアンスのメリットを活用しながら、使い慣れた構文でコーディングできます。

Snowparkの豊富なプログラミング環境とAnacondaとのパートナーシップの一環として、Pythonのオープンソースパッケージとライブラリの幅広いエコシステムのすべてをデータクラウド内でシームレスに利用できます。その結果、HyperFinity’sのようなチームでは、データ処理アーキテクチャをさらに合理化して、プロジェクトを開発から本番に迅速に移行できました。

Snowflakeで直接Pythonコードを構築、デプロイ

これまで、開発者は統合開発環境(IDE)と好みの開発ツールからSnowparkを使用することは可能でした。これからは、現在プライベートプレビュー中のSnowflake Worksheets for Pythonを使用し、データパイプライン、MLモデル、アプリケーションを直接Snowsight Snowflakeのユーザーインターフェースから、PythonとSnowparkのDataFrame API for Pythonを使用して構築、デプロイすることもできるようになります。つまり、コードのオートコンプリート、カスタムロジックを数秒で製品化する機能によって開発を効率化できるということです。

MLモデルトレーニングのサポートの拡大

トレーニングを含むMLワークフローのすべてのステップにわたる処理に対するSnowflakeのネイティブサポートは、組織が最高レベルのデータガバナンスを維持するのに役立ちます。現在開発中のLarger Memory Warehouseでは、Anaconda統合経由で利用できる人気のPythonオープンソースライブラリを使用して、大規模なデータセットでの特徴量エンジニアリングやモデルトレーニングなどのメモリを大量に消費するオペレーションを安全に実行できます。

AIを駆使したインサイトとビジネスアクションの間のギャップを埋める

最大の課題の1つは、素晴らしいモデルとインサイトを作成したら、実際に他のビジネスでどのように使用するかということです。そこで、最近買収したStreamlitの登場です。Streamlitでは、データサイエンティストとMLエンジニアが好みの言語であるPythonを使用して、対応するビジネス向けの快適なツールを構築できるようにします。

また、現在開発中のSnowflakeのStreamlit統合が発表されたことで、Streamlitアプリの構築、デプロイ、共有をすべてデータクラウド内で簡単に行えるようになります。したがって、ユーザーが数日や数週間かけることなく数時間でインタラクティブなアプリケーションを構築し、ビジネスチームと安全に共有、反復、コラボレーションして、開発の影響力を高めることができます。

SQLで機械学習の導入を最大化

複数の業界にわたる企業は、MLを使用することで恩恵を受けています。しかし、その多くは本来のメリットの一部しか味わっていません。これらの企業がさらに多くの価値を引き出せるようにするため、Snowflakeは組織全体のより多くのユーザーがMLを駆使した予測を活用できるようにしました。現在プライベートプレビュー中のSQL機械学習では、時系列予測などの強力なアルゴリズムをSQLユーザーに提供します。これらは日常のビジネスインテリジェンスと分析に簡単に組み込むことができ、意思決定の質とスピードを向上させることができます。

***

全体として、この一連の製品イノベーションによって、MLを駆使したインサイトを生成および運用するための新しいより効率的な方法が生まれます。データサイエンティスト、データエンジニア、開発者は、MLモデルを本番環境に移行する際のコラボレーションのレベルを向上でき、好みの言語を使用して同じデータを処理できる柔軟性、さまざまな処理ニーズに対応するインフラストラクチャの柔軟性、類を見ないほど簡単にインタラクティブなアプリケーションを開発できる性能を活用して、インサイトをアクションに変えていくことができます。

データサイエンスにけるSnowflakeの進化を見るには、データサイエンスのためのSnowflakeをご覧ください。

Snowpark:コードはそのまま、実行を高速化

見通しに関する記述

見通しに関する記述も、将来本記事には、明示または黙示を問わず、(i)Snowflakeの事業戦略、(ii)開発中や一般公開されていないものも含めたSnowflakeが提供する製品、サービス、テクノロジー、(iii)市場の成長、トレンド、競争に関する考慮事項、(iv)サードパーティプラットフォームと連携したまた同プラットフォーム上でのSnowflake製品の統合、相互運用性、および可用性、についての言及など、将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出するForm 10-Q(四半期レポート)およびForm 10-K(年次報告書)内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用するべきではありません。

© 2022 Snowflake Inc.  All rights reserved.  Snowflake、Snowflakeのロゴ、およびその他ここに記載されるすべてのSnowflake製品、機能、サービス名は、米国およびその他の国々におけるSnowflake Inc.の登録商標または商標です。本書で言及または使用されているその他のブランド名やロゴはすべて識別のみを目的としており、それぞれの保有者の商標である可能性があります。Snowflakeとかかる保有者との間に、提携、スポンサー、または推奨関係があるとは限りません。