※本報道資料は米国スノーフレイク社が4月24日に発表した内容の抄訳です。
Snowflake Arctic、比類ないインテリジェンスと効率性を実現する真にオープンな大規模言語モデルとして、Snowflake Arcticモデルファミリーに追加
データクラウドを提供するSnowflake(ニューヨーク証券取引所:SNOW)は本日、市場で最もオープンなエンタープライズグレードの大規模言語モデル(LLM)として独自に設計された最先端LLM、Snowflake Arcticを発表しました。ユニークなMixture-of-Experts(MoE)アーキテクチャにより、最高水準のインテリジェンスと比類ない効率性を大規模に提供します。複雑なエンタープライズワークロード向けに最適化され、SQLコード生成、指示実行(instruction following)といった数々の業界ベンチマークを塗り替えています。また、Arcticの重み(weight)をApache 2.0ライセンスでリリースし、トレーニング手法の研究の詳細も公開しており、エンタープライズAIテクノロジーの新たなオープン化基準を打ち立てています。Snowflake Arctic LLMは、Snowflake Arcticモデルファミリーの一部であり、Snowflakeが構築したモデルファミリーには、検索ユースケースに最適な実用的なテキスト埋め込みモデルも含まれています。
SnowflakeのCEOであるSridhar Ramaswamy(スリダール・ラマスワミ)は次のように述べています。「当社のAI研究部門はAIの最前線でイノベーションに取り組んでおり、今回の発表は、当社にとって重要な分岐点となります。業界屈指のインテリジェンスと効率性を真にオープンな形でAIコミュニティに提供することで、オープンソースAIの可能性の限界をさらに拡大します。Arcticの研究により、信頼性が高く効率的なAIをお客様に提供していく当社の能力が大幅に強化されます」
Arcticにより、真にオープンで広範なコラボレーションの新境地を開拓
Forrester社の最近のレポートによると、世界のエンタープライズAI担当者の約46%が、社内のAI戦略の一環として既存のオープンソースLLMを活用して生成AIを採用しているとしています1。Snowflakeは世界中の9,400以上の企業や組織にデータ基盤として活用されており2、あらゆるユーザーが、利用したいモデルを柔軟に選択しつつ、自社データを業界の主要なオープンLLMで活用できるよう支援しています。
Arcticの提供開始に合わせ、Snowflakeは強力で真にオープンなモデルを、制約のない個人利用、研究利用、商用利用を認めるApache 2.0ライセンスで提供します。さらに一歩進んで、Snowflakeはコードテンプレートを柔軟な推論やトレーニングの選択肢と合わせて提供し、ユーザーが好きなフレームワークを利用してArcticの展開、カスタマイズを速やかに開始できるよう支援します。これにはNVIDIA TensorRT-LLMを含むNVIDIA NIM、vLLM、Hugging Faceが含まれます。Arcticは現在、機械学習やAIソリューションをデータクラウドで提供するフルマネージドサービスのSnowflake Cortexにおけるサーバーレス推論で利用可能で、Hugging Face、Lamini、Microsoft Azure、NVIDIA APIカタログ、Perplexity、Together AIといったモデルガーデンやカタログとともに、Amazon Web Services(AWS)でも利用可能となります。
Arctic、トップクラスのインテリジェンスに屈指のリソース効率性を提供
業界屈指の研究者やシステムエンジニアで構成されるSnowflake独自のAI研究部門は、Arcticを同様のモデルのトレーニングにかかる費用の約8分の1のコストで、3ヵ月未満で構築しました。トレーニングではAmazon Elastic Compute Cloud(Amazon EC2)のP5インスタンスを使用していることから、Snowflakeは最先端のオープンなエンタープライズグレードのモデルをいかに素早くトレーニングできるかの新しいベースラインを打ち立てています。これはつまり、ユーザーがコスト効率の高いカスタムモデルを大規模に構築できるということです。
この戦略的な取り組みの一環として、Arcticの差別化されたMoE設計により、トレーニングシステムとモデル性能を同時に強化し、企業のニーズに特化して綿密に設計されたデータ構成とともに提供します。また、Arcticは質の高い結果を提供し、4800億のパラメーターから17パラメーターを同時に動作させ、業界屈指の品質とこれまでにないトークン効率を実現します。Arcticは、DBRXより約50%、Llama 3 70Bより75%も少ないパラメータ―で推論やトレーニングを行うことができます。さらに、コーディング(HumanEval+、MBPP+)やSQL生成(Spider)においても、DBRX、Mixtral-8x7Bなどの主要なオープンモデルの性能を上回り、同時に一般言語理解(MMLU)についても非常に高いパフォーマンスを提供します。
Snowflake、すべてのユーザーに向けてAIイノベーションをさらに推進
Snowflakeは企業が社内のエンタープライズデータを利用して強力なAIや機械学習アプリを作成するために必要となるデータ基盤と最先端のAI構成要素を提供しています。Snowflake CortexからArcticにアクセスすることで、お客様はデータクラウドのセキュリティとガバナンスの境界内で、本番グレードのAIアプリを大規模に構築することが可能です。
Arctic LLMに加え、Snowflake Arcticのモデルファミリーには先日、Apache 2.0ライセンスに基づいてオープンソースコミュニティに公開された最先端のテキスト埋め込みモデルファミリーのArctic embedも含まれます。現在Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始予定です(プライベートプレビュー中)。これらの埋め込みモデルは、非常に高い検索性能を類似モデルの約3分の1のサイズで提供できるよう最適化されており、RAG(Retrieval Augmented Generation:検索拡張生成)やセマンティック検索(意味的検索)サービスの一部として専有データセットとLLMを組み合わせることで、強力でコスト効率の高いソリューションとなります。
またSnowflakeは、最近追加されたRekaやMistral AIのモデルなど、データクラウドの最新、最強のLLMにアクセスできるようにしています。さらにSnowflakeは先日、NVIDIAとの提携拡大により、AIのイノベーションを進め、フルスタックのNVIDIA駆動プラットフォームをSnowflakeのデータクラウドと組み合わせ、安全で堅牢なインフラストラクチャやコンピューティング機能を提供し、AIの生産性を向上させることを発表しました。Snowflake Venturesは最近、Landing AI、Mistral AI、Rekaなどに投資し、お客様がLLMやAIにより社内のエンタープライズデータから価値を創出できるよう支援するSnowflakeの取り組みを推進しています。
本発表に関するAIエキスパートのコメント
AI21 Labsの共同創業者で共同CEOのYoav Shoham氏は次のように述べています。「Snowflake Arcticは当社との戦略的提携を拡充する大きな成果を生み出しつつあり、あらゆる人がAIを利用できるよう、民主化、イノベーションを推進しています。企業がオープンソースモデルの力を活用できるよう支援するSnowflakeの取り組みは素晴らしいものです。当社も先日、初の本番グレードのMambaベースのSSM-TransformerモデルであるJambaを発表しました。Snowflakeが継続的にAIに投資していることは、当社がデータクラウドを活用する重要な理由であり、両社のお客様にさらに高い価値を提供し続けてまいります」
AWSのコンピュート&ネットワーキング担当バイスプレジデントであるDavid Brown氏は、次のように述べています。「SnowflakeとAWSは、生成AIが私たちが知っている事実上すべての顧客体験を変革するという信念で一致しています。AWSを利用することで、Snowflakeはインフラをカスタマイズし、Snowflake Arcticのトレーニングの市場投入までの時間を短縮することができました。Amazon EC2 P5インスタンスとSnowflakeの効率的なトレーニングシステムおよびモデルアーキテクチャの共同設計を使用することで、Snowflakeは新しいエンタープライズグレードのモデルを迅速に開発し、顧客に提供することができました。また、Snowflake ArcticをAWSで利用できるようにする計画により、顧客は強力なAIテクノロジーを活用して変革を加速させるための選択肢を増やすことができます」
Codaの共同創業者でCEOのShishir Mehrotra氏は次のように述べています。「AIのペースが加速し続ける中、Snowflake Arcticの投入により、SnowflakeはAIイノベーターとしての地位を固めています。当社のイノベーションと設計方針は、SnowflakeのAIとその先を見据えた先進的なアプローチと一致しており、日常のアプリケーションやワークフローをAIにより変革していくこの取り組みのパートナーとなれることを嬉しく思います」
Hugging FaceのCEOで共同創業者のClement Delangue氏は次のように述べています。「この数ヵ月、オープンソースAIの大きな波が到来しています。SnowflakeがApache 2.0ライセンスによるモデルのリリースだけでなく、そのトレーニングの詳細も公開したことは素晴らしいことです。企業がAIを構築し、この分野全体として新たな境地を切り開いていくために必要な透明性と制御性が提供されます」
Laminiの共同創業者でCEOのSharon Zhou氏は次のように述べています。「当社のビジョンはAIを民主化し、すべての人が自身のスーパーインテリジェンスを構築できるようにすることです。エンタープライズAIの未来は、強力なオープンモデルとオープンな協力を基盤として構築されると考えています。Snowflake ArcticはそのようなAIの未来の実現にとって重要です。Arcticを精度の高いLLM向けにチューニング、カスタマイズし、制御性、安全性、レジリエンスを動的なAIエコシステム向けに最適化できることを嬉しく思います」
Landing AIのCEO、Andrew Ng氏は次のように述べています。「AIのイノベーションを実現し、あらゆる人に価値を創出するためのカギはコミュニティの貢献です。SnowflakeによるArcticのオープンソース公開は、誰でもファインチューニング、評価、イノベーションが可能な最先端のモデルを提供するエキサイティングなステップとなります」
MicrosoftのAzure AI Platform担当コーポレートバイスプレジデントのEric Boyd氏は次のように述べています。「急速に変化するAI環境において、Snowflakeの新たなLLMモデルであるArcticの強力な機能をMicrosoft Azure AIモデルカタログに導入することにより、エンタープライズのお客様にさらなる選択肢を提供できることを嬉しく思います。Snowflakeとの協力は、オープンなイノベーションを推進し、AIで実現できることの可能性を拡大していく当社の取り組みを表す一例です」
Perplexityの共同創業者でCEOのAravind Srinivas氏は次のように述べています。「オープンソースAIの継続的な進化、そして健全な競争は、Perplexityの成功のためのみならず、将来的にすべての人に対し生成AIを民主化していくために重要です。Snowflake Arcticを当社の製品向けにカスタマイズし、最終的にはより大きな価値を当社のエンドユーザーに創出したいと考えています」
Rekaの共同創業者でCEOのDani Yogatama氏は次のように述べています。「SnowflakeとRekaは、あらゆるユーザーが技術的な専門性に関わらずAIを活用し、事業の成果をより迅速に実現できるよう取り組んでいます。Snowflake Arcticの投入により、Snowflakeは世界有数の真にオープンな大規模言語モデルをユーザーが簡単に活用できるようにし、このビジョンを推進しています」
Together AIの共同創業者でCEOのVipul Ved Prakash氏は次のように述べています。「当社はオープンソースAIの研究、モデル、データセットの最前線に立つ組織として、Snowflake Arcticの提供開始を嬉しく思います。オープンソースAI環境の進歩はエコシステム全体に資するものであり、世界中の開発者や研究者がインパクトのある生成AIモデルを展開することが可能となります」
関連情報:
- 2024年6月3〜6日にサンフランシスコで開催されるSnowflake Data Cloud Summit 2024では、SnowflakeのAIの最新の取り組みについてご紹介します。参加登録を受け付けています。また、2024年6月6日のSnowflake Dev Dayではこれらのイノベーションのデモをご覧いただけます。
- ユーザーはHugging FaceにアクセスしてSnowflake Arcticをダウンロードし、推論や微調整のレシピにSnowflakeのGithubレポを使用することができます。
- Snowflake Arcticの詳細やリソースはこちらをご覧ください。
- Snowflake AI研究部門がSnowflake Arcticのトレーニング方法についてテクニカルブログにまとめています。
- 生成AIやLLMのエンタープライズデータでの活用事例をこちらの動画で紹介しています。
- LinkedInやTwitterでもSnowflakeの最新情報を発信しています。
1The State of Generative AI、Forrester Research Inc. 2024年1月26日
2 2024年1月31日現在
Snowflakeについて
Snowflakeは、Snowflakeデータクラウドを通じてあらゆる組織がデータをモビライズできるよう支援します。Snowflakeのお客様は、データクラウドを活用して、サイロ化したデータの統合、データの発見と安全な共有、データアプリケーションの推進、多様な人工知能(AI)/機械学習(ML)ワークロードや分析ワークロードの実行を実現しています。データやユーザーがどこに存在するかに関係なく、Snowflakeは複数のクラウドと地域にまたがって単一のデータエクスペリエンスを提供します。さまざまな業界の何千ものお客様(2024年1月31日時点で、2023年のForbes Global 2000(G2K)の691社を含む)が、Snowflakeデータクラウドによってビジネスを強化しています。詳しくは、snowflake.comをご覧ください。
<本件に関するお問い合わせ>
Snowflake合同会社
PR担当 山中
[email protected]