Snowflakeスタートアップスポットライト:DataMynd、合成データ生成のための「簡単なボタン」を構築

Snowflakeのスタートアップスポットライトへようこそ。スタートアップの創業者に、解決しようとしている問題、構築しているアプリ、スタートアップジャーニーから得た教訓について尋ねます。本エディションでは、DataMynd.aiの創業者兼CEOであるChuck Frisbieが、データプライバシーとデータアクセスのニーズのバランスをとるために合成データがどのように役立つのか、またSnowflakeネイティブアプリの意外なメリットについて語ります。
DataMyndを1つの文でどのように説明しますか?
Datamyndは、Snowflakeマーケットプレイス向けのデータプライバシーソリューションと、当社初のSnowflakeネイティブアプリである合成データジェネレータを構築し、データチームがセキュリティやプライバシーを犠牲にすることなく高精度の合成データを生成できるようにします。
創業者としてのインスピレーションは何ですか?
考え抜かれた、相性の良いソリューションでお客様に喜んでもらうことは、私たちにインスピレーションを与えます。優れたソリューションは、その人が特定の仕事にまさに必要としているものです。 優れたソリューションはチームを強化し、時間と頭痛の種を取り除き、簡単に作業できます。 優れたソリューションを提供してくれたお客様に感謝することほど、良いことはありません。
「X向けの製品があったら良いのに」と思ったことは何度もあります。私たちは、そのような製品を、企業のデータセットで移植性、インテリジェンス、消費性を高めることに取り組んでいます。Snowflakeのソリューションは使いやすく、ネイティブプラットフォーム機能を活用し、互いに相乗効果を発揮します。
DataMyndが解決したい課題は何ですか?その問題をどのように特定しましたか?
Snowflakeのネイティブアプリ、Synthetic Data Generatorのデビューは、「機密データの価値を解き放つのは面倒」という複雑な問題を解決するシンプルなソリューションです。アナリティクスのためのデータシェアリング、MLモデルのトレーニング、開発データやテストデータの作成など、データプライバシーがイノベーションの妨げとなる場合があります。機密性の高いフィールドのスクラビングや編集、あるいは「現実的な」データを一から生成するためのルールの作成を行うことなく、アプリを本番スキーマに向けて、付属のモデルの1つをトレーニングし、好きなだけ合成データを生成するだけです。基本的には合成データの「簡単なボタン」です。
Snowflakeネイティブアプリは、機械学習を使用して実際のデータスキーマをプロファイリングし、そこから類似する高品質の合成データを生成します。私たちの合成データには、実際のデータと同様のトレンドと相関関係が含まれているため、従来のテストデータよりも有用です。当社の合成データでMLモデルをトレーニングすることも、データシェアリングに使用することもできます。
アプリ自体は素晴らしいですが、リグレッションバグの削減、より良い開発およびデモスキーマの構築、偏ったデータセットの再調整、テストのスケーリングなど、非常に興味深いメリットも得られています。
アプリをSnowflakeで構築しようと思ったのはなぜですか?
Snowflakeネイティブアプリフレームワークは、私たちとアプリコンシューマーの間の障壁の多くを取り払ってくれます。Snowflakeのアプリは、MLとデータプライバシーのワークロードをサポートすることに重点を置いているため、コンシューマーアカウントに安全に展開できることは、お客様にとって非常に重要です。審査プロセスが大幅に短縮され 誰もがメリットを得られます
Snowflakeネイティブアプリフレームワークのもう一つの側面は、開発スピードと開発オーバーヘッドの最小化です。開発者は、インフラストラクチャーや配管ではなく、コアワークフローに集中したいと考えています。Snowflakeでは、各コンポーネントはモジュール化されていますが、フレームワークの残りの部分との優れた統合をサポートしています。 これにより、コアワークフローに集中し、短時間で多くのものを生み出すことができます。
また、Snowflakeネイティブアプリの構築者として、何千ものSnowflakeユーザーや潜在的な販売機会にも接しています。私たちはすでに小さな開発ショップとして多くの課題を抱えています。そのため、インバウンドリードと紹介のための新たな手段を設けることで、初期顧客の獲得とアプリへのフィードバックに大きな影響を与えています。
DataMyndにおけるAIの役割
DataMyndでは、アプリの中核としてAIを使用しています。つまり、高品質で正確な合成データを生成するためにニューラルネットワークをトレーニングし、AIユースケースを強化できる安全な合成データを作成することを目指しています。
データアクセスは加速するAIテクノロジーシーンの重要な部分になるが、データ侵害の増加やデータプライバシー懸念の高まりと隣り合わせである。合成データは、この2つの力のバランスを取るために企業が使用できる技術の1つであり、その分野に携わることができてとてもうれしいです。
急速に変化するAI情勢は、誰もが気にかけています。創業者兼イノベーターであるあなたは、AIがビジネス界にどのようなインパクトを与えていますか?
私はAIの台頭とリスクについて、一部の人より少し楽観的です。これからの数年間は、間違いなくジェットコースターのような乗り物になるでしょう。怖い瞬間があるかもしれませんが、私たちの課題を解決するツールは、それを生み出すツールと同じであることを忘れないでください。
私は、AIがデータ分野のほとんどの仕事に取って代わるとは思っていません。多くの既存の役割の全体的な効率が高まるだけでなく、ますますインテリジェントな成果への欲求も高まり、自己改革できる新しい役割には大きな機会が生まれるでしょう。
また、画一的で汎用的な万能のAIではなく、戦術的なAIドリブン型のアプリが大量に出現するようになると思います。これは、AIアプリを構築する人にとって素晴らしい前提です。
DataMyndと合成データの価値については、datamynd.aiをご覧ください。Snowflakeマーケットプレイスでアプリをお試しいただくか、Mediumに関するSnowflake Builder Blogの記事をご覧ください。Snowflakeで構築しているスタートアップ企業は、2025 Snowflakeスタートアップチャレンジに登録し、Powered by Snowflakeスタートアッププログラムに忘れずに参加しましょう!