Fivetran
Home導入事例
Slice(スライス)社、ピザに機械学習を導入

Slice(スライス)社、ピザに機械学習を導入

Fivetran(ファイブトラン)とDatabricks(データブリックス)を使って、Sliceは3人のデータエンジニアの労力をミッションクリティカルなプロジェクトへの再配分に成功。

Slice(スライス)社、ピザに機械学習を導入

Ciara Rafferty著 2020年12月7日

成功事例のポイント

  • 3人のデータエンジニアは、ETLからビジネスを成長させるプロジェクトに焦点を移す
  • Databricksにより、Sliceは機械学習に注力し、データサイエンスのディレクターを採用してチームを構築する
  • 現在/今後のプロジェクト:特徴的なサービスによるパーソナライゼーション、CRMメッセージング機能、レストランのオペレーティングシステムの構築など
  • データチームは3~5分のSLA(Service Level Agreement)を約束していますが、最新のデータスタックにより、本番とレポートの間の時間をわずかミリ秒に抑えています。

使用データスタック

  • パイプライン:Fivetran(ファイブトラン)
  • データソース Twilio、Fivetran Log、Kustomer、Salesforce、Stripe
  • データの移動先(デスティネーション): Databricks
  • BIツール:Looker

Slice(スライス)は、ピザ屋が顧客にサービスを提供するために必要な専門技術、データインサイト、ロイヤリティマーケティング、シェアードサービスを提供しています。この事業では、中小企業や地域社会に貢献するというミッションを果たしながら、Sliceアプリやウェブサイトでお客様が簡単にピザを注文できるようにしています。ニューヨークに本社を置き、ベルファストとマケドニアにオフィスを構え、700人以上のグローバルな従業員を擁して、グローバルに事業を展開しています。

注文され、届けられ、食べられる一切れのピザの背後には、多くのテクノロジーとデータが存在します。過去2年間、Sliceはデータ戦略に重点を置き、チームはDatabricksを使ってデータウェアハウスとデルタレイクを構築しました。これを実現するには、大量のデータをシステム間で移動させる必要がありました。

Fivetranによるデータパイプラインの拡張

当初、この企業は社内でデータパイプラインのコードを書き、維持していました。何か障害が発生した場合は、手作業での対応が必要でした。2021年に向けた大きな計画(レストランの運営をより深く掘り下げ、POSを所有するなど)によって、Sliceのデータは劇的に増加します。このような成長目標を達成するために、Sliceはデータエンジニアがデータの移動ではなく、ビジネス課題の解決に取り組めるようなスケーラブルなソリューションを必要としていました。

Slice社のCTOであるJason Ordway(ジェイソン・オードウェイ)氏と他の数名の社員は、以前の会社でFivetranを使用していたので、このソリューションがビジネスの拡大に役立つことを知っていました。

私はFivetran(ファイブトラン)と再会し、計算してみたところ、納得できました。私たちは、ビジネスに特有の課題を解決するために、むしろ人間を使いたいと考えています。ベルファストのデータエンジニアリングのディレクターがPOCを行いましたが、問題ありませんでした。最大で3人のフルタイムエンジニアの時間を節約できます。

Slice社は今後、マスターデータストアであるMySQL用にFivetranコネクタを追加する予定です。このビジネスでは、メニューサービス、ショップサービス、オーダーサービスなど、それぞれが独自のデータストアを持つ新しいサービスを展開しており、オードウェイ氏の説明によると、これらのサービスは迅速に拡張する必要があるといいます。

それぞれのデータストアは、指数関数的に拡大していきます。新しいサービスを開始するたびに、異なるデータベースからデータを移動させるコードを書くには、膨大な時間がかかります。Fivetranによるポイント&クリックは、多くの問題を解決し、コーディングのミスをなくすことで、AWSの請求額を適正に保つことができます。

データレイクの構築

オードウェイ氏がSliceに入社した3年以上前、「データウェアハウス」は複数のデータソースを集めた非構造化データベースであり、同氏曰く「データのゴミ箱」でした。データウェアハウスが構造化され、適切な場所に設置されると、チームはデータレイクの構築に着手することができました。FivetranはデータをS3バケットに格納し、それをもとにデータレイクを稼働させます。オードウェイ氏はその機能を説明します。

例えば、コネチカット州フェアフィールドの午後7時から午後10時までの間に、先月の注文データと先週の注文データを比較したいとします。Databricksはサーバーを起動してクエリを実行し、データの異なるダイナミックなビューを作成します。レポートを作成し、それが終わると、起動していたすべてのサーバーが停止します。さらに重要なのは、倉庫に負担をかけることなく、時間をさかのぼって比較することができることです。

機械学習と予測分析

スタックを整えたSliceは、データサイエンスのディレクターを採用し、機械学習の科学者を2人雇い、機械学習に力を入れています。最初のステップは、自社アプリの特徴付けサービスによるパーソナライゼーションです。Sliceは、お客さまのお気に入りのお店や好きなスライスを把握し、その行動に応じたお勧めの商品を提供します。また、メッセージングを利用したCRM機能も検討しています。例えば、金曜日の午後4時頃に注文することが多いお客様には、その時間までにお気に入りのお店で注文するようメッセージを送ることができ、オードウェイ氏はこれをとても楽しみにしています。

この特徴的なサービスは、企業として初めてのパーソナライゼーションへの取り組みです。特性サービスは、企業として初めてのパーソナライゼーションです。当社のデータチームは、これらのモデルを構築してトレーニングし、その結果を消費者向けアプリケーションに反映させています。これは素晴らしいことです。

BIのための信頼性の高いインフラ

正確なデータを持つことは、トップラインの指標の報告から、従業員の報酬、取締役会の期待まで、あらゆることに影響を与えます。データのパズルのピースが一つでも欠けてしまうと、組織全体に影響を与えてしまいます。

私たちは、データとその鮮度に非常に敏感です。幸いなことに、私たちは最悪の場合、障害ではなく遅延が発生するようなインフラを構築しています。データレイクを構築したときの目標は、本番環境とレポートの間の遅延を5分にすることで、SLAは3~5分としていました。SLAは3~5分ですが、今日見ているのは本番とレポートの間のミリ秒です。

Fivetranをはじめとする最新のデータスタックを導入したことで、レポーティングはより最新のものになり、ジョブやコードが失敗してもダウンストリームの影響を受けなくなりました。以前は、障害が発生すると人の介入が必要となり、報告の遅れにつながっていました。エンジニアは、データパイプラインを管理するのではなく、レストランのオペレーティングシステム、顧客体験、予測モデリングを構築しています。これはオードウェイ氏にとって大きな勝利です。

最も重要なのは、人間がモノづくりに集中できることです。データに基づいて素晴らしい製品を作ることができるので、2021年がどのような年になるのか楽しみです。Fivetranの機能を知っているのに、なぜそれを社内でやろうとしたのでしょうか?

Fivetran(ファイブトラン)とDatabricks(データブリックス)がデータにおける最大の課題をどのように解決しているかについてはこちらのブログ記事でさらに詳しく解説されています。Databricksコネクタの設定方法をこちらのクイックデモ動画から。そして無料トライアルでモダンデータスタック(MDS)のパワーをご自身で体験してみてください。

Fivetran(ファイブトラン)について

Fivetranテクノロジーは、データアナリストの実際のニーズに基づいて開発されており、アプリケーション、データベース、イベント、ファイルを高性能なクラウドウェアハウスに複製する最もスマートで高速な方法です。Fivetranのコネクタは数分で導入でき、メンテナンスは不要で、ソースの変更にも自動的に対応します。そのため、データチームはエンジニアリングに関する心配をすることなく、インサイトの推進に集中することができます。

Databricks(データブリックス)について

Databricks社は、データとAIを扱う企業です。Comcast、Condé Nast、Nationwide、H&Mなど、世界中の何千もの組織が、データエンジニアリング、機械学習、アナリティクスのためのDatabricksのオープンで統一されたプラットフォームを利用しています。Databricks社は、ベンチャー企業としてサンフランシスコに本社を置き、世界各地にオフィスを構えています。Databricks社は、Apache Spark™、Delta Lake、MLflowのオリジナルクリエーターによって設立され、データチームが世界の難問を解決することを使命としています。詳細については、Twitter、LinkedIn、FacebookでDatabricksをフォローしてください。

Looker(ルッカー)について

Lookerは、Google Cloudのデータ&アナリティクススイートに含まれるビジネスインテリジェンス(BI)およびアナリティクスプラットフォームです。従来のBIを超えて、Lookerは意思決定の時点で実用的なビジネスインサイトを提供するデータエクスペリエンスを強化し、製品やワークフローにデータを注入することで、組織がウェブスケールでデータから価値を引き出せるようにします。

この記事は英文から翻訳されました。オリジナルの記事はこちら(英語)からご覧ください。