Fivetran
Homeブログ
おすすめETLツール比較してみた | Fivetran, Informatica, Matillion, Xplentyその他

おすすめETLツール比較してみた | Fivetran, Informatica, Matillion, Xplentyその他

人気の最新データ統合ツールを、コスト、セキュリティ、信頼性、サポートするソースの数などで比較しています。

おすすめETLツール比較してみた | Fivetran, Informatica, Matillion, Xplentyその他

Charles Wang 著 2021年6月10日

データに関わる全ての方へ。あなたの会社でのデータ分析の準備は進んでいますか?

  • 社内で使用するDWHが決定し、
  • BIツールのトレーニングも準備オーケー
  • あとは、社内データを分析のためのリポジトリに複製するだけ!

あと少し、というところまで来ている!では、ETL・ELTツールはどれを選ぶべきでしょうか?この記事では、我々ファイブトランの特徴を競合他社と比較していきます。ETL・ELTツール選びに迷っている方は必見です。

最新のデータパイプラインのモデルとは

昨今のアナリストは、Amazon RedshiftやGoogle BigQueryのようなクラウドデータウェアハウスやTableauやLookerのような分析ツールを使って、複数のソースからのデータを組み込んだダッシュボードやレポートを簡単に(いや、以前よりも簡単に)構築することができます。

これらのデータを一元的に利用できるようにすることも、同様に容易であるべきです。データウェアハウスに入っていないデータが必要になった場合、そのデータにシームレスにアクセスし、分析用リポジトリにコピーすることができなければなりません。

そのためには、ポイント&クリックでプロセスを確認できるグラフィカルなインターフェースが必要です。これは、移動したデータが完全であり、必要なときに届くという確信があることを意味します。そのためには、一般的なデータソースだけでなく、幅広い種類のコネクターを提供するプラットフォームが必要です。

まず、Fivetranが提供するサービスについて説明します。Redshift、BigQuery、Microsoft Azure Synapse、Snowflake、Microsoft SQL Server、PostgreSQL、MySQLなど、150のデータソースと10のデスティネーションをサポートしています。当社が提供していないコネクターを使用したい場合は、必要なものを教えてください。お客様のご要望に応じて新しいコネクターを追加しています。

信頼性は?堅牢なモニタリング、オブザーバビリティ、インシデントレスポンスにより、これまでで最も信頼性の高いデータパイプラインを実現しています。また、いつでも状況を確認することができます。

コンプライアンスは?HIPAAの義務の対象となっているお客様とのビジネスアソシエイト契約(BAA)を喜んで締結します。また、GDPRにも対応しています。また、SOC 2コンプライアンスの監査を毎年受けています。

コストは?当社では、柔軟で透明性の高い従量課金制を採用しています。それでは、他のETLプロバイダーがこれらの分野でどのような立場にあるのか見てみましょう。

Fivetran(ファイブトラン) vs. Informatica(インフォーマティカ)比較

Fivetranは、クラウドネイティブなデータパイプラインです。Informaticaはそうではありません。同社は現在、Informatica Cloud Data Integrationを提供していますが、この製品のルーツは、古いオンプレミスのデータウェアハウスにデータを押し込むソフトウェアにあります。それらのオンプレミス製品は、データウェアハウスで変換を行う現代的なELTプロセスではなく、データパイプラインで変換を行う古いETLモデルに従っていました。

それはまるで、最初から電気自動車として設計されたテスラと、ホンダ・シビックのEVの違いのようです。どちらの方が安心して運転できるでしょうか?

Fivetranとは異なり、Informaticaには透明性のある価格設定がありません。費用を知りたければ、営業担当者と話さなければなりません。インフォマティカは30日間の無料トライアルを提供しています。

Fivetran(ファイブトラン)vs. Matillion(マティリオン)比較

Fivetranは10のデータウェアハウスのデスティネーションをサポートしているのに対し、Matillionはわずか5つのデスティネーションをサポートしています。Redshift、BigQuery、Snowflake、Azure Synapse、Delta Lake on Databricksです。このプラットフォームには100以上のコネクタ(Matillionではインテグレーションと呼んでいる)があるが、すべてのデータソースがすべてのデスティネーションで利用できるわけではない。

Matillion ETLは良好な信頼性を提供し、HIPAA、GDPR、SOC 2 Type 2などの強力なコンプライアンス認証を取得しています。価格はFivetranと同様で、クレジットと使用量に応じて3つのティアがある。同社は14日間の無料トライアルを提供しています。

Fivetran(ファイブトラン)vs. Xplenty比較

他の多くのプラットフォームとは異なり、Xplentyは、メールアドレスを入力するだけではテストを開始できません。デモや営業担当者との会話を経て、初めて14日間の無料トライアルを受けることができます。Xplentyは、約100種類のデータソースとの統合をサポートしており、クラウドのデータウェアハウスやデータレイクだけでなく、SaaSやアナリティクスアプリケーションなど、これらのプラットフォームの中で最も幅広い接続先をサポートしています。このプラットフォームは、HIPAA、GDPR、SOC 2などの認証に準拠しています。

Xplentyの価格設定は、多くのETL製品が採用している使用量と消費量のモデルを否定しています。その代わりに、各ソースとデスティネーション間の接続数に応じて課金されます。しかし、データ分析は、一般的に使用するデータソースが多ければ多いほど豊かになり、Xplentyの価格モデルは、新しいデータソースを追加することを阻害します。

Xplentyに欠けている重要な機能の1つは、データベースのインクリメンタル・レプリケーションのための変更データ・キャプチャーです。その代わりに、タイムスタンプカラムを指定して、最後のレプリケーション時間の後に起こったすべての変更をレプリケートするという、信頼性の低い方法を使用しています。

Fivetran(ファイブトラン)vs. Stitch(スティッチ)比較

かつてStitchはFivetranのライバルでしたが、同社は2018年11月にTalendというデータ統合企業に買収され、それ以降は目立たない存在となっています。Talendデータプラットフォームの一部であるStitchは、Fivetranとほぼ同数の130以上のデータコネクターを提供しており、両社がサポートする多数のデータソースも含まれています。

Stitchは信頼性が高く、HIPAA、GDPR、SOC 2ガイドラインに準拠しています。Fivetranと同様に、Stitchは消費ベースの価格モデルを採用しており、月々の行使用量に応じていくつかのティアが設定されています。同社は昨年、低容量の顧客に提供していた無料ティアを廃止したことで小さな騒動を起こしたが、新規顧客には14日間の無料トライアルを提供している。

ここまで、データ統合/ETLツールの一部を紹介してきましたが、問題は細部にあります。各ETLプラットフォームを実際に評価する際には、自社のライブデータを使ってテストし、必要なデータ量を必要なときにすぐに再現できるかどうか、また、正しいデータタイプとレコード構造で目的地に到着するかどうかを確認する必要があります。

ドキュメントが充実しているかどうか、必要に応じてトレーニングサービスや導入支援が受けられるかどうかも確認してください。

もう一つ、技術的なポイントをご紹介しましょう。SaaSソフトウェア・ベンダーは定期的にプラットフォームをアップグレードしますが、その際、新しいテーブルの追加、既存のテーブルへの新しいフィールドの追加、テーブルやフィールドのマージや削除などが行われることがあります。クラウドETLツールはSoftware as a Serviceなので、データ分析スタックが壊れないようにプラットフォームに変更を加える責任があります。しかし、データパイプラインの最終地点であるデータウェアハウスはどうでしょうか?データウェアハウスにもスキーマの更新が必要で、プロセス全体が壊れないようにする必要があります。

Fivetranは、ソースデータの変更に基づいて、データウェアハウスのスキーマを自動的に移行します。これには巧妙なエンジニアリングが必要であり、すべてのETLプラットフォームがその機能を備えているわけではありません。しかし、データの流れを維持するためには、それが不可欠です。ETLベンダーに、データソースのスキーマ変更をどのように処理するか聞いてみてください。

Fivetran導入事例:CaliberMind社、Fivetranで顧客データをオンボード化

CaliberMind社は、顧客データのオンボーディングを自動化することで、スキーマの移行に悩まされる時間を減らし、データのインサイトを発見する時間を増やしました。

ここでは、ETLを行うと謳っている100以上のプラットフォームのうち、ほんの一握りを紹介しました。もし、Fivetranやここで紹介した他のプラットフォームに重要な機能が欠けていたとしても、必要な機能を提供するアプリケーションを見つけることができるでしょう。しかし、私たちはFivetranがあなたのニーズを満たすことに賭けてみたいと思います。

この記事は英文から翻訳されました。オリジナルの記事はこちら(英語)からご覧ください。