各製品の資料を入手。
詳細はこちら →CData
弊社に頻繁に寄せられるご相談として、「Tableau Cloud からAzure Data Lake Storage のデータを参照したい」というシナリオがあります。CData 製品を使えば、いろいろな方法でTableau Cloud からのAzure Data Lake Storage データ参照を実現できます。API を書く必要はありません。
とはいえ実装方法毎に特徴がありますので、この記事では3種類の実装方法とその特徴をご紹介します。
こちらは、Tableau Cloud に1台のデスクトップからパブリッシュする方法です。Tableau Desktop からTableau Cloud へのデータ更新は手動でのパブリッシュ、またはTableau Bridge を使って、定期的に自動で最新のAzure Data Lake Storage データをTableau Cloud 側にリフレッシュすることも可能です。
必要なライセンスはAzure Data Lake Storage ODBC Driver Server License です。他の方法に比べ安価に済む点がメリットです。 デメリットは、Tableau Desktop から手動でAzure Data Lake Storage データのリフレッシュをするか、Tableau Bridge を実行するマシンを常時起動する必要がある点です。また、Azure Data Lake Storage のデータがAPI リミットを超える場合には全データを取り込むことができません。
こちらは、Tableau Cloud で直接Azure Data Lake Storage データを扱う方法です。サービス間にCData Connect Cloud という弊社のデータハブサービスが入ります。こちらはTableau Cloud から最新のAzure Data Lake Storage データへのリフレッシュが可能です。
必要なライセンスは、CData Connect Cloud Standard Edition です。メリットは、間にデスクトップやサーバーの構築が不要で、価格も安価な点です。また、Tableau Cloud 側から常に最新のAzure Data Lake Storage データが取得できます。 デメリットは、Azure Data Lake Storage のデータがAPI リミットより多い場合には全データを取り込むことができない点。
こちらは、Tableau Cloud がアクセス可能なDB に一度Azure Data Lake Storage データをレプリケーションする方法です。CData Sync を使って、間にクラウドDB(Amazon RDS やAmazon Redshift など)にAzure Data Lake Storage データを保管して、Tableau Cloud からDB を参照します。
必要なライセンスは、CData Sync Standard Edition です。メリットは、一度でAzure Data Lake Storage から取得できない(API リミットにひっかかる)ようなデータでも、差分更新でDB にコピーすることでTableau Cloud から扱える点です。 デメリットはDB へのレプリケーション間隔で1時間や15分などの設定になるので、リアルタイムデータではないという点です。また、間にDB とSync をホスティングする必要があります。シナリオとして、Azure Data Lake Storage 以外にも複数のデータソースをTableau Cloud で分析して使いたい場合には、データウェアハウス(DWH)的に一度DB に生のデータをレプリケートし、DWH 上でマスターデータの整備やビューの作成を行うことができる点も、CData Sync のメリットです。
まとめると以下のようになります。
A: CData Azure Data Lake Storage Driver | B: CData Connect Cloud | C: CData Sync | |
---|---|---|---|
方法 | Tableau Desktop / Bridge でAzure Data Lake Storage データを取得し、パブリッシュ | クラウドデータハブのCData Connect 経由でTableau Cloud からAzure Data Lake Storage データにアクセス | 一度Azure Data Lake Storage データをDB に保存 |
リアルタイム | × データのパブリッシュ間隔次第 | 〇 | × データのパブリッシュ間隔次第 |
API コーディング | 不用 | 不用 | 不用 |
Tableau Cloud からのデータリフレッシュ | × | 〇 | × |
外からのデータリフレッシュ | Tableau Desktop で手動実行 or Tableau Bridge で定期実行 | - | CData Sync が一定間隔でDB を更新 |
ホスティング有無 | Tableau Desktop/Bridge のホスティングが必要 | 不用 | CData Sync およびDB のホスティングが必要 |
費用 | お手頃 | お手頃 | やや高い |
差分更新でのAPI リミット回避 | 不可。個別のSQL フィルタリングが可能。 | 不可。個別のSQL フィルタリングが可能。 | 差分更新可。 |
このように、さまざまな方法でAPI 側の複雑な仕様を意識せずにAPI 連携をしたアプリのデータに、Tableau Cloud からアクセスできます。他にも多くのSaaS に対応するCData 製品の詳細を、以下からご覧ください。