製品をチェック

HDFS ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

HDFS アイコン HDFS ODBC Driver 相談したい

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで連携。

Tableau Server へのHDFS ダッシュボードの公開・パブリッシュ

CData ODBC Driver for HDFS を使って、Tableau ダッシュボードにHDFS をデータ連携。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-09-20

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

エンタープライズBI にHDFS 連携機能を追加しましょう。CData ODBC Driver for HDFS を使って、Tableau Server にHDFS のデータをリアルタイム連携して、ダッシュボードを公開。企業の他のメンバーに連携レポート・ダッシュボードを共有しましょう。

この記事では、クライアントおよびサーバーでのでのDSN の設定、HDFS のデータソースのTableau Server へのパブリッシュ、ワークブック全体のTableau Server へのパブリッシュまでの手順を説明します。データソースをパブリッシュすると、Tableau Server で更新可能なワークブックを新しく作成することができるようになります。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. HDFS をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHDFS のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHDFS の接続を設定、2.Tableau Server 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHDFS への接続設定

まずは、本記事右側のサイドバーからHDFS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

Tableau Desktop でワークブックやデータソースを作成して、Tableau Server にワークブックやデータソースをパブリッシュするには、デスクトップとサーバーのそれぞれのマシンでDSN 設定を行う必要があります。両方のマシンで厳密に同じ名前のDSN を作成して接続する必要があります。以下がHDFS に接続するための情報です。Windows とLinux ODBC では設定に異なる点がありますので、ドキュメントを参照してください。

HDFS 接続プロパティの取得・設定方法

HDFS への認証には、次の接続プロパティを設定します。

  • Host:HDFS インスタンスのホストに設定してください。
  • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。

DSN を設定する際には、Max Rows プロパティを設定することをお勧めします。これにより取得される行数が制限され、パフォーマンスを向上させます。

Windows

CData ODBC Driver for HDFS on Windows の場合は、DSN 設定はドライバーをインストールした後に行います。ドライバーをインストール語にDSN 設定画面が開きます。マイクロソフトのODBC データソースアドミニストレータから設定を行うことも可能です。

Linux

CData ODBC Driver for HDFS をLinux で利用する場合には、ドライバーのインストールでSystem DSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini)を編集して、接続プロパティを入力することでDSN 設定を変更することができます。

/etc/odbc.ini

[CData HDFS Source] Driver = CData ODBC Driver for HDFS Description = My Description Host = sandbox-hdp.hortonworks.com Port = 50070 Path = /user/root User = root

コンフィグレーションファイルの詳細設定については、製品ヘルプを参照してください。

HDFS のデータソースをTableau に公開

HDFS への接続を確立したら、Tableau でHDFS のデータソースをパブリッシュして、組織内のユーザーがHDFS のデータに連携するワークブックを作成して利用できるようにします。

Tableau 上でHDFS のデータソースを作成してパブリッシュする

  1. データソース画面で、その他のデータベース(ODBC) を選択します。システムDSN であるCData HDFS Sys を選択します。

    ドライバーのインストール時にシステムDSN とユーザーDSN を自動的に作成してくれます。Tableau Server では、システムDSN を使用します。

    Tableau からDSN への接続 (Salesforce is shown.)
  2. [データベース]メニューでCData を選択します。
  3. [表]ボックスにテーブル名を入力、または[🔎]マーククリックして、テーブル一覧を表示させます。[新しいカスタムSQL]をクリックしてSQL クエリを入力することもできます。
  4. [データソース]ページで、テーブルをJOIN エリアにドラッグします。 使用するテーブルの選択(Salesforce is shown.)
  5. [サーバー]メニューで[ワークブックのパブリッシュ]-> (使用するデータソース)をクリックします。
  6. サーバーのURL を入力します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  7. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで、組織のユーザーがパブリッシュされたHDFS のデータソースのワークブックを作成して共有することができるようになりました。

Tabelau Server でデータソースへの接続を設定 (Salesforce is shown.)

ワークブックのデータ更新(リフレッシュ)

クライアントマシンであるTableau Desktop とサーバーマシンであるTableau Server システムDSN を設定すると、接続しているHDFS のデータソースをリフレッシュすることができます。Tableau Server のインターフェースで[データ]->[使用中のデータソース]->更新(Refresh)をクリックします。

Tableau Desktop からオンデマンドで更新データを取得。 (Salesforce is shown.)

Tableau Server でHDFS のデータに連携する完成したワークブックをパブリッシュする

特定の完成したワークブックを組織内で共有する場合、Tableau Desktop でワークブックを作成し、直接Tableau Server にパブリッシュすることができます。

  1. 上記の1-5 の手順で、HDFS に接続し、データを取得します。 テーブルデータの取得 (Salesforce is shown.)
  2. [サーバー]-> [サインイン]をクリックして、サーバーの接続を設定します。通常はTableau Server のuser name とpassword で認証します。次のような認証シナリオも可能です:
    • Tableau がKerberos を使用し、コンピューターに有効なActive Directory で接続している場合、Tableau がサーバーに接続します。
    • Tableau がSAML を使用する場合、外部プロバイダーのログインプロンプトが表示されます。
    • Tableau は、Active Directory の使用で設定されている場合、Windows username およびpassword を入力します。
  3. 選択されたデータに対しビジュアライズするディメンションおよびメジャー選択し、チャートやブラフでビジュアライズを行います。
  4. ワークブックが完成したら、[サーバー]-> [ワークブックのパブリッシュ]でTableau Server ににパブリッシュします。
  5. 次に、ダイアログにProject、Data Source や他のプロパティを入力します。スケジュール更新を設定する場合、Embedded Passsword を認証メニューで選択します。パブリッシュをクリックします。

これで組織内のユーザーTableau Server のパブリッシュされたワークブックを参照することができるようになります。

Tableau Server ワークブックをパブリッシュ。 (Salesforce is shown.)

HDFS からTableau Server へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。