製品をチェック

HDFS ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

HDFS アイコン HDFS ODBC Driver 相談したい

HDFS ODBC Driver を使って、ODBC 接続をサポートするあらゆるアプリケーション・ツールからHDFS にデータ連携。

HDFS データにデータベースと同感覚でアクセスして、HDFS データに使い慣れたODBC インターフェースで連携。

Exploratory でHDFS のデータを連携する方法

ODBC 接続でExploratory からHDFS のデータにSQL でクエリ

桑島義行
テクニカルディレクター

最終更新日:2022-11-26
hdfs ロゴ

CData

odbc ロゴ画像
Exploratory ロゴ

こんにちは!テクニカルディレクターの桑島です。

CData ODBC Driver for HDFS は、ODBC 経由でリアルタイムHDFS データ に標準SQL での利用を可能にします。 ここでは、汎用ODBC データプロバイダーとしてHDFS に接続し、データアナリティクスツールのExploratory (https://exploratory.io/) からHDFS のデータを連携利用する手順を説明します。
Exploratory は、多くのRDB やRedshift、BigQuery などのクラウドデータストアに対応していますが、SaaS データを分析したい場合にはCData ODBC ドライバを使うことで、API コーディング不要でデータを活用できます。今回はHDFS を例に説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. HDFS をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHDFS のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHDFS の接続を設定、2.Exploratory 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHDFS への接続設定

まずは、本記事右側のサイドバーからHDFS ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

次にマシンにHDFS のデータ に接続するODBC DSN を設定します。Exploratory からはそのODBC DSN を参照する形になります。ODBC DSN 設定の詳細については、ドキュメントを参照してください。

HDFS 接続プロパティの取得・設定方法

HDFS への認証には、次の接続プロパティを設定します。

  • Host:HDFS インスタンスのホストに設定してください。
  • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。

Exploratory 上でHDFS のデータをセット

  • Exploratory で[コネクション]をクリックして新しいコネクションを作成します。
  • [追加]→[ODBC]の順にクリック。
  • コネクション追加画面で先ほど設定したHDFS ODBC のDSN を設定します。
    名前:任意
    タイプ:ODBC
    DSN:上の設定したDSN 名(CData HDFS Sys)
  • Adding new connection
  • コネクションテストを下の地、[追加]を押して接続を確定させます。

Exploratory でHDFS のデータをクエリし、データフレームとして保存

さあ、Exploratory からHDFS のデータを扱ってみましょう。

  • Exploratory でプロジェクトを[新規作成]します。
  • [データフレーム]の[+]印をクリックし、[データベースデータ]を選択します。
  • Create new Dataframe
  • データベースは[ODBC]をクリック。
  • Select ODBC
  • [コネクション]で先ほど設定したHDFS のコネクションを選択します。
  • RDB ソースの感覚でSELECT クエリでHDFS のデータをクエリします。標準SQL でフィルタリング、ソート、JOIN も可能です。
  • Query data using standard SQL
  • データセットをデータフレームとして保存します。

Exploratory でのHDFS のデータの分析

データフレームになったデータは通常のRDB データソースと同じようにExploratory で利用可能です。

Query data using standard SQL

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。