製品をチェック

HDFS Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

HDFS アイコン HDFS JDBC Driver 相談したい

HDFS データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

Denodo Platform でHDFS のデータソースを作成

CData JDBC ドライバを使ってDenodo Virtual DataPort Administrator でHDFS のデータ の仮想データソースを作成します。

桑島義行
テクニカルディレクター

最終更新日:2022-02-28
hdfs ロゴ

CData

jdbc ロゴ画像
Denodo ロゴ

こんにちは!テクニカルディレクターの桑島です。

Denodo Platform は、エンタープライズデータベースのデータを一元管理するデータ仮想化製品です。CData JDBC Driver for HDFS と組み合わせると、Denodo ユーザーはリアルタイムHDFS のデータと他のエンタープライズデータソースを連携できるようになります。この記事では、Denodo Virtual DataPort Administrator でHDFS の仮想データソースを作成する手順を紹介します。

最適化されたデータ処理が組み込まれたCData JDBC Driver は、リアルタイムHDFS のデータを扱う上で比類のないパフォーマンスを提供します。HDFS にSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をHDFS に直接渡し、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータ型を使ってHDFS のデータを操作および分析できます。

HDFS Virtual Port を作成

Denodo からリアルタイムHDFS のデータに接続するには、JDBC Driver のJAR ファイルをDenodo の外部ライブラリディレクトリにコピーし、Virtual DataPort Administration Tool から新しいJDBC データソースを作成する必要があります。

  1. CData JDBC Driver for HDFS インストーラーをダウンロードしてパッケージを展開し、JAR ファイルを実行してドライバーをインストールします。
  2. JAR ファイル(およびライセンスファイルがある場合はそれも)をインストール先(通常はC:\Program Files\CData\CData JDBC Driver for HDFS\lib\)からDenodo 外部ライブラリディレクトリ(C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-hdfs-19)にコピーします。
  3. Denodo Virtual DataPort Administration Tool を開き、Server Explorer タブに移動します。
  4. 「admin」を右クリックし、「New」->「Data source」->「JDBC」を選択します。 新しいJDBC データソースを作成
  5. JCBC Connection を設定します。
    • Name:任意の名前(例:hdfs)
    • Database adapter:Generic
    • Driver class path:C:\Denodo\Denodo Platform\lib-external\jdbc-drivers\cdata-hdfs-19
    • Driver class:cdata.jdbc.hdfs.HDFSDriver
    • Database URI:必要な接続プロパティを使用してJDBC のURL に設定。例えば次のようになります。

      jdbc:hdfs:Host=sandbox-hdp.hortonworks.com;Port=50070;Path=/user/root;User=root;

      JDBC コネクションを設定(NetSuite の場合)

      Database URI の作成については以下を参照してください。

      組み込みの接続文字列デザイナー

      JDBC URL の作成の補助として、HDFS JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。

      java -jar cdata.jdbc.hdfs.jar

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      HDFS 接続プロパティの取得・設定方法

      HDFS への認証には、次の接続プロパティを設定します。

      • Host:HDFS インスタンスのホストに設定してください。
      • Port: HDFS インスタンスのポートに設定してください。デフォルトのポートは"50070" です。
      組み込みの接続文字列デザイナーを使ってJDBC URL を生成(Salesforce の場合)
  6. 「接続テスト」をクリックして設定を確認し、「保存」をクリックします。

Virtual DataPort Administration Tool でHDFS のデータを表示

データソースを作成したら、Denodo Platform で使用するHDFS のデータの基本ビューを作成できます。

  1. 新しく作成したVirtualPort(admin.HDFS)で「Create base view」をクリックします。
  2. オブジェクトツリーを展開し、インポートしたいオブジェクト(テーブル)を選択します。 インポートするオブジェクトの選択(NetSuite の場合)
  3. 「Create selected」をクリックしてHDFS のデータのビューを作成します。
    オプション:「Create associations from foreign keys」をクリックして、オブジェクト間の関係を定義します。
  4. ビューを作成した状態で、Server Explorer のテーブル(cdata_hdfs_files)に移動し、選択したテーブルをダブルクリックします。
  5. 新しいタブで「Execution panel」をクリックしてクエリパネルを開きます。
  6. 「Execute」タブでクエリをカスタマイズするか、デフォルトを使用します。
    SELECT * FROM cdata_hdfs_files CONTEXT ('i18n'='us_est', 'cache_wait_for_load'='true')
    
    データを表示するクエリを設定
  7. 「Execute」をクリックすると、データが表示されます。 データを表示

基本ビューを作成すると、Denodo Platform の他のデータソースと同様にリアルタイムHDFS のデータを操作できるようになります。例えば、Denodo Data Catalog でHDFS にクエリを実行できます。

CData JDBC Driver for HDFS の30日の無償評価版をダウンロードして、Denodo Platform でリアルタイムHDFS のデータの操作をはじめましょう!ご不明な点があれば、サポートチームにお問い合わせください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。