製品をチェック

Azure Data Lake Storage Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage JDBC Driver 相談したい

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

Azure Data Lake Storage データをDataiku DSS にロードして分析処理を行う方法:CData JDBC Driver

CData JDBC ドライバを使って、データサイエンスソフトのDataiku Data Science Studio で Azure Data Lake Storage データ を分析処理。

宮本航太
プロダクトスペシャリスト

最終更新日:2022-05-20
azuredatalake ロゴ

CData

jdbc ロゴ画像
Dataiku DSS ロゴ

こんにちは!プロダクトスペシャリストの宮本です。

Dataiku Data Science Studio (DSS) www.dataiku.com/は 開発者およびアナリスト向けのデータサイエンスプラットフォームです。

データベース、ファイル系を中心につなぎ先が色々とあります。その中に 「Custom connectivity through JDBC」とあるので、今回はそこに CData JDBC ドライバを組み込む内容となっています。
この記事では、Dataiku DSS で CData JDBC Driverを利用してAzure Data Lake Storage データを扱う方法を紹介します。

Dataiku DSS に JDBC Driver for ADLSを配置する

  • CData JDBC Driver for ADLS をインストールします。
  • インストールが完了すると、lib ディレクトリに以下のようにjarファイル、licファイルが置かれました。
  • user@LAPTOP-T1M78GUR:~/cdata/adls$ cd lib/ user@LAPTOP-T1M78GUR:~/cdata/adls/lib$ ll total 7556 drwxr-xr-x 1 root root 4096 Feb 28 12:06 ./ drwxr-xr-x 1 root root 4096 Feb 28 12:06 ../ -rw-r--r-- 1 root root 7685088 Feb 27 14:53 cdata.jdbc.adls.jar -rw-r--r-- 1 root root 368 Feb 28 12:06 cdata.jdbc.adls.lic -rw-r--r-- 1 root root 951 Feb 27 14:40 cdata.jdbc.adls.remoting.ini
  • 次に、jar ファイルと lic ファイルを Dataikuの DSS から参照できるよう以下のディレクトリに配置します。
  • user@LAPTOP-T1M78GUR:~/cdata/adls/lib$ cp -p cdata.jdbc.adls.jar /home/user/DATA_DIR/lib/jdbc/ user@LAPTOP-T1M78GUR:~/cdata/adls/lib$ cp -p cdata.jdbc.adls.lic /home/user/DATA_DIR/lib/jdbc/ user@LAPTOP-T1M78GUR:~/cdata/adls/lib$ ll /home/user/DATA_DIR/lib/jdbc/ total 8064 drwxr-xr-x 1 user user 4096 Feb 28 12:15 ./ drwxr-xr-x 1 user user 4096 Feb 26 17:20 ../ -rw-r--r-- 1 user user 7685088 Feb 27 14:53 cdata.jdbc.adls.jar -rw-r--r-- 1 user user 368 Feb 28 12:06 cdata.jdbc.adls.lic user@LAPTOP-T1M78GUR:~/cdata/adls/lib$
  • これで、DSS に CData ADLS JDBC Driver を組み込むことができました。

Data Science Studio(DSS)で Azure Data Lake Storage データ データにアクセスする

  • 「NEW PROJECT」→ 「Blank Project」をクリックします。
  • Dataiku
  • データセットを作成していきます。「IMPORT YOUR FIRST DATASET」をクリックします。
  • Dataiku
  • ここでは、「Other SQL」を選択します。
  • Dataiku
  • 「IMPORT YOUR FIRST DATASET」をクリックしてください。
  • Dataiku
  • 「+ NEW CONNECTION」を選択します。
  • Dataiku
  • 「Other SQL databases」をクリックします。
  • Dataiku
  • 以下の内容を入力し、接続確認を行います。
    • Connection Name: 任意
    • JDBC driver class: cdata.jdbc.adls.ADLSDriver
    • JDBC URL: jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;InitiateOAuth=GETANDREFRESH
  • Dataiku
  • 接続ができたら、横の「CREATE」ボタンを押して設定した内容を保存します。
  • またプロジェクト画面から「IMPORT YOUR FIRST DATASET」→「Other SQL」で以下の画面を呼び出します。 ここでは、先ほど登録した Azure Data Lake Storage がデータソースとして選べるようになっています。赤枠にあるように、 Azure Data Lake Storage のオブジェクトがテーブル一覧になって表示することができました。
  • Dataiku
  • プレビューからデータの中身を参照することができました。
  • Dataiku
  • あとは通常のRDB データセットと同じようにプロジェクトで作成したデータセットを使って分析や可視化を行います。
  • Dataiku

    このようにCData JDBC ドライバを使ってすることで、簡単にDataiku DSS でAzure Data Lake Storage データ データをノーコードで連携し、分析に使うことが可能です。

    是非、CData JDBC Driver for ADLS 30日の無償評価版 をダウンロードして、お試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。