製品をチェック

Azure Data Lake Storage Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage JDBC Driver 相談したい

Azure Data Lake Storage データに連携するJava アプリケーションを素早く、簡単に開発できる便利なドライバー。

SnapLogic でAzure Data Lake Storage を外部サービスに連携

CData JDBC Driver を使用して、SnapLogic と外部サービスを連携。

古川えりか
コンテンツスペシャリスト

最終更新日:2021-11-05
azuredatalake ロゴ

CData

jdbc ロゴ画像
SnapLogic ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

SnapLogic はintegration Platform-as-a-Service(iPaaS)であり、ユーザーはノーコードでデータ連携フローを作成できます。CData JDBC ドライバと組み合わせることで、ユーザーはSnapLogic ワークフローからAzure Data Lake Storage を含む250を超えるSaaS、ビッグデータ、NoSQL データソースのリアルタイムデータに接続できます。

組み込みの最適化されたデータ処理によって、CData JDBC Driver はリアルタイムAzure Data Lake Storage データを高速に扱えます。プラットフォームがAzure Data Lake Storage に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をAzure Data Lake Storage に直接プッシュし、サポートされていない操作(主にSQL 関数とJOIN 操作)は組み込みSQL エンジンを利用してクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、ネイティブデータソース型を使用してAzure Data Lake Storage データを操作することができます。

SnapLogic からAzure Data Lake Storage に接続する

SnapLogic からAzure Data Lake Storage データに接続するには、CData Azure Data Lake Storage JDBC Driver をダウンロードしてインストールします。インストール画面に従ってください。インストールが完了すると、インストール先のディレクトリ(デフォルトでは、C:/Program Files/CData/CData JDBC Driver for ADLS/lib)にJAR ファイルが作成されます。

Azure Data Lake Storage JDBC Driver をアップロードする

インストール後、JDBC JAR ファイルをSnapLogic 内のディレクトリ(例えば、projects/Jerod Johnson)にManager タブからアップロードします。

アップロードされたJDBC Driver(Salesforce とQuickBooks Online の場合)

接続を設定する

JDBC Driver がアップロードされると、Azure Data Lake Storage への接続を作成できます。

  1. Designer タブに移動します。
  2. Snaps から「JDBC」を展開して、「Generic JDBC - Select」snap をdesigner にドラッグします。 designer にGeneric JDBC snap を追加
  3. Add Account をクリック(または既存のものを選択)して、「Continue」をクリックします。
  4. 次のフォームでは、JDBC 接続プロパティを設定します。
    • JDBC JARs 以下にアップロードしたJAR ファイルを追加します。
    • JDBC Driver Classcdata.jdbc.adls.ADLSDriver に設定します。
    • JDBC URL をAzure Data Lake Storage JDBC Driver 用のJDBC 接続文字列に設定します。例えば、

      jdbc:adls:Schema=ADLSGen2;Account=myAccount;FileSystem=myFileSystem;AccessKey=myAccessKey;RTK=XXXXXX;InitiateOAuth=GETANDREFRESH
      です。

      NOTE: RTK は評価版もしくは製品版のキーです。詳しくは、CData のサポートチームにご連絡ください接続を設定(Salesforce の場合)

      組み込みの接続文字列デザイナー

      JDBC URL の作成の補助として、Azure Data Lake Storage JDBC Driver に組み込まれている接続文字列デザイナーが使用できます。JAR ファイルをダブルクリックするか、コマンドラインからjar ファイルを実行します。

      java -jar cdata.jdbc.adls.jar

      接続プロパティを入力し、接続文字列をクリップボードにコピーします。

      Azure Data Lake Storage 接続プロパティの取得・設定方法

      Azure Data Lake Storage Gen 2 への接続

      Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

      • Account:ストレージアカウントの名前。
      • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
      • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

      Azure Data Lake Storage Gen 2 への認証

      本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

      アクセスキー

      アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

      Azure ポータルで:

      1. ADLS Gen2 ストレージアカウントにアクセスします。
      2. 設定でアクセスキーを選択します。
      3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
      4. 接続の準備ができたら、次のプロパティを設定します。

        • AuthSchemeAccessKey
        • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

      共有アクセス署名(SAS)

      共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

      接続の準備ができたら、次のプロパティを設定します。

      • AuthSchemeSAS
      • SharedAccessSignature:先に生成した共有アクセス署名の値。

      AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

      組み込みの接続文字列デザイナーを使ってJDBC URL を生成(Salesforce の場合)
  5. 接続プロパティの入力後、「Validate」、そして「Apply」をクリックします。

Azure Data Lake Storage データを読み込む

接続を検証、適用後に開くフォームで、クエリを設定します。

  • Schema name を"ADLS" に設定します。
  • Table name を、スキーマ名を使用したAzure Data Lake Storage 用のテーブルに設定します。例えば、"ADLS"."Resources" です(ドロップダウンを使用して利用可能なテーブルの全リストを確認できます)。
  • テーブルから、使用したい項目ごとにOutput fields を追加します。
Select snap を設定(Salesforce の場合)

Generic JDBC - Select snap を保存します。

接続とクエリを設定したら、snap の終端部分(以下のハイライト部分)をクリックしてデータをプレビューします。

snap の終端部分をクリックしてデータをプレビュー。

結果が期待どおりのものであることを確認したら、他のsnap を追加してAzure Data Lake Storage データを別のエンドポイントに渡すこともできます。

データをプレビュー(Salesforce の場合)。

Azure Data Lake Storage データを外部サービスにパイプ

本記事では、データをGoogle Spreadsheet にロードします。他のあらゆるサポートされているsnap が使用でき、Generic JDBC snap を他のCData JDBC ドライバと利用してデータを外部サービスに移すこともできます。

  1. まず、「Worksheet Writer」snap を"Generic JDBC - Select" snap の終端部分にドロップします。
  2. Google Sheets に接続するアカウントを追加します。 Google に接続
  3. Worksheet Writer snap を、Azure Data Lake Storage データをGoogle Spreadsheet に書き込むよう設定します。 Google Spreadsheet に書き込み

これで、接続済みのパイプラインを実行してAzure Data Lake Storage からデータを抽出し、Google Spreadsheet にプッシュできます。

Google Spreadsheets に書き込まれたデータ(Salesforce の場合)

詳細情報と無償評価版

CData JDBC Driver for ADLS を使えば、Azure Data Lake Storage データを外部サービスに連携するためのパイプラインをSnapLogic で作成できます。Azure Data Lake Storage への接続に関する詳細については、CData のAzure Data Lake Storage 連携ページを参照してください。30日の無償評価版をダウンロードして今すぐ使い始めましょう。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。