製品をチェック

CData Connect Cloud の詳細はこちら

  30日間無償トライアルへ

Azure Data Factory を使用してAzure Data Lake Storage データをインポート

CData Connect Cloud を使用してAzure Data Factory からAzure Data Lake Storage に接続し、リアルタイムAzure Data Lake Storage データをインポートします。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-12-01
azuredatalake ロゴ

CData

cloud ロゴ画像
Azure Data Factory ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

Azure Data Factory(ADF)は、フルマネージドのサーバーレスデータ統合サービスです。 CData Connect Cloud と組み合わせると、ADF はデータフローでAzure Data Lake Storage データにクラウドベースで即座にアクセスできます。 この記事では、Connect Cloud を使用してAzure Data Lake Storage に接続し、ADF でAzure Data Lake Storage データにアクセスする方法を紹介します。

CData Connect Cloud とは?

CData Connect Cloud は、以下のような特徴を持ったクラウド型のリアルタイムデータ連携製品です。

  • SaaS やクラウドデータベースを中心とする150種類以上のデータソース
  • BI、アナリティクス、ETL、ローコードツールなど30種類以上のツールやアプリケーションから利用可能
  • リアルタイムのデータ接続に対応。データの複製を作る必要はありません
  • ノーコードでシンプルな設定

詳しくは、こちらの製品資料をご確認ください。

Connect Cloud アカウントの取得

以下のステップを実行するには、CData Connect Cloud のアカウントが必要になります。こちらから製品の詳しい情報とアカウント作成、30日間無償トライアルのご利用を開始できますので、ぜひご利用ください。


Connect Cloud からAzure Data Lake Storage への接続

CData Connect Cloud では、直感的なクリック操作ベースのインターフェースを使ってデータソースに接続できます。

  1. Connect Cloud にログインし、 Add Connection をクリックします。
  2. Adding a Connection
  3. Add Connection パネルで「Azure Data Lake Storage」を選択します。
  4. Selecting a data source
  5. 必要な認証プロパティを入力し、Azure Data Lake Storage に接続します。

    Azure Data Lake Storage 接続プロパティの取得・設定方法

    Azure Data Lake Storage Gen 2 への接続

    Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

    • Account:ストレージアカウントの名前。
    • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
    • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

    Azure Data Lake Storage Gen 2 への認証

    本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

    アクセスキー

    アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

    Azure ポータルで:

    1. ADLS Gen2 ストレージアカウントにアクセスします。
    2. 設定でアクセスキーを選択します。
    3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
    4. 接続の準備ができたら、次のプロパティを設定します。

      • AuthSchemeAccessKey
      • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

    共有アクセス署名(SAS)

    共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

    接続の準備ができたら、次のプロパティを設定します。

    • AuthSchemeSAS
    • SharedAccessSignature:先に生成した共有アクセス署名の値。

    AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

    Configuring a connection (Salesforce is shown)
  6. Create & Test をクリックします。
  7. Add Azure Data Lake Storage Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 Updating permissions

パーソナルアクセストークンの取得

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。 きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect Cloud アプリの右上にあるユーザー名をクリックし、「User Profile」をクリックします。
  2. User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
  3. PAT の名前を入力して Create をクリックします。
  4. Creating a new PAT
  5. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

接続設定が完了すると、Azure Data Factory からAzure Data Lake Storage データへ接続できるようになります。

Azure Data Factory からリアルタイムAzure Data Lake Storage データにアクセス

Azure Data Factory からCData Connect Cloud の仮想SQL Server API への接続を確立するには、以下の手順を実行します。

  1. Azure Data Factory にログインします。
  2. Logging in to ADF
  3. まだData Factory を作成していない場合は、「New -> Dataset」をクリックします。
  4. Creating new data factory
  5. 検索バーにSQL Server と入力し、表示されたら選択します。次の画面で、サーバーの名前を入力します。 Linked service フィールドで「New」を選択します。
  6. Selecting SQL Server
  7. 接続設定を入力します。
    • Name - 任意の名前を入力。
    • Server name - 仮想SQL Server のエンドポイントとポートをカンマで区切って入力。例:tds.cdata.com,14333
    • Database name - 接続したいCData Connect Cloud データソースのConnection Name を入力。例:ADLS1
    • User Name - CData Connect Cloud のユーザー名を入力。ユーザー名はCData Connect Cloud のインターフェースの右上に表示されています。 例:[email protected]
    • Password - Password(Azure Key Vault ではありません)を選択してSettings ページで生成したPAT を入力。
    • 「Create」をクリックします。
  8. Configuring new linked service
  9. Set properties で、Name を設定し、続けて先ほど作成したLinked service、利用可能なTable name、Import schema のfrom connection/store を選択します。 「OK」をクリックします。
  10. Setting the properties
  11. リンクされたサービスを作成すると、以下の画面が表示されます。
  12. Displaying the new screen
  13. Preview data をクリックすると、インポートされたAzure Data Lake Storage テーブルが表示されます。
  14. Previewing the imported table Azure Data Factory でデータフローを作成する際、このデータセットを使用できるようになりました。

CData Connect Cloud の入手

CData Connect Cloud の30日間無償トライアルを利用して、クラウドアプリケーションから直接100を超えるSaaS、ビッグデータ、NoSQL データソースへのSQL アクセスをお試しください!

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。