製品をチェック

Azure Data Lake Storage Power BI Connector の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Azure Data Lake Storage アイコン Azure Data Lake Storage Power BI Connector 相談したい

Azure Data Lake Storage データにPower BI から接続する最適解。ハイパフォーマンスなデータアクセス、リアルタイム連携、拡張メタデータ検出、強力なSQL-92 サポートを提供。

リアルタイムAzure Data Lake Storage データをPowerBI.com にパブリッシュ(発行)

CData Power BI Connectors をPowerBI.com に接続するオンプレミスゲートウェイでリアルタイムデータを組織内で使用可能に。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-07-18
azuredatalake ロゴ

CData

powerbi ロゴ画像
Power BI ロゴ

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

CData Power BI Connector for ADLS は、Power BI のツールおよびウイザードにシームレスに統合します。PowerBI.com へのリアルタイムデータのパブリッシュも可能です。次のステップで、Power BI Gateway を使って、自動リフレッシュ設定で、データをPower BI に公開します。

Power BI データソースとしてAzure Data Lake Storage を設定

CData Power BI Connector をインストールすると完了後にDSN 設定画面が開きます。ここでAzure Data Lake Storage への接続を設定します。

接続作業はWindows のODBC データソースアドミニストレータでも設定可能です。CData PowerBI REST DSN を選択します。 Power BI のbit 数(32 bit or 64 bit)に合わせたアドミニストレータを使うように気を付けてください。DSN 設定画面で必要な項目を入力してAzure Data Lake Storage データに接続します。入力後に接続のテストを行い、OK を押して接続を確立します。

Azure Data Lake Storage 接続プロパティの取得・設定方法

Azure Data Lake Storage Gen 2 への接続

Gen 2 Data Lake Storage アカウントに接続するには、以下のプロパティを設定します。

  • Account:ストレージアカウントの名前。
  • FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前。
  • Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます。

Azure Data Lake Storage Gen 2 への認証

本製品は、次の4つの認証方法をサポートします:アクセスキーの使用、共有アクセス署名の使用、Azure Active Directory OAuth(AzureAD)、Managed Service Identity(AzureMSI)。

アクセスキー

アクセスキーを使用して接続するには、はじめにADLS Gen2 ストレージアカウントで利用可能なアクセスキーを取得する必要があります。

Azure ポータルで:

  1. ADLS Gen2 ストレージアカウントにアクセスします。
  2. 設定でアクセスキーを選択します。
  3. 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします。
  4. 接続の準備ができたら、次のプロパティを設定します。

    • AuthSchemeAccessKey
    • AccessKey:先にAzure ポータルで取得したアクセスキーの値。

共有アクセス署名(SAS)

共有アクセス署名を使用して接続するには、はじめにAzure Storage Explorer ツールを使用して署名を生成する必要があります。

接続の準備ができたら、次のプロパティを設定します。

  • AuthSchemeSAS
  • SharedAccessSignature:先に生成した共有アクセス署名の値。

AzureAD、AzureMSI での認証方法については、ヘルプドキュメントの「Azure Data Lake Storage Gen 2 への認証」セクションを参照してください。

Azure Data Lake Storage テーブルをPower BI からクエリ

次の手順でAzure Data Lake Storage からデータをPower BI からクエリできるようにします:

  1. Power BI Desktop を開き、[データ]->[データを取得]->[その他]-> CData ADLS を選択して接続を押します。次にサードパーティドライバーのプロンプトが出る場合には、そのまま続行します。
  2. CData PowerBI Azure Data Lake Storage を[Data Source Name]欄に入力します。データ接続モードを選択します:
    インポート データをプロジェクトにインポートする。オンデマンドで更新が可能。
    DirectQuery リモートデータに直接アクセスする場合。
  3. ナビゲーターダイアログで使用するテーブルを選択します。 The available tables. (Salesforce is shown.)
  4. [データの変換]では、データをカスタマイズすることができます。クエリエディタを開いて、フィルタ、ソート、集計を設定できます。

    • カラムのデータ型の変更
    • カラムの削除
    • カラムのグルーピング

    Power BI は、コネクタが取得・検出したAzure Data Lake Storage のカラム毎のデータ型をそのまま使えます。

    Power BI は、データ変換を取得して、指定した条件でクエリを発行し、Azure Data Lake Storage からデータを取得します。

    [読み込み]をクリックすると、そのままのデータがコネクタ経由でPower BI にロードされます。

データビジュアライゼーションを作成

データをPower BI から取得したら、レポートビューで取得したAzure Data Lake Storage フィールドをドラッグ&ドロップしてビジュアライゼーションを作成します。チャートの種類を可視化ペインから選択し、フィールドのカラムをドラッグして設定します。

A pie chart showing Account Names and Annual Revenue from Salesforce.

チャートの右上をクリックしてソートオプションを変更することもできます。

チャートの部分のハイライトも可能です。

A highlighted account in a pie chart. (Salesforce is shown.)

取得したデータのビジュアライズ上でのフィルタリングをフィルタリングペインで行うことができます。

Accounts and Annual Revenue filtered by Industry. (Salesforce is shown.)

[更新]をクリックするとその時点でのリアルタイムデータをAzure Data Lake Storage から取得してレポートに反映させることができます。

オンプレミスデータゲートウェイでのPowerBI.com へのデータリフレッシュの設定

次の手順でPower BI オンプレミスゲートウェイ を使って、ローカルに設定したDSN のAzure Data Lake Storage データをPower BI のクラウド上から定期的にリフレッシュすることが可能です。

ゲートウェイモードの選択

まずはゲートウェイのモードを選択します。

  • Gateway (個人用モード): Power BI にのみパブリッシュしてリフレッシュする場合はこちらを選択。ゲートウェイはWindows ユーザーアカウントで起動します。
  • Gateway (formerly Enterprise): ほかのAzure サービスでゲートウェイが必要な場合には、こちらを選択します。また、複数のユーザーがゲートウェイにアクセスする場合にもデフォルトゲートウェイが必要です。
    デフォルトゲートウェイでアクセスする場合にはシステムDSN で接続する必要があります。ユーザーDSN だと特定のアカウントのみがアクセスでき、システムDSN のようにシステム全体からアクセスすることができないためです。CData Power BI ADLS system DSN は、コネクタのインストールの最後のステップで設定します。

個人用モードゲートウェイの設定

Personal モードでのゲートウェイでのパブリッシュは、カスタムコネクタにアクセスできるゲートウェイをインストールする必要があります。

  1. CData Power BI Connector インストーラーを実行します。ダウンロードはこちらから 可能です。
  2. on-premises data gateway (personal mode) オプションを選択します。
  3. ゲートウェイにサインインします。
  4. ゲートウェイ名を設定し、Recovery Key を指定します。
  5. コネクタセクションで、カスタムデータコネクタオプションを有効化します。.pqx ファイルが置かれたパスをオルタナティブパスとして設定することもできます。
    Note: CData Power BI Connectors は、デフォルトフォルダ(Your User Home\Documents\Power BI Desktop\Custom Connectors)に.pqx ファイルをインストールします。

ゲートウェイの設定

ゲートウェイ経由のパブリッシュには、コネクタへのアクセスが可能なゲートウェイのインストールとPowerBI.com からのAzure Data Lake Storage DSN への接続が必要です。

1. ゲートウェイのセットアップ

次の手順でマシン上にゲートウェイを設定します:

  1. CData Power BI Connector インストーラーを起動します。Power BI Gateway のダウンロード も必要です。
  2. on-premises data gateway (recommended) オプションを選択します。
  3. ゲートウェイにサインインします。
  4. ゲートウェイ名を設定し、Recovery Key を指定します。
  5. ゲートウェイがCData Power BI Connector を見に行くフォルダを指定します。この記事では C:\Users\PBIEgwService\Documents\Power BI Desktop\Custom Connectors\ を使います。CData Connector の.pqx ファイル(C:\Users\USERNAME\Documents\Power BI Desktop\Custom Connectors\) を指定したフォルダに移します。

    NOTE: 指定されたサービスアカウント(NT SERVICE\PBIEgwService) は、ゲートウェイのアクセスフォルダに指定される必要があります。必要な場合には、ゲートウェイインストーラーのサービス設定で変更ができます。

  6. コネクタセクションで、CData.PowerBI.ADLS が表示されていることを確認します。 CData Power BI Connectors in the On-Premises Data Gateway.

2. PowerBI.com からAzure Data Lake Storage データに接続する

  1. ゲートウェイにデータソースを追加: PowerBI.com にログインして、設定メニューから[ゲートウェイの管理]を選択して、ゲートウェイクラスターの設定を実行。
  2. [このゲートウェイクラスターでユーザーのクラウドデータソースを更新することを許可する]オプションをクリック。
  3. 適用を押して設定を保存します。
  4. 続いてCData Power BI Connectorをデータソースとして追加します。
  5. データソース設定セクションで、データソース名を入力し、データソースの種類にはCData Power BI Connector for ADLS をドロップダウンから選択します。
  6. Data Source Name には、システムDSN 名を入力します:CData Power BI ADLS。
  7. 設定後[すべての接続をテスト]ボタンをクリックし、[接続成功]が表示されれば、設定完了です。

PowerBI.com へのパブリッシュ

これでAzure Data Lake Storage データソースに連携してデータを更新できるレポートが発行できます。次の手順でデータセットを含むレポートをパブリッシュします。

  1. Power BI Desktop で、[発行]ボタンを押して、レポートをPower BI へパブリッシュします。
  2. PowerBI.com で、発行したワークスペースを選択します。
  3. [データセット]セクションで、設定したAzure Data Lake Storage データセットのオプションメニューをクリックして、[設定]をクリックします。
  4. [ゲートウェイ接続]セクションで、[データゲートウェイを使用する]を有効にします。状態がグリーンであることを確認し、適用を押して保存します。
  5. 個人用モードでのゲートウェイ理世うでは、[データソースクレデンシャル]をクリックして、サインインします。

データセットの更新(リフレッシュ)

これでPower BI サイドからレポートのデータをAzure Data Lake Storage の最新のデータに更新できるようになりました。

  • データの手動更新には、[ワークスペース]-> データセット]に進み、更新ボタンをクリックします。
  • スケジュール更新には、[ワークスペース]->[データセット]に進み、更新のスケジュールをクリックします。データの更新オプションを有効にして、更新頻度を設定します。
  • レポートビューでは、更新を押してレポートを最新のデータに同期できます。

The uploaded Power BI report. (Salesforce is shown.)

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。