ノーコードでクラウド上のデータとの連携を実現。
詳細はこちら →CData
こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Power BI を使えば組織のデータをリッチなビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect Cloud と組み合わせると、ビジュアライゼーションやダッシュボード用にAzure Data Lake Storage データにクラウドベースでアクセスできます。この記事では、Power BI のAzure Data Lake Storage データからデータセットを構築して公開し、Power BI サービスのAzure Data Lake Storage データに関するレポートを作成する方法について説明します。
CData Connect Cloud は、ピュアSQL のクラウドインターフェースをAzure Data Lake Storage に提供し、データを複製せずにPower BI のリアルタイムAzure Data Lake Storage データと簡単に統合できるようにします。ビジュアライゼーションを作成すると、Power BI はデータを収集するためのSQL クエリを生成します。CData Connect Cloud は、最適化されたデータ処理を使用してサポートされているすべてのSQL 操作(フィルタ、JOIN など)をAzure Data Lake Storage に直接プッシュし、サーバー側の処理を利用して、要求されたAzure Data Lake Storage データを高速で返します。
Gen 1 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。
Gen 1 は、認証方法としてAzure Active Directory OAuth(AzureAD)およびマネージドサービスID(AzureMSI)をサポートしています。認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 1 への認証」セクションを参照してください。
Gen 2 DataLakeStorage アカウントに接続するには、はじめに以下のプロパティを設定します。
Gen 2は、認証方法としてアクセスキー、共有アクセス署名(SAS)、Azure Active Directory OAuth(AzureAD)、マネージドサービスID(AzureMSI)など多様な方法をサポートしています。AzureAD、AzureMSI での認証方法は、ヘルプドキュメントの「Azure DataLakeStorage Gen 2 への認証」セクションを参照してください。
アクセスキーを使用して接続するには、AccessKey プロパティを取得したアクセスキーの値に、AuthScheme を「AccessKey」に設定します。
Azure ポータルからADLS Gen2 ストレージアカウントのアクセスキーを取得できます。
共有アクセス署名を使用して接続するには、SharedAccessSignature プロパティを接続先リソースの有効な署名に設定して、AuthScheme を「SAS」に設定します。 共有アクセス署名は、Azure Storage Explorer などのツールで生成できます。
OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。
コネクションが構成されたら、Power BI からAzure Data Lake Storage に接続できるようになります。
Power BI サービスでリアルタイムAzure Data Lake Storage データに接続してビジュアライズするには、オンプレミスデータゲートウェイをインストールしてPower BI サービスからゲートウェイにデータソースを追加し、Power BI Desktop からサービスにデータセットを公開します。
Microsoft オンプレミスデータゲートウェイは、接続されたデータソースとさまざまなクラウドベースのMicrosoft ツールおよびプラットフォーム間の安全なデータ転送を提供します。ゲートウェイの詳細については、Microsoft のドキュメントを参照してください。
Power BI サービスからゲートウェイをダウンロードし、インストールできます。
データゲートウェイをインストールしたら、Connect Cloud をデータソースとしてPower BI サービスに追加します。
ゲートウェイをインストールし、Connect Cloud をデータソースとしてPower BI サービスに追加すると、Power BI Desktop からサービスにデータセットを公開できます。
「Query Editor」では、Azure Data Lake Storage カラムをフィルタリング、並べ替え、要約することでデータセットをカスタマイズできます。「Edit」をクリックしてクエリエディタを開きます。行をフィルタするには、行を右クリックします。カラムヘッダーを右クリックして、次のオプションを実行します。
Power BI は、Connect Cloud によって報告されたAzure Data Lake Storage メタデータから、各カラムのデータタイプを検出します。
Power BI は、クエリへの変更を「Applied Steps」セクションに記録し、リモートAzure Data Lake Storage データに対して実行される、基礎となるデータ取得クエリを調整します。「Close and Apply」をクリックすると、Power BI はデータ取得クエリを実行します。
もしくは、「Load」をクリックしてデータをPower BI にプルします。
Power BI サービスにデータセットを公開したので、公開されたデータに基づいて新しいレポートとダッシュボードを作成できます。
Power BI サービスからAzure Data Lake Storage データへリアルタイムで直接接続ができるようになりました。これで、Azure Data Lake Storage を複製せずにより多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。
クラウドアプリケーションから直接100を超えるSaaS 、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect Cloud をお試しください。