各製品の資料を入手。
詳細はこちら →こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。
Power BI を使えば会社のデータを美しいビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect Server と組み合わせると、ビジュアライゼーションやダッシュボードなどのためにParquet のデータを使用できます。この記事では、Power BI のParquet のデータからデータセットをデータ構築して公開し、Power BI サービスのParquet のデータに関するレポートを作成する方法について説明します。
CData Connect Server は、Parquet に純粋なSQL インターフェースを提供し、データベースにデータを複製することなくPower BI のリアルタイムParquet のデータから簡単にレポートを作成できるようにします。ビジュアライゼーションを作成する際には、Power BI がデータを収集するためのSQL クエリを生成します。CData Connect Server は、最適化されたデータ処理を使用してサポートされているすべてのSQL 操作(フィルタ、JOIN など)をParquet に直接プッシュし、サーバーサイドの処理を利用して、Parquet のデータを素早く返します。
注意:(オンプレミスゲートウェイを使用する代わりに)Connect Server を介してParquet のデータをPower BI にインポートすることもできます。詳細については、関連するKnowledge Base の記事を参照してください。
CData Connect Server は、簡単なポイントアンドクリックインターフェースを使用してAPI を生成します。
ローカルのParquet ファイルに接続するには、URI 接続プロパティをParquet ファイルへのパスに設定してください。
Power BI サービスでリアルタイムParquet のデータに接続してビジュアライズするには、オンプレミスデータゲートウェイをインストールしてPower BI サービスからゲートウェイにデータソースを追加し、Power BI Desktop からサービスにデータセットを公開します。
Microsoft オンプレミスデータゲートウェイは、接続されたデータソースとさまざまなMicrosoft ツールおよびプラットフォーム間の安全なデータ転送を提供します。ゲートウェイの詳細については、Microsoft のドキュメントを参照してください。
Power BI サービスからゲートウェイをダウンロードし、インストールできます。
データゲートウェイをインストールしたら、Connect Server をデータソースとしてPower BI サービスに追加します。
ゲートウェイをインストールし、Connect Server をデータソースとしてPower BI サービスに追加すると、Power BI Desktop からサービスにデータセットを公開できます。
「Query Editor」では、Parquet カラムをフィルタリング、並べ替え、要約することでデータセットをカスタマイズできます。「Edit」をクリックしてクエリエディタを開きます。行をフィルターするには、行を右クリックします。カラムヘッダーを右クリックして、次のようなアクションを実行します。
Power BI は、Connect Server によって報告されたParquet メタデータから、各カラムのデータタイプを検出します。
Power BI は、クエリへの変更を「Applied Steps」セクションに記録し、リモートParquet のデータに対して実行される、基礎となるデータ取得クエリを調整します。「Close and Apply」をクリックすると、Power BI はデータ取得クエリを実行します。
もしくは、「Load」をクリックしてデータをPower BI にプルします。
Power BI サービスにデータセットを公開したので、公開されたデータに基づいて新しいレポートとダッシュボードを作成できます。
Power BI サービスからリアルタイムParquet のデータへの直接接続ができるようになりました。これで、Parquet を複製せずにより多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。
アプリケーションから直接250+ SaaS 、Big Data 、NoSQL ソースへのSQL データアクセスを取得するには、CData Connect Server を参照してください。