製品をチェック

CData Connect Cloud の詳細はこちら

  30日間無償トライアルへ

Databricks のデータをPower BI Service にインポートしてビジュアライズ

CData Connect Cloud を使用してDatabricks のOData フィードを作成し、Power BI Service でカスタムレポートを作成します。

加藤龍彦
デジタルマーケティング

最終更新日:2022-03-07
databricks ロゴ

CData

cloud ロゴ画像
Power BI ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

Power BI を使えば、企業のデータを豊富なビジュアルに変換して収集および整理することができるため、重要なことだけに集中できます。CData Connect Cloud と組み合わせると、ビジュアライゼーションやダッシュボード用にDatabricks のデータにアクセスできます。この記事では、CData Connect Cloud を使用してDatabricks のOData フィードを生成し、Databricks のデータをPower BI にインポートして、Power BI サービスのDatabricks のデータに関するレポートを作成する方法について説明します。

Connect Cloud アカウントの取得

以下のステップを実行するには、CData Connect Cloud のアカウントが必要になります。こちらから製品の詳しい情報とアカウント作成、30日間無償トライアルのご利用を開始できますので、ぜひご利用ください。


Databricks とのデータ連携について

Databricks のライブデータへのアクセスと統合は、CData を活用することでかつてないほど簡単になります。ユーザーは、CData のコネクティビティを利用して以下のことを実現しています。

  • ランタイムバージョン 9.1 - 13.X 、およびPro またはClassic Databricks SQL バージョンに至るすべてのバージョンのDatabricks にアクセスできます。
  • あらゆるホスティングソリューションと互換性があるため、Databricks を希望する環境で利用できます。
  • 個人用アクセストークン、Azure サービスプリンシパル、Azure AD など、さまざまな方法でセキュアな認証を行います。
  • Databricks ファイルシステム、Azure Blog Storage、AWS S3 Storage を使用してDatabricks にデータをアップロードします。

ユーザーの多くはCData のソリューションを使用して異なるシステムからDatabricks データレイクハウスにデータを移行していますが、CData のリアルタイム接続ソリューションを使ってデータベースとDatabricks 間の接続をフェデレートしているケースもあります。このようなケースでは、SQL Server のリンクサーバーやPolybase を使用して、既存のRDBM 内からDatabricks にリアルタイムアクセスしています。

Databricks の一般的な使用事例と、CData のソリューションがデータに関する問題の解決にどのように役立つのかについては、ブログをご覧ください:What is Databricks Used For? 6 Use Cases

Connect Cloud を構成する

Power BI online でDatabricks のデータを操作するには、Connect Cloud からDatabricks に接続し、コネクションにユーザーアクセスを提供してDatabricks のデータのOData エンドポイントを作成する必要があります。

Databricks に接続したら、目的のテーブルのOData エンドポイントを作成します。

(オプション)新しいConnect Cloud ユーザーの追加

必要であれば、Connect Cloud 経由でDatabricks に接続するユーザーを作成します。

  1. ユーザーページに移動し、 Invite Users をクリックします。
  2. 新しいユーザーのE メールアドレスを入力して、 Send to invite the user をクリックします。 新しいユーザーを招待
  3. ユーザーページからユーザーを確認および編集できます。 Connect Cloud users

パーソナルアクセストークンの追加

OAuth 認証をサポートしていないサービス、アプリケーション、プラットフォーム、またはフレームワークから接続する場合は、認証に使用するパーソナルアクセストークン(PAT)を作成できます。きめ細かなアクセス管理を行うために、サービスごとに個別のPAT を作成するのがベストプラクティスです。

  1. Connect Cloud アプリの右上にあるユーザー名をクリックし、User Profile をクリックします。
  2. User Profile ページでPersonal Access Token セクションにスクロールし、 Create PAT をクリックします。
  3. PAT の名前を入力して Create をクリックします。 Creating a new PAT
  4. パーソナルアクセストークンは作成時にしか表示されないため、必ずコピーして安全に保存してください。

Connect Cloud からDatabricks に接続

CData Connect Cloud では、簡単なクリック操作ベースのインターフェースでデータソースに接続できます。

  1. Connect Cloud にログインし、 Add Connection をクリックします。 コネクションを追加
  2. Add Connection パネルから「Databricks」を選択します。 Selecting a data source
  3. 必要な認証プロパティを入力し、Databricks に接続します。

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。

    Note:Databricks インスタンスで必要な値は、クラスターに移動して目的のクラスターを選択し、Advanced Options の下にあるJDBC/ODBC タブを選択することで見つけることができます。

    • Database:Databricks データベース名に設定。
    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • Token:個人用アクセストークンに設定(この値は、Databricks インスタンスのユーザー設定ページに移動してアクセストークンタブを選択することで取得できます)。
    Configuring a connection (Salesforce is shown)
  4. Create & Test をクリックします。
  5. Edit Databricks Connection ページのPermissions タブに移動し、ユーザーベースのアクセス許可を更新します。 権限を更新

Connect Cloud にDatabricks OData エンドポイントを追加する

Databricks に接続したら、目的のテーブルのOData エンドポイントを作成します。

  1. OData ページに移動し、 Add to create new OData endpoints をクリックします。
  2. Databricks コネクション(例:Databricks1)を選択し、Next をクリックします。
  3. 使用するテーブルを選択し、Confirm をクリックします。 テーブルを選択(Salesforce の例)

接続とOData エンドポイントが構成されたら、Power BI online からDatabricks のデータに接続できるようになります。

Power BI Desktop からデータセットを公開する

Connect Cloud にOData エンドポイントを追加すると、OData 接続を使用してPower BI Desktop にデータセットを作成し、そのデータセットをPower BI サービスに公開できます。

  1. Power BI を開いて「データを取得」-->「詳細」とクリックし、OData フィードを選択して「接続」をクリックします。
  2. Create a new connection in Power BI
  3. URL をConnect Cloud インスタンスのBase URL(例: https://cloud.cdata.com/api/odata/service)に設定し、「OK」をクリックします。
  4. ユーザー名パスワード を上記のユーザー名とPAT に設定します。
  5. 設定を適用するレベルとして、フルのBase URL(https://cloud.cdata.com/api/odata/service)を選択します。 Connect to Cdata Connect Cloud instance
  6. 「ナビゲーター」ダイアログでテーブルを選択し、ビジュアライズします。
  7. 「読み込み」をクリックしてPower BI にデータをプルします。
  8. 「リレーションシップ」タブで選択したエンティティ間の関連を定義します。
  9. 「ホーム」メニューから「発行」をクリックして「ワークスペース」を選択します。

Power BI Service のDatabricks のデータでレポートとダッシュボードを作成します。

Power BI サービスにデータセットを公開したので、公開されたデータに基づいて新しいレポートとダッシュボードを作成できます。

  1. PowerBI.com にログインします。
  2. 「ワークスペース」をクリックし、ワークスペースを選択します。
  3. 「作成」をクリックし、「レポート」を選択します。
  4. レポート用に公開されたデータセットを選択します。 Select a dataset
  5. フィールドとビジュアライゼーションを選択してレポートを追加します。 Power BI サービスでDatabricks のデータをビジュアライズ

クラウドアプリケーションからDatabricks のデータへのSQL アクセス

Power BI サービスからリアルタイムDatabricks のデータへの直接接続ができるようになりました。これで、Databricks を複製せずにより多くのデータソースや新しいビジュアライゼーション、レポートを作成することができます。

クラウドアプリケーションから直接100を超えるSaaS 、ビッグデータ、NoSQL ソースへのリアルタイムデータアクセスを取得するには、CData Connect Cloud をお試しください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。