製品をチェック

Apache Spark Data Provider の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ADO.NET Provider 相談したい

Apache Spark 連携のパワフルな.NET アプリケーションを素早く作成して配布。

SSAS でSpark のデータに連携するOLAP Cube を作成

Spark のデータプロバイダーを利用してAnalysis Services プロジェクト内のSpark に接続し、アナリティクスやレポーティングなどで使えるOLAP キューブを構築します。

加藤龍彦
デジタルマーケティング

最終更新日:2022-04-10
spark ロゴ

CData

ado ロゴ画像
Microsoft SSAS ロゴ

こんにちは!ウェブ担当の加藤です。マーケ関連のデータ分析や整備もやっています。

SQL Server Analysis Services (SSAS) は、意思決定支援やビジネスアナリティクスで使われる解析エンジンです。ビジネスレポートおよび、Power BI やExcel、 Reporting Services レポート、その他のデータ可視化ツールのようなクライアントアプリケーションに、エンタープライズレベルのセマンティックデータを提供します。Spark 用のCData ADO.NET プロバイダーと合わせれば、Spark を使って、より深く速いデータ分析のためのキューブを作成できます。

この記事では、Analysis Services プロジェクトをVisual Studio で作成し、Spark の多次元モデルを構築および配置する方法を説明します。これには、アクセス可能なSSAS インスタンスと、ADO.NET プロバイダーのインストールが必要です。

Spark 用のJDBC データソースの設定

まず、Visual Studio で新しい多元的なAnalysis Service とデータマイニングプロジェクトを作成します。次に、プロジェクト内でSpark 用のデータソースを作成します。

  1. [Solution Explorer] の[Data Source] を右クリックし、[New Data Source] を選択します。
  2. 既存または新規の接続に基づいて、データソースを作成することを選択し、[New] をクリックします。
  3. [Connection Manager] のSpark 用CData ADO.NET プロバイダーを選択し、必要な接続プロパティに入力後、[Next] をクリックします。

    SparkSQL への接続

    SparkSQL への接続を確立するには以下を指定します。

    • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
    • Port:SparkSQL インスタンスへの接続用のポートに設定。
    • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
    • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

    Databricks への接続

    Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

    • Server:Databricks クラスターのサーバーのホスト名に設定。
    • Port:443
    • TransportMode:HTTP
    • HTTPPath:Databricks クラスターのHTTP パスに設定。
    • UseSSL:True
    • AuthScheme:PLAIN
    • User:'token' に設定。
    • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

    接続を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

    Setting the Connection properties (Salesforce is shown.)
  4. インパーソネーションを[Inherit] に設定し、[Next] をクリックします。 Setting the impersonation method.
  5. データソースに名称(CData Spark Source) を入力し、[Finish] をクリックします。

データソースビューの作成

データソースの次に、データソースビューを作成します。

  1. [Solution Explorer] で[Data Source Views] を右クリックし、[New Data Source View] を選択します。
  2. 先ほど作成したデータソース(CData Spark Source) を選択し、[Next] をクリックします。
  3. 基になるデータソースのパターンに一致する外部キーを選択し、[Next] をクリックします。 Selecting the Foreign key match pattern.
  4. Spark の表を選択、ビューに追加し、[Next] をクリックします。 Selecting Tables (Salesforce is shown).
  5. ビューに名前を付け、[Finish] をクリックします。

スキームに一致する外部キーに基づいて、基礎的なデータとのリレーションが検出されます。[Data Source View] をダブルクリックすることで、これらのリレーションを確認・編集することができます。

Discovered relationships in the data source view (Salesforce is shown).

[Data Source View] へのセカンダリデータソースの追加はサポートされないことに注意してください。複数のデータソースを利用する場合、SSAS は、すべてのソースがADO.NET プロバイダーでは使用できないOpenRowset 経由のリモートクエリをサポートすることを必要とします。

Spark 用のキューブを作成する

プロジェクトを処理してSpark をSSAS に展開するための最後のステップはキューブの作成です。

  1. [Solution Explorer] の[Cubes] を右クリックし、[New Cube] を選択します。
  2. [Use existing tables] を選択し、[Next] をクリックします。
  3. メジャーグループテーブルに使用するテ-ブルを選択し、[Next] をクリックします。 Selecting measure group tables (Salesforce is shown).
  4. キューブに含ませたいメジャーを選択し、[Next] をクリックします。 Selecting measures (Salesforce is shown).
  5. 使用可能なテーブルに基づいて作成するディメンションを選択し、[Next] をクリックします。 Selecting dimensions (Salesforce is shown).
  6. すべての選択内容を確認し、[Finish] をクリックします。

プロジェクトを処理する

データソースと、データソースビュー、キューブを作成すると、SSASにキューブを展開する準備が完了します。ターゲットサーバーとデータベースを構成するために、プロジェクトを右クリックしプロパティを選択します。デプロイメントに移動し、ターゲットセクションでサーバーとデータベースのプロパティを設定します。

Configuring the target server and database.

ターゲットサーバーとデータベースを構成した後、プロジェクトを右クリックして[Process] を選択します。このステップの一部として、プロジェクトの構成・デプロイが必要となる場合があります。プロジェクトを構成・デプロイし、[Process Database]ウィザードにある[Run] をクリックします。

SSAS インスタンスにSpark 用のOLAP キューブが作成され、分析、レポート、表示の準備が完了します。Spark 用のCData ADO.NET プロバイダーの30日の無償評価版をダウンロードして、SSAS データをご利用ください。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。