Spark のデータをSisense でビジュアライズ

Spark にアクセスできるSisense アプリでElastiCube を作成します。

古川えりか
コンテンツスペシャリスト
最終更新日：2022-04-14

CData

こんにちは！ドライバー周りのヘルプドキュメントを担当している古川です。

Sisense を使用すると、データを結合、分析、画像化lし、よりインテリジェントなビジネス決定を行い、効果的な戦略を作成できます。CData JDBC Driver for SparkSQL は、Sisense に簡単に統合して利用することができます。この記事では、Spark に接続するElastiCube の作成方法と、それを使用してSisense のSpark をビジュアライズする方法を説明します。

Spark への接続を構成する

ElastiCube を作成する前に、JDBC Driver のJAR ファイル(通常はC:\Program Files\CDatat\CData JDBC Driver for SparkSQL\lib) のインストール場所をメモするか、jar ファイル(cdata.jdbc.sparksql.SparkSQL.jar) をSisense JDBC driver ディレクトリの新しいフォルダ(通常はC:\ProgramData\Sisense\DataConnectors\jdbcdrivers)にコピーします。

Sisense アプリケーションの［Data］ページで、新しいElastiCube を作成します(または既存のElastiCube を開きます)。
［Model Editor］で［+ Data］をクリックし、［Add Data］ダイアログボックスを開きます。
［Generic JDBC］をクリックし、［JDBC settings］を開きます。
［Connection String］プロパティをSpark のJDBC URL に設定し、必要なプロパティを追加します。
SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。
- Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port：SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server：Databricks クラスターのサーバーのホスト名に設定。
- Port：443
- TransportMode：HTTP
- HTTPPath：Databricks クラスターのHTTP パスに設定。
- UseSSL：True
- AuthScheme：PLAIN
- User：'token' に設定。
- Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。
ビルトイン接続文字列デザイナ

JDBC URL の構成については、Spark JDBC Driver に組み込まれている接続文字列デザイナを使用してください。JAR ファイルのダブルクリック、またはコマンドラインからJAR ファイルを実行します。
java -jar cdata.jdbc.sparksql.jar
接続プロパティを入力し、接続文字列をクリップボードにコピーします。

JDBC URL を構成する際に、Max Rows プロパティを定めることも可能です。これによって戻される行数を制限するため、可視化・レポートのデザイン設計時のパフォーマンスを向上させるのに役立ちます。

以下は一般的な例です。
jdbc:sparksql:Server=127.0.0.1;
JDBC JAR フォルダプロパティをCData JDBC Driver JAR ファイルの場所に設定します(上記を参照)。
ドライバーのクラス名をJDBC Driver のクラス名( cdata.jdbc.sparksql.SparkSQLDriver) に設定します。
ユーザー名とパスワードのプロパティは空欄にします。
［Next］をクリックします。