製品

ソリューション

コネクタ

サポート

価格

企業情報

事例

ブログ

検索お問い合わせ

製品をチェック

Apache Spark Driver の30日間無償トライアルをダウンロード

30日間の無償トライアルへ

製品の詳細

Apache Spark JDBC Driver 相談したい

Apache Spark 連携のパワフルなJava アプリケーションを素早く作成して配布。

Spark データをDataSpider Servista の連携先として使う方法

CData JDBC ドライバを使って、データ連携ツールのDataSpider Servista からSpark データを連携利用する方法を解説。

杉本和也
リードエンジニア
最終更新日：2023-09-07

CData

こんにちは！リードエンジニアの杉本です。

DataSpider Servista は、異なるシステムのデータやアプリケーションをノンプログラミングで「つなぐ」データインテグレーションプラットフォームです。

CData JDBC ドライバはDataSpider Servista において、JDBC データソースとして利用することが可能です。通常のJDBC の検索・更新などのアイコンを使って、標準SQL でSaaS/Web DB のデータを扱うことを可能にします。この記事では、DataSpider で CData JDBC Driverを利用してSpark データに外部データとしてSQL でアクセスする方法を紹介します。

CData JDBC Driver for SparkSQL をDataSpider にコネクタとして登録

JDBC Driver をDataSpider と同じサーバーにインストール
DataSpider の外部JDBCドライバのパスにCData JDBC ドライバのcdata.jdbc.sparksql.jar とcdata.jdbc.sparksql.lic を配置
DataSpider 側：DataSpiderServista\server\plugin\data_processing\modules\jdbc_adapter

グローバルリソースのプロパティで、ドライバクラス名およびURL を入力。
- 接続名：任意
- 種別：デフォルト
- 接続タイプ：接続タイプ：JDBC（JDBC接続設定）
- ドライバクラス名：cdata.jdbc.sparksql.SparkSQLDriver
- URL：jdbc:sparksql:Server=127.0.0.1;
SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。
- Server：SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
- Port：SparkSQL インスタンスへの接続用のポートに設定。
- TransportMode：SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
- AuthScheme：使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。
Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note：必要な値は、「クラスター」に移動して目的のクラスターを選択し、「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。
- Server：Databricks クラスターのサーバーのホスト名に設定。
- Port：443
- TransportMode：HTTP
- HTTPPath：Databricks クラスターのHTTP パスに設定。
- UseSSL：True
- AuthScheme：PLAIN
- User：'token' に設定。
- Password：パーソナルアクセストークンに設定（値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます）。

DataSpider でSpark データを連携利用する

あとは通常のRDB コンポーネントのように、Spark データを扱うことが可能です。ツールパレットのJDBC からSQL 実行やストアドプロシージャ実行コンポーネントが使用できます。

例えばSpark データの取得であれば、検索系SQL実行処理を使って、SELECT 文でSpark データを抽出することができます。

このようにCData JDBC ドライバを使って、簡単にDataSpider でSpark データデータをノーコードで連携利用することができます。

CData JDBC Driver for SparkSQL 30日の無償評価版をダウンロードして、お試しください。

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。

無償トライアルへ

お問い合わせ

CData Software は、データアクセスおよびデータ接続ソリューションのリーディングプロバイダーです。CData の標準コネクタはあらゆるツール・ミドルウェアからのSaaS やDB データの連携を簡単にします。

お問い合わせ

製品概要

データコネクタ

ETL / ELT ソリューション

クラウド & API 接続

OEM & カスタムドライバー開発

お問い合わせ先

製品を知る

データ分析 & BI

企業情報

ニュース & 事例

ソリューション

サポート

ブログへ →

ナレッジベース

製品をチェック

目次

Spark データをDataSpider Servista の連携先として使う方法

CData JDBC ドライバを使って、データ連携ツールのDataSpider Servista からSpark データを連携利用する方法を解説。

CData JDBC Driver for SparkSQL をDataSpider にコネクタとして登録

SparkSQL への接続

Databricks への接続

DataSpider でSpark データを連携利用する

関連コンテンツ

トライアル・お問い合わせ