製品をチェック

Apache Spark ODBC Driver の30日間無償トライアルをダウンロード

 30日間の無償トライアルへ

製品の詳細

Apache Spark アイコン Apache Spark ODBC Driver 相談したい

Apache Spark ODBC Driver は、ODBC 接続をサポートするさまざまなアプリケーションからApache Spark データへの接続を実現するパワフルなツールです。

標準SQL とSpark SQL をマッピングして、SQL-92 で直接Apache Spark にアクセス。

Mac OS X 上のMS Excel でSpark のデータを連携利用

iODBC でCData ODBC Driver のDSN を作成し、Mac OS X 上のMicrosoft Excel でSpark に連携。

古川えりか
コンテンツスペシャリスト

最終更新日:2022-01-15

こんにちは!ドライバー周りのヘルプドキュメントを担当している古川です。

Microsoft Excel は、データの入力、集計、グラフ表示、ピボットテーブル、マクロプログラミング言語など多様な機能により、Windows、Mac マシンを問わずビジネスユーザーに愛用されているアプリケーションです。 本記事では、iODBC でのSpark DSN の作成方法と、Mac OS X で起動するMicrosoft Excel からのSparkの連携利用について説明します。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Spark をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにSpark のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてSpark の接続を設定、2.Excel 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

Mac OS X へのCData ODBC ドライバのインストール

まずは、本記事右側のサイドバーからSparkSQL ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

CData ODBC Driver for SparkSQL は、iODBC Driver マネージャに事前設定されているので、簡単に多くのツールから簡単に使うことができます。

iODBC のDSN の作成

ODBC Driver for SparkSQL をインストールすると、iODBC Driver マネージャに登録されます。iODBC Administrator でDSN の接続プロパティを入力する必要があります。 ドライバーのインストールで自動的にシステムDSN が作成されます。システムDSN はすべてのユーザーからアクセスできます。一方、ユーザーDSN はそのユーザーからしかアクセスできません。 ただし、システムDSN の設定には権限が必要です。

  1. ターミナルを開き、次のコマンドを入力して正しい権限でAdministrator を開きます: sudo /Applications/iODBC/iODBC\ Administrator.app/Contents/MacOS/iODBC\ Administrator
  2. System タブでCData SparkSQL データソースを開きます。
  3. Add ボタンをクリックし、key-value ペアの形で接続プロパティを入力します。

SparkSQL への接続

SparkSQL への接続を確立するには以下を指定します。

  • Server:SparkSQL をホストするサーバーのホスト名またはIP アドレスに設定。
  • Port:SparkSQL インスタンスへの接続用のポートに設定。
  • TransportMode:SparkSQL サーバーとの通信に使用するトランスポートモード。有効な入力値は、BINARY およびHTTP です。デフォルトではBINARY が選択されます。
  • AuthScheme:使用される認証スキーム。有効な入力値はPLAIN、LDAP、NOSASL、およびKERBEROS です。デフォルトではPLAIN が選択されます。

Databricks への接続

Databricks クラスターに接続するには、以下の説明に従ってプロパティを設定します。Note:必要な値は、「クラスター」に移動して目的のクラスターを選択し、 「Advanced Options」の下にある「JDBC/ODBC」タブを選択することで、Databricks インスタンスで見つけることができます。

  • Server:Databricks クラスターのサーバーのホスト名に設定。
  • Port:443
  • TransportMode:HTTP
  • HTTPPath:Databricks クラスターのHTTP パスに設定。
  • UseSSL:True
  • AuthScheme:PLAIN
  • User:'token' に設定。
  • Password:パーソナルアクセストークンに設定(値は、Databricks インスタンスの「ユーザー設定」ページに移動して「アクセストークン」タブを選択することで取得できます)。

The iODBC ODBC Administrator (Salesforce is shown.)

OAuth での認証の場合、OAuth フローが正しく実行されるためにDSN に追加でkey-value ペアを入力します:

Keyword  Value
OtherCheckPromptMode=False

Microsoft Excel からSpark のデータにアクセス

上のステップで設定されたDSN を使って、Microsoft Excel からSpark のデータにアクセスができます。

  1. Microsoft Excel を開き、スプレッドシートを開きます。
  2. データリボンの[データベース]から[新しいクエリ]を選択します。
  3. 上のステップで設定したユーザーもしくはシステムDSN を選択して、OK を押します。 Choosing the DSN (Salesforce is shown.)
  4. Microsoft Query ウィザードでクエリを作成します: Querying for data (Salesforce is shown.)
  5. [Return Data]をクリックして、クエリを実行して、Excel にデータを取得します。
  6. Data in Excel (Salesforce is shown.)

おわりに

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

関連コンテンツ

トライアル・お問い合わせ

30日間無償トライアルで、CData のリアルタイムデータ連携をフルにお試しいただけます。記事や製品についてのご質問があればお気軽にお問い合わせください。